Vous êtes sur la page 1sur 82

Statistique Déscriptive

Dr. Najoua Essamaoui

Institut des Mines de Marrakech


02 Février 2021

1/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 1 / 70
Introduction

1 Introduction

2 Vocabulaire

3 Etude d’une variable statistique discrète

4 Etude d’une variable statistique continue

2/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 2 / 70
Introduction

Intrduction

La statistique repose sur l’observation de phénomènes concrets et utilise les


probabiltés comme outils d’anayse et de généralisation.
Les données étudiées dans la statistique peuvent être de toute nature, ce qui rend
la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est
enseignée dans toutes les filières universitaires. Les statistiques sont aujourd’hui
utilisées dans tous les secteurs d’activité :
Industrie
Economie et finance
Santé
Biologie
Partout où l’on dispose de données.

3/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 3 / 70
Introduction

Introduction

Il y a deux types de statistiques :


1 Statistique Descriptive : elle permet de résumer l’information contenue dans
les données de façon synthétique et efficace par :
I Représentation numérique ou graphiques
I Calcul d’indicateurs de position et de dispersion.

4/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 4 / 70
Introduction

Introduction

Il y a deux types de statistiques :


1 Statistique Descriptive : elle permet de résumer l’information contenue dans
les données de façon synthétique et efficace par :
I Représentation numérique ou graphiques
I Calcul d’indicateurs de position et de dispersion.
2 Statistique inférentielle : elle utilise un échantillon aléatoire de données d’une
population affin de décrire cette dernière et de faire des déductions à son
sujet au vu des observation par :
I Estimation paramétrique
I Intervalles de confiance, tests d’hypothèse

4/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 4 / 70
Introduction

Introduction

Il y a deux types de statistiques :


1 Statistique Descriptive : elle permet de résumer l’information contenue dans
les données de façon synthétique et efficace par :
I Représentation numérique ou graphiques
I Calcul d’indicateurs de position et de dispersion.
2 Statistique inférentielle : elle utilise un échantillon aléatoire de données d’une
population affin de décrire cette dernière et de faire des déductions à son
sujet au vu des observation par :
I Estimation paramétrique
I Intervalles de confiance, tests d’hypothèse
Les statistiques inférentielles sont pertinentes lorsqu’il est difficile ou
impossible d’examiner chaque membre d’une population entière. Per ex : il
n’est pas pratique de mesurer le diamètre de chaque clou fabriqué dans une
usine, mais on peut mesurer les diamètres d’un echantillon de clous aléatoire
representatif et utiliser ces informations pour tirer des conclusions générales
sur les diamètres de tous les clous fabriqués.
4/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 4 / 70
Vocabulaire

1 Introduction

2 Vocabulaire

3 Etude d’une variable statistique discrète

4 Etude d’une variable statistique continue

5/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 5 / 70
Vocabulaire

Vocabulaire

Population : L’ensemble sur lequel porte l’étude statistique. Cet ensemble est
noté Ω. (Ω peut être un ensemble de personnes, de choses, d’animaux, etc...
)
I Exemple : On considère l’ensemble des étudiants d’une filière X . On s’intéresse
à la note finale de chaque étudiant pour le module de Mathématiques.

Ω = ensemble des étudiants

Individu (ou unité statistique) : Tout élément de la population Ω, il est noté


en général ω.

6/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 6 / 70
Vocabulaire

Vocabulaire

Echantillon : Une sous partie de la population.


Caractère (variable statistique) : Propriété étudiée dans la population.
I Exemple : Taille, nationalité, couleur de cheveux, température, catégorie
professionelle...
Modalités : les différentes valeurs que peut prendre un caractère.
I Exemple : on étudie la situation familiale d’une population. Les modalités sont
alors :"célibataire, marié, divorcé"

7/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 7 / 70
Vocabulaire

Notations

Les notations suivantes sont les plus utilisées dans la statistique descriptive :
n : désigne la taille d’un échantillon.
xi ou mi : désigne la i-ème modalité.
ni : désigne le nombre d’occurence de la modalité xi
fi : désigne la fréquence de la modalité xi .
N : désigne l’effectif total.

8/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 8 / 70
Vocabulaire

Types de caractères

Caractère qualitatif : Les caractères qualtatifs sont ceux dont les modalités ne
peuvent pas être ordonnées, c-à-d que si l’on considère deux modalités pris au
hasard, on ne peut pas dire que l’une est inférieure ou égale à l’autre.

Exemple : Couleurs des yeux d’une population, on peut considérer les modalités
suivantes :
Noir
Marron
Vert
bleu

9/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 9 / 70
Vocabulaire

Types de caractères

Caractère quantitatif : Les caractères quantiatifs sont des caractères dont les
modalités peuvent être ordonnées, (Mesures phisyques, chiffre d’affaire..). Il y a
deux types de caractères quantitatifs :
Caractère quantitatif discret : Il ne peut prendre qu’un nombre fini de valeurs
numériques.
I Exemple : Nombre d’enfants par famille ..
Caractère quantitatif continu : Lorsqu’il peut prendre toutes les valeurs d’un
intervalle.
I Exemple : taille , poids...

10/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 10 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie.

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types.

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue.

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités.

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités. Vrai

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités. Vrai
5 La variable statistique "taille d’une population" est une variable qualitative.

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités. Vrai
5 La variable statistique "taille d’une population" est une variable qualitative.
Faux

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités. Vrai
5 La variable statistique "taille d’une population" est une variable qualitative.
Faux
6 Pour une variable qualitative, chaque individu statistique ne peut avoir
qu’une seule modalité .

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Vocabulaire

Exercice

Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1 On appelle variable, une caractéristique que l’on étudie. Vrai
2 En statistiques on classe les variables selon différents types. Vrai
3 La variable statistique "nombre de maisons vendues par quartier" est une
variable continue. Faux
4 Les valeurs des variables sont aussi appelées modalités. Vrai
5 La variable statistique "taille d’une population" est une variable qualitative.
Faux
6 Pour une variable qualitative, chaque individu statistique ne peut avoir
qu’une seule modalité . Vrai

11/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 11 / 70
Etude d’une variable statistique discrète

1 Introduction

2 Vocabulaire

3 Etude d’une variable statistique discrète


Effectif partiel-effectif cumulé
Fréquence partielle-Fréquence cumulée
Représentation graphique des séries statistiques
Paramètres de position
Paramètres de dispersion

4 Etude d’une variable statistique continue

12/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 12 / 70
Etude d’une variable statistique discrète

Etude d’une variable statistique discrète

Définition : On appelle série statistique la donnée simultanée (dans un tableau)


des valeurs de caractère étudié xi , rangées dans l’ordre croissant, et des effectifs ni
de ces valeurs.

Exemple : Les notes obtenues lors d’un examen de mathématiques dans une classe
de bac sont les suivantes :

10, 8, 11, 9, 12, 10, 8, 10, 7, 9, 10, 11, 12, 10, 8, 9, 10, 9, 10, 11

La série statistique définie par les effectifs est donnée dans le tableau suivant :

Nous avons :
Ω : la classe ω : un élève N = 20
13/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 13 / 70
Etude d’une variable statistique discrète Effectif partiel-effectif cumulé

Effectif partiel

Définition : Pour chaque valeur xi , ni : le nombre d’individus qui ont le même xi ,


ça s’appelle effectif partiel de xi .

Dans l’exemple précédent, 7 étudiant qui ont la moyenne.

14/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 14 / 70
Etude d’une variable statistique discrète Effectif partiel-effectif cumulé

Effectif cumulé

Pour chaque valeur xi , on pose par définition


Ni = n1 + n2 + · · · + ni
L’effectif cumulé Ni d’une valeur est la somme de l’effectif de cette valeur et de
tous les effectifs des valeurs qui précèdent.

Exemple :

4 est le nombre d’étudiants ayant eu une note inférieure ou égale à 8.

Interprétation : Ni est le nombre d’individus dans la valleur du caractère est


inférieur ou égale à xi . L’effectif total est donné par
n
X
N = Card(Ω) = ni
i=1 15/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 15 / 70
Etude d’une variable statistique discrète Fréquence partielle-Fréquence cumulée

Fréquence partielle

Définition : Pour chaque valeur xi , on pose par définition


ni
fi =
N
fi s’appelle la fréquence partielle de xi . La fréquence d’une valeur et le rapport de
l’effectif de cette valeur par l’effectif total, et elle est toujours comprise entre 0 et
1. On peut aussi remplacer fi par fi × 100 qui représente alors un pourcentage.

Exemple : Dans l’exemple précédent, la série statistique définie par les fréquences
en pourcentage est la suivante :

Il y a 15% d’étudiants qui ont eu la note 9.


16/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 16 / 70
Etude d’une variable statistique discrète Fréquence partielle-Fréquence cumulée

Fréquence cumulée

Définition : Pour chaque valeur xi , on pose par définition :

Fi = f1 + f2 + · · · + fi

La quantité Fi s’appelle la fréquence cumulée de xi .

Exemple : On s’intéresse aux nombres d’erreurs d’assemblage sur un ensemble


d’appareils.
Nombre d’erreurs (xi ) 0 1 2 3 4 5
Nombre d’appareils (ni ) 101 140 92 42 18 3
Fréquences cumulées (Fi ) 0.26 0.61 0.84 0.94 0.99 1

Nous avons 84% des appareils qui ont un nombre d’erreurs d’assemblage inférieur
ou égale à 2.

17/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 17 / 70
Etude d’une variable statistique discrète Représentation graphique des séries statistiques

Représentation graphique

Dans la section précédente nous avons vu que les tableaux sont très utiles ils nous
permettent de classifier et de présenter de manière clair les données d’une
population statistique. Dans cette section nous allons voir comment traduire ces
tableaux en graphique permettant aussi de résumer d’une manière visuelle les
données.

Pour les caractères quantitatifs discrets, on utilise le diagramme en bâton :


Le diagramme en bâtons se construit avec la modalités en abscisse et les
effectifs en ordonnée.

18/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 18 / 70
Etude d’une variable statistique discrète Représentation graphique des séries statistiques

Exemple

L’exemple des notes

19/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 19 / 70
Etude d’une variable statistique discrète Paramètres de position

Paramètres de position : Moyenne

Les indicateurs statistiques (aident a comprendre le phénomène étudié) considérés


fréquemment sont la moyenne, la médiane et le mode.

La moyenne : On appelle moyenne d’une série statistique d’effectif total N, le réel


n
n1 x1 + n2 x2 + · · · + nk xk X
x̄ = = fi xi
N i=1

On peut alors calculer la moyenne avec des effectifs ou avec des fréquences.

20/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 20 / 70
Etude d’une variable statistique discrète Paramètres de position

Exemple

On reprends toujours l’exemple des notes

7 + 24 + 36 + 70 + 33 + 24
x̄ = = 9.7
20
Nous avons donc au moyenne un étudiant de la classe a eu 9,7.

21/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 21 / 70
Etude d’une variable statistique discrète Paramètres de position

Moyenne

Propriété : Si une population d’effectif N est composée d’une partie d’effectif N1


et de moyenne x¯1 et d’une autre partie d’effectif N2 et moyenne x¯2 , alors la
moyenne x̄ de la population totale est telle que :
N1 x¯1 + N2 x¯2
x̄ =
N
Exemple : Si dans une classe, les 12 garçon mesurent en moyenne 182cm et si les
19 filles mesurent en moyenne 168cm, alors la taille moyenne d’un élève de cette
classe est égale à
12 × 182 + 19 × 168
= 173
12 + 19

22/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 22 / 70
Etude d’une variable statistique discrète Paramètres de position

Paramètres de position : Médiane

Médiane : C’est une valeur qui partage la population en deux parties de même
effectif. De façon plus précise, on appelle médiane d’une série statistique discrète
toute valeur M du caractère telle qu’au moins 50% des individus aient une valeur
du caractère inférieure ou égale à M et au moins 50% des individus aient une
valeur du caractère supérieure ou égale à M. On peut dire que la médiane est le
point milieu de la population, qu’elle divise en deux moitiés.

Recherche pratique de la médiane :


On range les valeurs du caractère (les modalités) une par une dans l’ordre
croissant (chaque valeur du caractère doit apparaître au nombre de fois égal à
l’effectif correspondant ).
Si l’effectif total est impair, la médiane M est la valeur du caractère situé au
milieu.
Si l’effectif total est pair, la médiane M est la demi-somme des 2 valeurs
situées au milieu.
23/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 23 / 70
Etude d’une variable statistique discrète Paramètres de position

Exemple

On considère la série statistique suivante :

Liste des valeurs du caractère :

7, 7, 8, 9, 10, 11, 11, 14, 16, 16

On a l’effectif total, N = 10, est pair la médiane M est la demi-somme des deux
valeurs situées au milieu. D’où
10 + 11
M= = 10.5
2

24/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 24 / 70
Etude d’une variable statistique discrète Paramètres de position

Paramètre de position : Le mode

Définition : Le mode d’une variable statistique qui a le plus grand effectif partiel
(ou la plus grande fréquence partielle) et il noté par M0 .

Exemple : Dans l’exemple des notes, le mode est égal à 10 qui correspond au plus
grand effectif.

Remarque : On peut avoir plus d’un mode. 25/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 25 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Paramètres de dispersion

Les paramètres de dispersion permettent de mesurer la façon dont les valauers du


caractère sont réparties autour de la moyenne et de la médiane. Ces paramètres
complètent l’information apportée par les paramètres de position. Les indicateurs
statistiques de dispersion usuels sont l’étendue, la variance et l’écart-type.

L’étendue : La différence entre la plus grande valeur et la plus petite valeur du


caractère, elle est donnée par la quantité

e = xmax − xmin

e s’appelle l’étendue de la variable statistique. Il donne un première idée de la


dispersion des obseravations.

26/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 26 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exemple

L’étendue des notes données par le professeur X est de (14 − 8) = 6, ce qui


signifie que l’écart maximum entre deux notes du professeur X est de 6.
L’étendue des notes données par le professeur Y est de (20 − 0) = 20 ce qui
signifie que l’écart maximum entre deux notes du prof Y est de 20
La dispersion des notes du prof Y est donc beaucoup plus forte que celle des
notes du professeur X .

Conclusion : L’étendue est un paramètre de dispersion absolue qui est simple à


calculer mais très fragile puisqu’il ne dépend que de deux valeurs de la distribution.

27/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 27 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Paramètre de dispersion : La variance

Définition :On appelle variance d’une série statistique le nombre


n n
1 X X
V = ni (xi − x̄ )2 = fi (xi − x̄ )2
N i=1 i=1

Le théorème suivant donne une identité remarquable reliant la variance et la


moyenne, parfois plus pratique dans le calcul de la variance.

Théorème : Soit (xi , ni ) une série statistique de moyenne x̄ et de variance V . Alors


n
X
V = fi xi2 − x̄ 2
i=1

Démonstration : Exercice.

28/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 28 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Paramètre de dispersion : L’écart type

Définition : L’écart type de la série statistique est définie par :



σ= V

Remarque : Le paramètre σ mesure la dispersion d’une série statistique autour de


sa moyenne.
Plus il est petit, plus les caractères sont concentrés autour de la moyenne (on
dit que la série est homogène).
Plus il est grand, plus les caractères sont dispersés autour de la moyenne (on
dit que la série est hétérogène).

29/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 29 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 1

On considère deux groupes d’étudiants. Nous relevons leurs notes d’examens dans
les tableux suivants :
Note (Gr.A) 9 10 11 12
Effectif 2 1 2 1

Note (Gr.B) 3 8 11 12 17
Effectif 2 2 2 1 2
Calculer la moyenne et l’écart type de chaque groupe. Comparer les deux groupes.

30/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 30 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

Pour le groupe A on a :
N=6
x¯A = 10.33
σA = 1.14
Pour le groupe B on a :
N=9
x¯B = 10
σB = 4.8
On remarque que même si les deux groupes ont des moyennes presque identiques,
le groupe B est beaucoup plus dispersé que le groupe A, car σB > σA . Les
étudiants du groupe B ont des notes plus irréguliers. On peut dire donc que le
groupe est moins homogène que le groupe A. Si on observe les valeurs du tableau,
on voit que c’est vraiment cohérent.

31/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 31 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 2

Dans un magasin de prêt à porter, le responsable a demandé le nombre de ventes


par jour d’un article spécial pour les mois de Juin et Juillet. Le relevé se présente
comme suit :

7, 13, 8, 10, 9, 12, 10, 8, 9, 10, 6, 14, 7, 15, 9, 11, 12, 11, 12, 5, 14, 11, 8, 10, 14, 12, 8

5, 7, 13, 12, 16, 11, 9, 11, 11, 12, 12, 15, 14, 5, 14, 9, 9, 14, 13, 11, 10, 11, 12, 9, 15

1 Donner le type de la variable statistique étudiée.


2 Déterminer les effectifs, les fréquences, les effectifs cumulés et les fréquences
cumulés dans un tableau.
3 Tracer le diagramme des bâtons associé à cette variable statistique.
4 Calculer le mode et la moyenne
5 Déterminer la médiane.
6 Calculer la variance et l’écart type.
32/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 32 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1. La population est les 52 jours, et la variable statistique étudiée est le nombre


d’articles vendus par jour. Son type est bien évidemment quantitatif discret.

33/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 33 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1. La population est les 52 jours, et la variable statistique étudiée est le nombre


d’articles vendus par jour. Son type est bien évidemment quantitatif discret.
2. Le tableau statistique est donné par :

33/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 33 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

34/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 34 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

3. Le diagramme des batônns associé à cette variable statistique est :

35/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 35 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

4. Le mode est la valeur de la variable qui a le plus grand effectif, c’est-a-dire


ni =, et par suite :
M0 = 11 et M0 = 12
La moyenne est donnée par :
12
X
x̄ = fi xi = 10.67
i=1

5. La médiane est la valeur de la variable qui divise la population en deux partie


égales. Nour trouvons
M = 11
6.On commence tout d’abord par calculer la variance, on trouve
n
1 X
V = ni xi2 − x̄ 2 = 7.64
N i=1

par conséquent,
σ = 2.76
36/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 36 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 3

Un indistruel a commandé à un sous-traitant un lot de 40 pièces dont le diamètre


doit mesurer 80 mm et il est convenu que le lot ne sera accepté que si les deux
conditions suivantes sont simultanément réalisées :
1 l’ecart entre 80mm et la moyenne x̄ du lot est inférieur à 0.05
2 Au moins 60% des pièces du lot on un diamètre d tel que

80 − 0.05 ≤ d ≤ 80 + 0.05

Les mesures faites sur le lot sont les suivantes :


d 79.75 79.80 79.85 79.90 79.95 80 80.05 80.10 80.15 80.20
ni 1 2 3 5 6 14 5 2 1 1
1 Calculer la moyenne x̄ des mesures faites
2 Quel est le pourcentage de pièces dont le diamètre d vérifie l’inégalité de la
deuxième condition ?
3 Le lot est-il accepté ou refusé par l’industriel ? Justifier la réponse.
37/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 37 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1 La moyenne de ces mesures est :

x̄ = 97.97

2 Le nombre de pièces dont le diamètre d vérifie l’inégalité de la deuxième


condition est :
6 + 14 + 5 = 25
le pourcentage est alors
25 × 100
62.5%
40
3 On doit verifier les deux conditions. On a l’écart entre x̄ et 80mm égal à

80 − 79.97 = 0.03 < 0.05

et d’après la question précédente la deuxième condition est vérifiée, et donc le


lot sera accepté.
38/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 38 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 4

Un groupe est constitué de trois sous-groupes


Dans le premier sous-goupe il y a 40 personnes dont la taille moyenne est de
170cm.
Le deuxième sous-groupe est de 10 personne dont la taille moyenne est de
180cm
Le troixième sous-groupe est de 50 personnes dont la taille moyenne est de
175cm
1 Déterminer la taille moyenne du groupe constitué par ces trois sous-groupes.
2 Quelle serait la taille moyenne si les trois sous-groupes étaient constitué du
même nombre de personnes ?

39/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 39 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1 La moyenne du groupe est :


40 × 170 + 10 × 180 + 50 × 175
= 173.5cm
40 + 10 + 50
2 Si les trois sous-groupes étaient constitué du même nombre de personne, la
moyenne vaudra
170 + 180 + 175
= 175cm
3

40/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 40 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 5

La répartition du nombre d’enfants chez 18 familles tirées d’une population urbaine

Nombre d’enfants 0 1 2 3 4 et plus


Nombre de familles 6 4 5 2 1

1 Quel est le nombre moyen d’enfants ?


2 Quel en pourcentage, la fréquence de familles qui n’ont pas d’enfants ?
3 Calculer la varance et l’écart-type de cette variabale statistique
4 Quel est le nombre de famille qui ont au moins un enfant ?
5 Tracer le diagramme en bâtons de cette variable.

41/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 41 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1 On a :
x̄ = 1.33
2 La fréquence de familles qui n’ont aps d’enfants est
6 × 100
f0 =
18
3 La variance est :
V = 1.44 et σ = 1.2
4 Le nombre de familles qui on au moins un enfant est : 12

42/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 42 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Exercice 6

Un quartier résidentiel comprend 99 unités d’habitation ayant une valeur locative


moyenne de 1000 $ et une valeur locative médiane de 900 $. Deux nouvelles
unités d’habitation sont construites dans le quartier : l’une a une valeur locative
de 700 $ et l’autre, une villa luxueuse, a une valeur locative de 11400 $.
1 Quelles sont les nouvelles moyennes et médiane de valeur locative pour le
quartier ?
2 Pouvait-on s’attendre à de tels résulats ?

43/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 43 / 70
Etude d’une variable statistique discrète Paramètres de dispersion

Correction

1 Le nouveau total des mesures de valeur locative est

99 × 1000 + 700 + 11400 = 111100

Le nouveau total d’individus est 101. La nouvelle moyenne est donc 1100.
Dautre art on a
700 < 900 < 11400
et donc la nouvelle médiane est égale à 900.
2 On pouvait s’attendre à une augmentation de la moyenne car l’une des deux
nouvelles valeurs est très nettement au dessus de la moyenne initiale. Pour la
médiane, on rajoute autant de valeurs de part et d’autre de la médiane
initiale, donc elle reste inchangée.

44/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 44 / 70
Etude d’une variable statistique continue

1 Introduction

2 Vocabulaire

3 Etude d’une variable statistique discrète

4 Etude d’une variable statistique continue


Représentation graphique d’un caractère continu
Paramètres de tendance central
Paramètres de dispersion

45/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 45 / 70
Etude d’une variable statistique continue

Variable quantitative continue

Définition : Les cractères continus sont les caractères qui ont une infinité de
modalités.

Exemple : Soit Ω l’ensemble des nouveaux nés dans une clinique . Nous désignons
par X le poids des nouveaux nés. On suppose que

xmin = 2.720 et xmax = 5.023

ALors on remarque que cette variable statistique prend une infinité de valeurs.

46/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 46 / 70
Etude d’une variable statistique continue

Question : Comment étudier alors ce caractère ?

47/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 47 / 70
Etude d’une variable statistique continue

Question : Comment étudier alors ce caractère ?

Réponse : Partager les valeurs prises par cette variable statistique en classe de
valeurs.

47/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 47 / 70
Etude d’une variable statistique continue

Classe de valeurs

Définition : On appelle classe de valeurs de X un intervalle de type [a, b[ tel que


les valeurs du caractère sont dans la classe [a, b[.

Dès qu’un caractère est identifié en tant que continu, ces modalités
Ck = [Lk , Lk+1 [ sont des intervalles avec
Lk : borne inférieure
Lk+1 : borne supérieure
ak = Lk+1 − Lk : son amplitude (pas ou sa longueur).
Lk+1 +Lk
Ck = xk = 2 : son centre

48/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 48 / 70
Etude d’une variable statistique continue

Nombre de classes

Question : En combien de classes partageons-nous les valeurs ?

49/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 49 / 70
Etude d’une variable statistique continue

Nombre de classes

Question : En combien de classes partageons-nous les valeurs ?

Nous pouvons considérer trois réponses, soit N l’effectif total :


√ √ √
1 k ' N ou [ N] ou encore [ N] + 1.
2 La formule de Sturge
k = 1 + 3.3log10 (N)
3 La formule de Yule √
4
k = 2.4 × N

49/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 49 / 70
Etude d’une variable statistique continue

Nombre de classes

Exemple : Si par exemple N = 30, le nombre de classes est donné par :



30 = 5.47 ' 6
La formule de Sturge
k = 1 + 3.3log10 (30) ' 6
La formule de Yule
1
k = 2.5 × 30 4 ' 6

50/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 50 / 70
Etude d’une variable statistique continue

Pas ou la longueur de la classe

Définition : Le nombre
e = xmax − xmin
s’appelle étendu de X . Dans ce cas, on peut définir le pas par
étendu xmax − xmin
a= =
nombre de classes k

51/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 51 / 70
Etude d’une variable statistique continue

Effectif et fréquence d’une classe

Définition :
L’effectif partiel ni d’une valeur Ci est le nombre d’individus qui prennent des
valeurs dans Ci .
La fréquence partielle de Ci est définie par :
ni
fi =
N

52/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 52 / 70
Etude d’une variable statistique continue Représentation graphique d’un caractère continu

Histogramme des fréquences (ou effectifs)

L’histogramme des effectids (respectivement des fréquences) de la distribution


statisqtiues s’obtient en traçant sur un repère orthonormé, pour tout i, un
rectangle de base la longueur du segment [xi , xi+1 [ et de hauteur égale à l’effectif
ou la fréquence de cette classe.
Sur l’axe des abscisses on représente les bornes des classes de la variable, alors que
sur l’axe des ordonnées on représente les effectifs ou les fréquences.

53/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 53 / 70
Etude d’une variable statistique continue Représentation graphique d’un caractère continu

Récapitulatif

Pour dresser le tableau de distribution d’une variable statistique continue, on suit


les étapes suivantes :
1 Détermine k le nombre de casses à considérer dans l’étude.
2 Calculer l’étendue e = xmax − xmin
3 Diviser l’étendue e âr k le nombre de classes, pour avoir une idée sur la
valeur de l’amplitude des classes qu’on note a.
4 On construit alors les classes

[xmin , xmin + a[, [xmin + a, xmin + 2a[, . . . , [xmin (p − 1)a, xmin + pa[

5 S’assurer que chaque observation appartient à une et une seule classe.

54/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 54 / 70
Etude d’une variable statistique continue Représentation graphique d’un caractère continu

Exemple

Etude de la consommation aux 100km de 20 voitures d’un nouveau modèle :

6.11, 6.05, 5.98, 5.77, 5.18, 5.66, 5.28, 5.11, 5.58

5.49, 5.62, 5.33, 5.55, 5.45, 5.76, 5.23, 5.57, 5.52, 5.8, 6.0

Par la méthode de sturge on a k = 1 + 3.3 × log10 (20) = 5.293



Par la méthode de Yule k = 2.5 × 4 20 = 5.287
D’où le nombre de classes est k = 5
e = xmax − xmin = 6.11 − 5.11 = 1
e 1
a= k = 5 = 0.2

55/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 55 / 70
Etude d’une variable statistique continue Représentation graphique d’un caractère continu

Exemple

Le tableau de distribution de cette variable statistique est :

56/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 56 / 70
Etude d’une variable statistique continue Représentation graphique d’un caractère continu

Exemple

L’histogramme des fréquences de la distribution de cette variable statistique est :

57/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 57 / 70
Etude d’une variable statistique continue Paramètres de tendance central

Paramètres de tendance central ( paramètres de position)

On note par Ci le centre de la classe et fi la fréquence partielle de Ci .

La moyenne

Définition :La quantité


n
X
x̄ = fi Ci
i=1

s’appelle la moyenne de X .

58/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 58 / 70
Etude d’une variable statistique continue Paramètres de tendance central

Le mode

Définition : Nous définissons la classe modale comme étant la classe des valeurs
qui a le plus grand effectif partiel (ou la plus grande fréquence partielle). La
quantité
δ1
M0 = Li + ai
δ1 + δ2
s’appelle le mode.
Li : La borne inférieure de la classe modale
a : Le pas de la classe
δ1 = n0 − n1 , δ2 = n0 − n2 ou bien δ1 = f0 − f1 , δ2 = f0 − f2
n0 et f0 sont l’effectif et la fréquence associés à la classe modale
n1 et f1 sont l’efectif et la fréquence de la classe qui précède la classe modale
n2 et f2 sont l’effectif et la fréquence de classe qui suit la classe modale

59/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 59 / 70
Etude d’une variable statistique continue Paramètres de tendance central

60/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 60 / 70
Etude d’une variable statistique continue Paramètres de tendance central

Médiane

La médiane

Pour déterminer la médiane on détermine tout d’abord la classe médiane, ensuite


on la détermine à partir d’une interpolation linéaire.
Soit le tableau statistique suivant :

61/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 61 / 70
Etude d’une variable statistique continue Paramètres de tendance central

Médiane

Utilisons la colonne des effectifs cumulés pour déterminer la médiane, il ya 50


notes, 50% de l’effectif total c’est 25, la médiance ici est la note correspondant a
l’effectif cumulé 25.

D’après la colonne "effectif cumulé" :


18 personnes ont moins de 8
30 personnes ont moins de 12
La médiane se trouve donc dans l’intervalle [8, 12[ (appelé classe médiane), et on
va la déterminer par interpolation linéaire.

62/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 62 / 70
Etude d’une variable statistique continue Paramètres de tendance central

Médiane

On utilise Thalès dans le triangle bleu


M −8 12 − 8
=
25 − 18 30 − 18
ceci implique que
4
× 7 ' 10.33 M =8+
12
50% environ des personnes ont eu moins de 10.33 et 50% plus de 10.33 63/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 63 / 70
Etude d’une variable statistique continue Paramètres de dispersion

Paramètres de dispersion

Définition 1 : La variance est la quantité :


n
X
V = fi (x̄ − Ci )2
i=1

et on a aussi :
n
X
V = fi Ci2 − x̄ 2
i=1

Définition 2 : La quantité √
σ= V
s’appelle l’écart type.

64/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 64 / 70
Etude d’une variable statistique continue Paramètres de dispersion

Exercice

Chez un fabriquant de tubes de plastiques, on a prélevé un échantillon de 100


tubes dont on a mesuré le diamètre en mm.

65/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 65 / 70
Etude d’une variable statistique continue Paramètres de dispersion

1 Identifier la population, les individus, l caractère et sont type.


2 En utilisant la méthode de Yule et de Sturge, établir le tableau statistique
3 Tracer l’histogramme de cette variable statistique
4 Déterminer par le calcul la valeur du diamètre au dessous de laquelle se
trouve 50% des tubes de plastique.

66/70

Dr. Najoua Essamaoui (Cadi ayyad university) Statistique Déscriptive 02 Février 2021 66 / 70