Vous êtes sur la page 1sur 62

Statistique descriptive Univariée

Dr Oumy Niass MBODJI

Master Calcul Scientifique

20 octobre 2022

1 / 45
1 Introduction
Etapes d’une étude statistique
Domaines de la statistique

2 Définitions
Variables quantitatives
Variables qualitatives

3 Statistique descriptive
Analyse descriptive univariée
Variables qualitatives
Variables quantitatives
Exercices d’application

4 Statistique univariée : Les indicateurs statistiques


Introduction

1 Introduction
Etapes d’une étude statistique
Domaines de la statistique

2 Définitions
Variables quantitatives
Variables qualitatives

3 Statistique descriptive
Analyse descriptive univariée
Variables qualitatives
Variables quantitatives
Exercices d’application

4 Statistique univariée : Les indicateurs statistiques

3 / 45
Introduction

Qu’est-ce-que la Statistique ?

Comment et sur quoi travaille la Statistique ?

Que peut-on en attendre ?

4 / 45
Introduction

Les statistiques sont des ensembles de données, d’observations :


recensement, enquête, · · ·

Les probabilités forment une branche des mathématiques


(rigoureuses, exactes).
Elles travaillent sur des objets mathématiques parfaitement définis et
abstraits.

ZLa Statistique : Science qui utilise les méthodes mathématiques


(probabilités,. . . ) pour étudier et analyser des statistiques en vue :
Accroitre les connaissances scientiques
planier des stratégies
aide à la décision

5 / 45
Introduction

Domaine d’application de la Statistique


Biologie,
Ecologie,
Médecine,
Chimie,
Finance
Imagerie médicale,
···

6 / 45
Introduction Etapes d’une étude statistique

Etapes d’une étude statistique

Collecte des données : Des informations sont obtenues au sein


d’une population, relativement à un caractère ou une variable. Les
résultats constituent une serie statistique.

Analyse des données : Il s’agit de la détermination des paramètres


statistiques qui permettent de caractériser la série statistique.

Interprétation des résultats : se fait à l’aide des propriétés


mathématiques et en élaborant des tests pour une exploitation des
résultats.

7 / 45
Introduction Etapes d’une étude statistique

Etapes d’une étude statistique

8 / 45
Introduction Domaines de la statistique

Différentes branches de la Statistique

Statistique descriptive : organisation, présentation, résumer en


mettant les points importants en évidence.

Statistique inférentielle : Raisonner par inférence, prendre des


décisions sur une population à partir d’un échantillon.

9 / 45
Définitions

1 Introduction
Etapes d’une étude statistique
Domaines de la statistique

2 Définitions
Variables quantitatives
Variables qualitatives

3 Statistique descriptive
Analyse descriptive univariée
Variables qualitatives
Variables quantitatives
Exercices d’application

4 Statistique univariée : Les indicateurs statistiques

10 / 45
Définitions

Définitions

Population : l’ensemble des éléments auxquels se rapportent l’étude

Échantillon : Un sous-ensemble de la population

Observation = Individu : élément de la population sur lequel


on mesure des caractéristiques (variables)

Variable aléatoire : résultat d’un processus aléatoire, valeur précise


inconnue avant la mesure

11 / 45
Définitions

Définitions

Population : l’ensemble des éléments auxquels se rapportent l’étude

Échantillon : Un sous-ensemble de la population

Observation = Individu : élément de la population sur lequel


on mesure des caractéristiques (variables)

Variable aléatoire : résultat d’un processus aléatoire, valeur précise


inconnue avant la mesure

11 / 45
Définitions

Définitions

Population : l’ensemble des éléments auxquels se rapportent l’étude

Échantillon : Un sous-ensemble de la population

Observation = Individu : élément de la population sur lequel


on mesure des caractéristiques (variables)

Variable aléatoire : résultat d’un processus aléatoire, valeur précise


inconnue avant la mesure

11 / 45
Définitions

Définitions

Population : l’ensemble des éléments auxquels se rapportent l’étude

Échantillon : Un sous-ensemble de la population

Observation = Individu : élément de la population sur lequel


on mesure des caractéristiques (variables)

Variable aléatoire : résultat d’un processus aléatoire, valeur précise


inconnue avant la mesure

11 / 45
Définitions

Définitions

Caractère (Variable) : toute caractéristique prise par les individus


d’une population. C’est un aspect particulier de l’unité statistique
auquel on s’interesse qui peut être :
Quantitative

Qualitative

12 / 45
Définitions Variables quantitatives

Variables Numériques
Z reflètent une notion de grandeur, c’est-à-dire les valeurs qu’elles
peuvent prendre sont des nombres.

Z Les variables quantitatives mesurent donc des « quantités » comme :


Le poids d’une voiture, en kilogrammes.

Le temps de réalisation dune tache en secondes.

Le nombre de tâches réussites.

13 / 45
Définitions Variables quantitatives

Variables Numériques

Une variable quantitative peut être :


discrète

continue

Une variable discrète a une valeur finie. Il est possible de les


énumérer.
Exple : nombre de cas de maladie, · · ·

Une variable continue peut prendre, en théorie, une infinité de


valeurs, formant un ensemble continu.
Exple : poids, âge, · · ·

14 / 45
Définitions Variables qualitatives

Variables qualitatives
Z Les variables catégorielles (ou qualitatives) mesurent juste des "états",
des catégories. Il ny a pas déchelle de valeurs.

Les caractères qualitatives se présentent sous forme de modalités


Modalités d’un caractère : Différentes valeurs que peut prendre ce
caractère sur l’ensemble de la population..
Exple : la variable "situation matrimoniale" a quatre modalités
(Célibataire, Marié, Veuf, Divorcé)
Les modalités d’un caractère qualitatif sont exhaustives et
mutuellement incompatibles.
exhaustives : à chaque individu doit correspondre une modalité du
caractère.
Exple : La variable "Sexe" : Masculin ou Féminin
incompatibles : chaque individu doit pouvoir être classé dans une
seule modalité du caractère.
Exple : Un individu ne peut pas être un homme et une femme.
15 / 45
Définitions Variables qualitatives

Variables qualitatives

Z Une variable catégorielle peut être :

binaire : malade/ non malade codé respectivement en générale par


"1" et "0"

nominale : sexe, situation matrimoniale, · · ·

ordinale : notion d’ordre (1ère , 2ème , · · · )

16 / 45
Définitions Variables qualitatives

Résumé

17 / 45
Définitions Variables qualitatives

5mn Test
1 Une population de n individus a répondu à un questionnaire leur

demandant leur âge, la couleur de leurs yeux, le nombre de frères et


de soeurs et leur sexe. Parmi les quatre variables précédentes
lesquelles sont des variables quantitatives ?

2 et lesquelles sont des variables qualitatives ?

18 / 45
Statistique descriptive

1 Introduction
Etapes d’une étude statistique
Domaines de la statistique

2 Définitions
Variables quantitatives
Variables qualitatives

3 Statistique descriptive
Analyse descriptive univariée
Variables qualitatives
Variables quantitatives
Exercices d’application

4 Statistique univariée : Les indicateurs statistiques

19 / 45
Statistique descriptive

Statistique descriptive

Z La statistique descriptive a pour but de structurer et de représenter


l’information contenue dans un ensemble de données de façon à en
dégager les caractéristiques essentielles sous une forme simple et
intelligible.

Z Elle décrit de façon synthétique et parlante des données observées


pour mieux les analyser.

20 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Analyse univariée

L’analyse univariée consiste à résumer les modalités d’un caractère


statistique (variable)

Pourquoi résumer les données ? ? ?


Pour les décrire Z évolution du VIH en Afrique en 2014

Pour les comparer à d’autre données Z suivie épidémique des cas


de paludisme au sénégal en 2010 et en 2013

Z Il existe trois procédées pour décrirer un ensemble de données


statistiques :
Tableaux : représentent les données exactes
les graphiques : donnent une image synthétique
Le calcul des indicateurs statistiques.

21 / 45
Statistique descriptive Analyse descriptive univariée

Tableau brut des données

Les colonnes et les lignes représentent respectivement les variables et


les unités statistiques (individus)
22 / 45
Statistique descriptive Analyse descriptive univariée

Description d’une variable qualitative :

La meilleure manière de représenter des variables qualitatives est d’utiliser


les fréquences absolues et relatives.
Ces indicateurs sont souvent représentés dans un tableau ou sous
forme graphiques.

23 / 45
Statistique descriptive Analyse descriptive univariée

Tableau associé aux variables qualitatives

Modalités Effectifs Fréquences relatives

n1
x1 n1 n

n2
x2 n2 n

.. .. ..
. . .

np
xp np n

Total n 1

24 / 45
Statistique descriptive Analyse descriptive univariée

Représentation graphique d’une variable qualitative

Diagramme en bande : bandes à base constante dont la hauteur


de chacune d’elle est proportionnelle à l’effectif ou la fréquence de la
modalité correspondante.

25 / 45
Statistique descriptive Analyse descriptive univariée

Représentations graphiques d’une variable qualitative

Diagramme à secteurs : chaque secteur a un angle proportionnel


à l’effectif ou la fréquence de la modalité qu’il représente

26 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative discrète : tableaux associés

Modalités Effectifs Fréquences relatives Fréquences cumulées


croissantes

n1
x1 n1 f1 = n f1

n2
x2 n2 f2 = n f1 + f2
.. .. .. ..
. . . .

np
xp np fp = n f1 + f2 + · · · + fp = 1

Total n 1

27 / 45
Statistique descriptive Analyse descriptive univariée

Exercices

Le nombre d’enfant dans les familles d’une pays. Compléter le tableau


ci-dessous
Modalités Effectifs Fréquences relatives Fréquences cumulées
croissantes
0 10
1 24
2 32
3 19
4 8
5 4
6 3
Total

28 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative discrète : Représentation graphique

Diagramme en bâtons : constitué d’une suite de segments verticaux


d’abscisses xi dont la longueur est proportionnelle à l’effectif (resp. la
fréquence) de xi .

29 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative discrète : Représentation graphique

Polygone des effectifs ou des fréquences : obtenu à partir du


diagramme en bâtons des effectifs (resp. des fréquences) en joignant
par un segment les sommets des bâtons.

30 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : tableaux associés

Z Les variables quantitatives continues sont souvent regrouper en classe

Classe ci : Intervalle s’écrivant sous la forme ]bi , bi+1 [

bi : borne inférieure

bi+1 : borne supérieure

Amplitude de la classe : ai = bi+1 − bi

bi+1 +bi
Centre de la classe : 2
Densité de classe : di = naii

31 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : tableaux associés

Z Les variables quantitatives continues sont souvent regrouper en classe

Classe ci : Intervalle s’écrivant sous la forme ]bi , bi+1 [

bi : borne inférieure

bi+1 : borne supérieure

Amplitude de la classe : ai = bi+1 − bi

bi+1 +bi
Centre de la classe : 2
Densité de classe : di = naii

31 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : tableaux associés

Z Les variables quantitatives continues sont souvent regrouper en classe

Classe ci : Intervalle s’écrivant sous la forme ]bi , bi+1 [

bi : borne inférieure

bi+1 : borne supérieure

Amplitude de la classe : ai = bi+1 − bi

bi+1 +bi
Centre de la classe : 2
Densité de classe : di = naii

31 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : tableaux associés

Modalités centre Effectifs Fréquences F. cumulées


(en classe) de classe relatives croissantes

n1
[b1 , b2 [ n1 f1 = n f1

n2
[b2 , b3 [ n2 f2 = n f1 + f2
.. .. .. .. ..
. . . . .

np
[bp , bp+1 [ np fp = n f 1 + f 2 + · · · + fp

Total n 1

32 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : Représentations graphiques

Histogramme : un ensemble de rectangles contigus dont chacun a


une surface proportionnelle à l’effectif de la classe correspondante.

33 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : Représentations graphiques

Histogramme : un ensemble de rectangles contigus dont chacun a


une surface proportionnelle à l’effectif de la classe correspondante.

33 / 45
Statistique descriptive Analyse descriptive univariée

Variable quantitative continue : Représentations graphiques

Polygone des effectifs ou des fréquences : obtenu en joignant


dans l’histogramme de cette distribution les milieux des côtés
horizontaux supérieurs.

34 / 45
Statistique descriptive Exercices d’application

Exercices

Exercice 1
Les caracteristiques suivants observés sur un chef de ménage sont-ils
qualitatifs, quantitatifs discrets ou quantitatifs continu ? ?
Sexe, état matrimonial, nombre d’enfants, région habitée, ethnie, âge,
niveau d’étude, nombre de pièces du logement, type de logement.

35 / 45
Statistique descriptive Exercices d’application

Exercice 2

Une étude portant sur 60 stars du Sénégal a permis de construire le


tableau donnant la répartition en fonction de leur nombre de divorces.

xi 0 1 2 3 4 5 6 7

ni 1 3 7 15 19 10 4 1

Quel est le type du caractère observé ?


Représenter le diagramme en bâtons des effectifs et le polygone des
fréquences.

36 / 45
Statistique descriptive Exercices d’application

Exercice 3
Une étude portant sur la durée de vie d’une centaine d’appareils
électroniques du même type a permis d’établir le tableau ci-dessous.
Durée de vie (en heure) Nombre d’appareils
[0, 2000[ 8
[2000, 4000[ 23
[4000, 5000[ 20
[5000, 6000[ 22
[6000, 8000[ 18
[8000, 10000[ 6

Quels sont la population étudiée et l’unité statistique ?


quel est le caractère observé ? Quelle est sa nature ?
Construire l’histogramme et le polygone des fréquences
construire la courbe des fréquences cumulées croissantes
construire la courbe des fréquences cumulées décroissantes
37 / 45
Statistique descriptive Exercices d’application

Exercice 4

38 / 45
Statistique univariée : Les indicateurs statistiques

1 Introduction
Etapes d’une étude statistique
Domaines de la statistique

2 Définitions
Variables quantitatives
Variables qualitatives

3 Statistique descriptive
Analyse descriptive univariée
Variables qualitatives
Variables quantitatives
Exercices d’application

4 Statistique univariée : Les indicateurs statistiques

39 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de position
Mode et classe modale : valeur la plus fréquente

Quartile (Q1 , Q2 , Q3 ) : valeurs qui partagent la serie en quatre séries


de même taille

Médiane = Q2 : la valeur qui partage la série des sujets en 2 groupes


d’effectifs égaux.

1 Pn
Moyenne Arithmétique, x̄ = n i=1 xi

40 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de position
Mode et classe modale : valeur la plus fréquente

Quartile (Q1 , Q2 , Q3 ) : valeurs qui partagent la serie en quatre séries


de même taille

Médiane = Q2 : la valeur qui partage la série des sujets en 2 groupes


d’effectifs égaux.

1 Pn
Moyenne Arithmétique, x̄ = n i=1 xi

40 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de position
Mode et classe modale : valeur la plus fréquente

Quartile (Q1 , Q2 , Q3 ) : valeurs qui partagent la serie en quatre séries


de même taille

Médiane = Q2 : la valeur qui partage la série des sujets en 2 groupes


d’effectifs égaux.

1 Pn
Moyenne Arithmétique, x̄ = n i=1 xi

40 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de position
Mode et classe modale : valeur la plus fréquente

Quartile (Q1 , Q2 , Q3 ) : valeurs qui partagent la serie en quatre séries


de même taille

Médiane = Q2 : la valeur qui partage la série des sujets en 2 groupes


d’effectifs égaux.

1 Pn
Moyenne Arithmétique, x̄ = n i=1 xi

40 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de dispersion
Étendue = max(x ) − min(x )
Étendue interquartile, notée EIQ(x ) = Q0,75 (x ) − Q0,25 (x )

1 Pn
Variance : Var (x ) = n i=1 (xi − x̄ )2
p
Ecart-type ou Déviation standard : σ(x ) = Var (x )

σ(x )
Coefficient de variation : CV = x̄

41 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de dispersion
Étendue = max(x ) − min(x )
Étendue interquartile, notée EIQ(x ) = Q0,75 (x ) − Q0,25 (x )

1 Pn
Variance : Var (x ) = n i=1 (xi − x̄ )2
p
Ecart-type ou Déviation standard : σ(x ) = Var (x )

σ(x )
Coefficient de variation : CV = x̄

41 / 45
Statistique univariée : Les indicateurs statistiques

Les indicateurs statistiques

Indicateurs de dispersion
Étendue = max(x ) − min(x )
Étendue interquartile, notée EIQ(x ) = Q0,75 (x ) − Q0,25 (x )

1 Pn
Variance : Var (x ) = n i=1 (xi − x̄ )2
p
Ecart-type ou Déviation standard : σ(x ) = Var (x )

σ(x )
Coefficient de variation : CV = x̄

41 / 45
Statistique univariée : Les indicateurs statistiques

Boxplot

42 / 45
Statistique univariée : Les indicateurs statistiques

Excercice 5

Une enquête effectuée auprès de 100 familles sénégalaises conduit à la


distribution suivante selon le nombre d’enfants.
xi 0 1 2 3 4 5 6 7 8 9 10 et plus
ni 6 9 13 16 10 12 10 4 3 5 12

Quel est la variable étudiée ?


Déterminer :
le mode, la médiane et les quartiles Q1 et Q3
Interpréter les résultats

43 / 45
Statistique univariée : Les indicateurs statistiques

Excercice 6

Calculer :
la moyenne, la médiane, le minimum, le maximum, le premier et
troisième quartile,
l’étendue, l’étendue interquartile, l’écart-type.
représenter le boxplot
44 / 45
Statistique univariée : Les indicateurs statistiques

Exercice 7

Le distribution du logement suivant le nombre de pièces xi est présentée


dans le tableau ci-après

Nombre de pièces 1 2 3 4 5 6 et plus


Effectifs 15 24 27 19 9 6

Déterminer le mode, la médiane et les quartiles Q1 et Q3 . Interpréter


les résultats obtenus.
Calculer la moyenne, la variance, l’écart type et le coefficient de
variation de cette série.

45 / 45

Vous aimerez peut-être aussi