Vous êtes sur la page 1sur 49

Rappel

sur les sta+s+ques


descrip+ves

Pr. R. GUATI
Rappel sur les Sta,s,ques
descrip,ves
•  La Sta,s,que Descrip,ve est l'ensemble des
méthodes et techniques perme@ant de
présenter, de décrire, de résumer, des
données nombreuses et variées.
•  Il faut préciser d'abord quel est l'ensemble
étudié, appelé popula,on sta,s,que, dont les
éléments sont des individus ou unités
sta,s,ques
Sta,s,ques descrip,ves
•  On dis+ngue trois principales étapes en sta+s+ques
descrip+ves

ü  Iden+fier à par+r des données brutes les individus et


les variables ainsi que leurs natures.

ü  Résumer par des tableaux, graphiques une série


sta+s+que résultant de l'observa+on d'une seule
variable.

ü  Calculer les paramètres sta,s,ques pour quan+fier les


traits principaux de chaque observa+on
Domaines d’applica,on
•  A chaque fois qu’on est devant une base de donnée très
large qui doit être suivie et observée, on fait recours à la
sta+s+que.

•  Aujourd’hui, il est devenu nécessaire pour tout le monde de


comprendre et de pouvoir cri,quer les chiffres qui sont
présentés dans les médias, quelque soit leurs domaines
(poli+que, économique, sociale, scien+fique..).

•  La sta+s+que permet de décrire ces ensembles nombreux


d’informa,on et de les résumer pour obtenir une image
plus simplifiée et assimilable.
Nombre d’enfant par nombre de ménage
Nombre d’enfants Nombre de ménage
0 150
1 250
2 300
Modalités 3 150 Effec,fs

4 100
Plus de 4 50
TOTAL 1000

A gauche, on a le caractère étudié: nombre d’enfants


A droite on a le nombre d’observa+ons correspondantes qu’on appelle effec,fs (effec+fs:
nombre de ménage)
Notre étude a porté sur 1000 ménages: effec,f total

Lisons la 4ème ligne: 100 ménages ont 4 enfants(l’effec+f qui correspond à la modalité 4
enfant est 100.
Nombre d’enfant par ménage(2)
•  On peut choisir de regrouper les différentes
valeurs (modalités) de la variable « nombre
d’enfants » en classes

Nombre d’enfants Nombre de ménage


[0;2[ 700
[2;4[ 250
[4 ;6[ 50
Total 1000
•  On ob+ent donc un caractère quan,ta,f
con,nu.
Popula,on sta,s,que/ unités sta,s,que
•  Avant de se lancer dans une étude sta+s+que, il
faut préciser quel est l'ensemble étudié, appelé
popula,on sta,s,que, dont les éléments sont
des individus ou unités sta,s,ques

•  La première informa+on sta+s+que que l'on +re


d'une popula+on est le nombre de ses unités
sta,s,ques ou de ses individus, que l’on désigne
par la le@re n.(taille de la popula+on)
Quelques défini,ons
•  Popula+on: ensemble des unités sta,s,ques ou
individus sur lesquels on effectue une analyse
sta+s+que
•  Dans notre exemple: popula+on= 1000 ménages
•  Unités sta+s+ques (individus): élément de la
popula+on sur lequel porte l’observa+on
•  Exemple: ménage
•  Caractère sta+s+que ou variable sta+s+que : C'est ce
qui est observé ou mesuré sur les individus d'une
popula+on sta+s+que. Il peut être quan,ta,f ou
qualita,f
Ex: nombre d’enfants ou niveau des langues
Exemple d’une étude sta,s,que
•  Le tableau suivant présente la distribu+on de
la popula+on urbaine marocaine par âge et
par sexe (en milliers: année 2011)
Age Féminin Masculin Total

00-30
4931 4868 9798
30-60
3790 3582 7376
60 et +
867 763 1629
Total
9589 9213 18802

Source: Haut Commissariat au Plan


Distribu,on de la popula,on urbaine
marocaine par groupe d’âge et par sexe

•  Popula,on : popula+on urbaine marocaine en


2011
•  Individu : une personne de la popula+on urbaine
•  Caractère (variable) : groupe d’âge et sexe
Exemple 2:Répar,,on de la
popula,on marocaine par milieu de
résidence

Milieu de résidence Popula,on


Urbain 18446
Rural 13448
Total 31894

Source: HCP

L’exemple suivant décrit un caractère qualita,f


Types de variables

Discrète
Quan,ta,ve
Con,nue
Variable
Nominale
Qualita,ve
Ordinale
Types des variables sta,s,ques
•  Chaque variable peut être, selon le cas :
–  Quan,ta,ve : ses valeurs sont des nombres exprimant
une quan+té, sur lesquels les opéra+ons
arithmé+ques (somme, etc...) ont un sens.
ü Discrète: sont des nombres isolés les uns des autres.
ü Con+nue : ces variables sont regroupées en classes ( ou
intervalles)
–  Qualita,ve : ses valeurs sont des modalités, ou
catégories,
ü Nominale
ü Ordinale: lorsqu’il y’a possibilité d’ordonner les valeurs
Variable quan,ta,ve discrète
•  Exemples:
ü L’emploi dans un pays
ü Nombre d’employés d’une entreprise
ü Nombre d’ar+cles vendus
ü Nombre de naissances
ü Nombre de vic+mes d’accidents de la route
ü Nombre des pièces dans une habita+on
Variable quan,ta,ve con,nue
•  Exemples:
ü L’âge d’un individu
ü La durée du chômage
ü Le chiffre d’affaires d’une entreprise
ü Le produit intérieur brut
ü La surface d’un terrain
Variable qualita,ve ordinale
•  Exemples:
ü Taille ves+mentaire :(XS, S, M, L, XL)
ü Niveau du français : faible, moyen, bon, excellent
Variable qualita,ve nominale
•  Exemples:
ü  Sexe: masculin, féminin
ü Statut matrimonial : célibataire, marié, divorcé,
veuf
ü Couleurs,
ü  Profession
ü  Na+onalité
Paramètres sta,s,ques
•  Les paramètres sta+s+ques ont pour but de
résumer, à par+r de quelques nombres clés,
l'essen+el de l'informa+on rela+ve à une
distribu+on.
•  On dis+ngue deux types de paramètres:
ü Paramètres de tendance centrale
ü Paramètre de dispersion
Paramètres de la tendance centrale
•  En général, il existe trois indicateurs de la
valeur centrale
ü Mode (caractères qualita+fs et quan+ta+fs)
ü Médiane (caractères quan+ta+fs)
ü Moyenne (caractères quan+ta+fs)

Mode
•  Le mode est la valeur de la variable sta+s+que
pour laquelle la fréquence est la plus élevée.
•  Le mode peut être calculé pour les caractères
qualita+fs comme pour les caractères
quan+ta+fs.
Exemple 1: caractère qualita,f
Le mode est la modalité avec l’effec+f le
plus important.

Le mode de la distribu+on est représenté par


les salariés du secteur privé.
Exemple 2: variables discrètes

Le mode est la valeur de la variable discrète


avec l’effec+f le plus important. Il
correspond à 2 appareils par jour: il y a 75
jours où l’on a vendu 2 appareils dans la
Exemple 3 : variable con,nue

• Dans ce cas on détermine la classe modale définie comme la


classe dont la fréquence moyenne par unité d’intervalle de
classe est la plus élevée
• A@en+on: la classe modale dépend du découpage des classes.

Médiane
•  La valeur de la médiane est telle que la moi,é
des observa,ons ont une valeur inférieure à
la médiane et la deuxième moi,é ayant une
valeur qui lui est supérieure.
•  La médiane ne peut être calculée que pour
des caractères quan+ta+fs
Exemple 1.a: variables discrètes
A. Nombre impair d’observa,ons:
•  Nombre d’appareils vendues pendant la
semaine
Lundi mardi mercredi jeudi vendredi
1 0 2 0 3

Observa+ons ordonnées par ordre croissant:


mar(0) jeu (0) lun (1) mer (2) ven (3)

La médiane est 1 appareil vendu par jour.


Exemple 1.b: variables discrètes
B. nombres pair d’observa+ons:
•  Nombre d’appareils vendus pendant la
semaine:
Lundi mardi mercredi jeudi vendredi samedi
1 0 2 0 3 3

Observa+ons ordonnées par ordre croissant


mar(0) jeu (0) lun (1) mer (2) ven (3) sam (3)
L’intervalle médian est (1, 2).
Exemple 3: variables con,nues
•  En général, la médiane se trouve à l’intérieur
d’une classe. Sa valeur exacte est déterminée
par interpola+on linéaire

Médiane = 1014, 3
Moyenne
•  La moyenne arithmé+que d’une variable
sta+s+que est la somme des valeurs divisée
par le nombre d’observa,ons.

•  La moyenne ne peut être calculée que pour les


caractères quan+ta+fs.
Exemple 1: variables discrètes
•  Nombre d’appareils vendus pendant la
semaine:
Lundi mardi mercredi jeudi vendredi
1 0 2 0 3

La moyenne est 6/5 = 1, 2 appareils vendus par


jour.
Exemple 2: variables con+nues

•  Le nombre de jour moyen d’ouverture est de 2.2


Mode, médiane, moyenne
•  La comparaison de ces trois paramètres donne
des indica+ons sur la symétrie de la distribu,on.

ü Distribu+on symétrique:
mode = médiane = moyenne

ü Distribu+on étalée vers la droite:
mode < médiane < moyenne

ü Distribu+on étalée vers la gauche:
moyenne < médiane < mode
Symétrie de la distribu,on
Paramètres de dispersion
•  On dis+ngue entre les indicateurs suivants:
ü Etendue
ü Intervalle interquar+le
ü Ecart type
ü Variance
Etendu
•  L’étendue est la différence entre la valeur
maximale et la valeur minimale dans la
popula+on.
•  Lorsque les données sont ordonnées en
ordre croissant:

Intervalle interquar,le
•  Les trois quar+les, Q1, Q2 et Q3, sont les
valeurs de la variable sta+s+que pour lesquels
la fréquence cumulée est égale à 25%, 50% et
75%, respec+vement.
•  Q2 est égale à la médiane.
•  L’intervalle interquar,le = q3 – q1
•  L’intervalle interquar+le con+ent 50% de la
popula+on avec 25% en dessous de l’intervalle
et 25% au–dessus.
Variance
La variance est la moyenne arithmé,que des
carrés des écarts à la moyenne arithmé,que.
Ecart type

L’écart type est la racine carrée de la variance


Exemple 1: variable discrète

• Etendu = 6 – 0 = 6
• Intervalle interquar+le: q1 = 1 q2 = 2 q3 = 3

Exemple 1: intervalle interquar,le
Exemple 1 : moyenne
Exemple 1: variance et écart type
Exemple 2: variables con,nues
Exemple 2: intervalle interquar,le
Exemple 2 = moyenne, écart type et
variance
•  On prend le centre de chaque classe comme valeur
représenta+ve pour ce@e classe.
Limites de la sta,s,que descrip,ve

•  Une étude sta+s+que sur l’ensemble de la
popula+on est souvent très onéreuse et parfois
même impossible à réaliser.
•  Difficulté d’obtenir des indicateurs fiables sur
diverses caractéris+ques d’une popula+on.
•  Impossibilité d’accéder
ü À tous les individus d’une popula+on
ü  À la totalité d’une aire
Approches Sta,s,ques
Sta,s,que descrip,ve/ inféren,elle
Sta,s,que
descrip,ve/
inféren,elle

Sta,s,que Sta,s,que
descrip,ve inféren,elle

Mesurer et
Organiser, Etendre les prendre en
résumer, Représenta,ons Mesures propriétés compte l’erreur
représenter un graphiques. sta,s,ques constatées sur un d’échan,llonnage
ensemble de (moyenne,…). échan2llon à et vérifier les
données. toute la tests
popula,on d’hypothèses.
Popula,on sta,s,que/ échan,llon

Popula+on = Ensemble
des éléments étudiés.
(individus, pays,
Popula,on
entreprises, …)

Echan,llon
Echan+llon = Sous-
ensemble +ré de la
popula+on .
Popula+on sta+s+que/ échan+llon
•  Pour la popula,on •  Pour l’échan,llon
sta,s,que
n : taille de l’échan+llon
N : taille de la popula+on V(x): variance de l’échan+llon
totale
Fn: fréquence dans
σ² : variance de la popula+on l’échan+llon
P : propor+on d’une par+e de x : moyenne de l’échan+llon
la popula+on
m : moyenne de la popula+on
Nh : taille d’une par+e de la
popula+on

Vous aimerez peut-être aussi