Académique Documents
Professionnel Documents
Culture Documents
Statistiques Descriptives
(Analyse univariée )
Animé par :
Pr AIT BABRAM Mohamed
2008/2009
FSTG Marrakech I- Introduction générale
La statistique est un ensemble des méthodes scientifiques à partir desquelles, on
recense, on organise, on résume, on présente et on analyse le phénomène auquel on
s’intéresse.
« C’est une science moderne et positive qui met en lumière les faits les plus
obscures ».
De manière générale, l’enseignement de la statistique peut être vu en trois volets :
Analyse Univariée
¾ La statistique descriptive,
¾ La statistique Probabiliste,
¾ La statistique Prédictive.
Probabilité et Statistiques
Pr. AIT BABRAM Mohamed
Saisie de données
Analyse Univariée
Préparation de données
oui
Analyse
Interprétation des
résultats Objectif
FSTG Marrakech II- Eléments du vocabulaire statistique
• Individu (unité statistique) : Objet sur lequel un ou plusieurs caractères
peuvent être observés.
• Population (univers) : Ensemble des individus pris en considération.
Remarque : La taille de la population statistique est généralement notée
par N.
• Échantillon : La partie de la population auprès de laquelle sont
collectées les données.
Analyse Univariée
Quantitative
Analyse Univariée
Variable
Binaire (Infecté/Non infecté,…)
Ordinale (Score,…)
FSTG Marrakech
III- Représentation des données
A- Tableaux statistiques
i −1 i −1
Fi = ∑ f p et N i = ∑ n p
p =1 p =1
Pr. AIT BABRAM Mohamed
a – Caractère qualitatif
poids réel :
300-250-242-320-410-420-500-512-600-630-710-350-200-210-250-
310-320-400-460-380-510-560-740-240-270-280-340-360-230-290-
310-430-460-530-640-680-720-450-470-640-780-440.
k = 1 + 3,3 Log(n)
Pr. AIT BABRAM Mohamed
FSTG Marrakech
B- Représentations graphiques
10
6
8
Analyse Univariée
4
6
ce
4 2
n
Fréquence
réque
2
F
0
0
20
25 0
30 0
35 0
40
45 0
50 0
55 0
60 0
65 0
70 0
75 0
80 0
229,2 337,5 445,8 554,2 662,5 770,8
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
0
Poids des boites Poids des boites
Caractéristiques de position
(tendance centrale)
Analyse Univariée
¾Médiane
¾Quartiles
¾Mode
¾Moyenne
Pr. AIT BABRAM Mohamed
FSTG Marrakech Définitions
• Mode : La modalité la plus fréquente (qu’on note par Mo)
Exemple : « la modalité la plus fréquente du statut matrimonial est
marié(e) avec 52% ».
120
100
Analyse Univariée
80
Pourcentagecumulé
60
40
20
0
200 400 600 780
Me Me=3
Poids des boites
Pr. AIT BABRAM Mohamed
Dans le cas d’un caractère discret, le plus souvent, aucune modalité du caractère ne partage pas
exactement l’effectif n en deux parties égales. Par convention, on retient dans ce cas comme
médiane la modalité xi telle que :
¾ A gauche de xi l’effectif cumulé est < n/2
¾ A droite de xi l’effectif cumulé est < n/2
FSTG Marrakech
Médiane
Remarque : Une fois la classe médiane est déterminée, on procède à une interpolation
linéaire pour la détermination précis de la médiane.
Ni+1
x i +1 − x i ⎛ n ⎞
= xi + −
Analyse Univariée
n/2 M e ⎜ N i ⎟
ni ⎝ 2 ⎠
Ni
xi Me xi+1
Pr. AIT BABRAM Mohamed
¾ Me : La médiane cherchée
¾ n/2 : La moitié de l’effectif total
¾ ni : L’effectif de la classe médiane
¾ Ni : effectif cumulé correspondant à l’extrémité inférieure de la classe médiane
¾ Ni+1 : effectif cumulé correspondant à l’extrémité supérieure de la classe médiane
FSTG Marrakech Médiane
Exemple : On considère un ensemble résidentiel de 320 appartements classés
en fonction du nombre de pièces par appartement.
La médiane Me = 3 pièces
Analyse Univariée
xi+1 − xi
Mo = xi + (ni −ni−1)
2ni −ni−1 −ni+1
Pr. AIT BABRAM Mohamed
Le mode Mo = 3 pièces
Analyse Univariée
1 k k
x = ∑ ni xi = ∑ f i xi
n i =1 i =1
Analyse Univariée
5 5
1 881
x=
320
∑
i =1
ni x i =
320
= 2,75 x = ∑ f i xi = 2,74 pièces
i =1
FSTG Marrakech
Moyenne
Remarque : Dans le cas continu, l’application de la formule précédente de la
moyenne est impossible car les xi ne sont pas déterminés. Par convention, on
représente chaque classe i par son centre ci (milieu).
Exemple : On considère 75 ateliers d’artisans que l’on classe en fonction du
nombre d’heures œuvrées pendant un mois.
Analyse Univariée
Pr. AIT BABRAM Mohamed
1 6 9900
x = ∑ ni ci = = 132 heures / mois
75 i =1 75
FSTG Marrakech
Caractéristiques de dispersion
¾Étendue
Analyse Univariée
¾Coefficient de variation
FSTG Marrakech Caractéristiques de dispersion
Position du problème : On note que la connaissance des paramètres de la
tendance centrale d’une distribution statistique sont insuffisants pour résumer
toutes les caractéristiques. Pour mettre l’accent sur cette insuffisance, nous
proposons l’exemple suivant :
Exemple : Considérons deux villes dont on étudie les fluctuations de la
température moyenne au cours des quatre trimestres :
Analyse Univariée
t1 = t2 = 20 °C
Alors que les fluctuation thermiques dans les deux villes sont sensiblement
différentes. Pour combler cette insuffisance dans l’analyse, nous proposons
un nombre d’indicateurs nous permettant de mesurer l’éloignement des
modalités d’un caractère par rapport leur tendance centrale.
FSTG Marrakech Définitions
Étendue : C’est simplement l'écart séparent la plus petite modalité observée
du caractère de la plus grande.
e = xmax − xmin
Remarque : L’étendue est utile pour caractériser le caractère étudié, mais
Analyse Univariée
1k 1 k
V( X ) = ∑ni (xi − x) = ∑ni (xi ) −(x)
2 2 2
n i=1 n i=1
Écart type : C’est simplement la racine carrée de la variance et s'exprime
Pr. AIT BABRAM Mohamed
σ (X )
CV ( X ) = ×100
x
Analyse Univariée
1206
x= = 12,06 (100 dhs) = 1206 dhs
100
Pr. AIT BABRAM Mohamed
194
EAM = = 1,94
100
V( X ) =
515,28
= 5,1528
100 σ ( X ) = V ( X ) = 227 dhs
V (X ) = − (12,06) = 5,1564
15060 2
100
FSTG Marrakech
Caractéristiques de forme
Analyse Univariée
¾Coefficient d’asymétrie
¾Coefficient d’aplatissement
Pr. AIT BABRAM Mohamed
FSTG Marrakech Caractéristiques de forme
Nous terminons cette étude descriptive des distributions statistiques en
traitant de deux mesure qui caractérisent des courbes représentatives de
ces distributions. Plusieurs coefficients sont utilisés pour traduire cette
notion. Nous allons nous restreindre seulement aux plus courants :
Coefficient d’asymétrie : C’est une mesure descriptive qui permet de
caractériser le degré de symétrie d’une distribution. Il est donné par :
Analyse Univariée
µ3
3
1 k
γ 1 = 3 avec µ3 = ∑ ni (xi − x )
σ n i =1
x Me Mo Mo Me x
Les observations présentent un Les observations présentent un
γ1 < 0 étalement prononcé sur le côté γ1 > 0 étalement prononcé sur le côté
supérieur de la distribution inférieur de la distribution
Pr. AIT BABRAM Mohamed
x = Me = Mo
FSTG Marrakech
Coefficient d’aplatissement : C’est une mesure descriptive qui permet de
caractériser le degré d’aplatissement d’une distribution. Il est donné par :
µ4
4
1 k
γ1 = 4 − 3 avec µ4 = ∑ni (xi − x)
σ n i=1
µ 4 = ∑ ni (ci − x )
n i =1
Remarque : En pratique, trois cas de figures peuvent se présenter :
Distribution moins aplatie
γ2 > 0 (Leptokurtique)
Distribution de référence
γ2 = 0
Pr. AIT BABRAM Mohamed
(Mésokurtique)
d’emploi ».
Remarque : On remarque que, pour les trois premiers objectifs, il
s’agit de la même analyse mais pour trois types de variables.
FSTG Marrakech
Objectif 1 : Procédure (1/3)
Analyse Statistiques Descriptive Fréquences
Diagramme
Analyse Univariée
Statistiques
Format
Coller OK
FSTG Marrakech Objectif 1 : Procédure (2/3)
choisir « diagramme de
bâtons » ou « graphique en
secteur » dans le cas ou la
variable est continue ou
discrète avec un nombre de
modalités élevé.
Pr. AIT BABRAM Mohamed
Poursuivre
FSTG Marrakech Objectif 1 : Procédure (3/3)
Poursuivre
FSTG Marrakech Objectif 1 : Procédure (4/3)
Poursuivre
FSTG Marrakech
Objectif 1 : Résultat 1/2
Les paramètres de la
tendance centrale
demandés pour la
Analyse Univariée
58%
Pr. AIT BABRAM Mohamed Analyse Univariée FSTG Marrakech
Le logiciel SPSS a
découpé les données
concernant le salaire
actuel en 25 classes de
même amplitude (5 000 $).
Objectif 1 : Résultat 2/2