Académique Documents
Professionnel Documents
Culture Documents
système d’information
Wahiba Kalboussi 3
statistique
Descriptive Inférentielle
Wahiba Kalboussi 4
- La statistique descriptive
La statistique est l’ensemble des méthodes scientifiques visant à corriger, à résumer, à organiser
et à analyser des données numériques, de même qu’a tirer des conclusions valables et à
prendre des décisions raisonnables sur la base de cette analyse.
Elle utilise pour cela des représentations de données sous forme de graphiques, de tableaux et
d'indicateurs numériques (par exemple des moyennes).
Wahiba Kalboussi 5
- La statistique inférentielle
Elle va au delà de la simple description des données. Elle a pour but de faire des
prévisions et de prendre des décisions au vu des observations.
En général, il faut pour cela proposer des modèles probabilistes du phénomène aléatoire
étudié et savoir gérer les risques d'erreurs.
Les probabilités jouent ici un rôle fondamental.
Wahiba Kalboussi 6
Analyse des données
multidimensionnelle
L’analyse des données permet de traiter un nombre très important de données et de dégager les
aspects les plus intéressants de la structure de celles-ci.
-permettent de ressortir les relations pouvant exister entre les différentes données et à en tirer une
information statistique qui permet de décrire de façon plus succincte les principales informations
contenues dans ces données.
-regrouper les données de façon à faire apparaître clairement ce qui les rend homogènes, et ainsi
mieux les connaître.
PARTIE I
Wahiba Kalboussi 8
Analyse univariée
(unidimensionnelle)
Wahiba Kalboussi 9
LES VARIABLES STATISTIQUES
Quantitative Qualitative
Echelle de Echelle de
nominale ordinale
intervalle proportion
I.1.Les variables qualitatives
Wahiba Kalboussi 11
I.1.Les variables qualitatives
L’échelle nominale:
les données permettent des classifications sans relation d’ordre.
Etat matrimonial :
célibataire Marié veuf/ divorcé
Genre :
homme femme
I.1.1.Variable nominale :
Possède le moins de propriétés mathématiques.
Tri à plat: le nombre d'observations appartenant à chaque catégorie
(modalité) de la variable, c'est à dire effectuer une tabulation simple
La tendance sera représentée par le Mode MO est la modalité dont la
fréquence la plus élevée (autrement dit, la modalité la plus observée).
Wahiba Kalboussi 13
Application
Combien y a-t-il de personnes qui ont acheté le produit Nadhif du point de vente Magasin
Général sur les 1000 personnes interrogées ?
Le mode correspond à la réponse oui, ceci signifie que la tendance centrale est d'acheter le
produit Nadhif de ce point de vente.
Oui 1 550 55 55
Wahiba Kalboussi 14
L’échelle ordinale:
Echelle ordinale: les données sont rangées par ordre sans
que l’intervalle entre chaque niveau de la variable ne soit
constant.
Exemple:
- Classement des marques.
- Ordre de préférence.
L’échelle ordinale:
traitement statistique
Q1 Q2 Q3.
25% 25% 25% 25%
Wahiba Kalboussi 17
Niveau d'utilité Effectifs Fréquences Fréq cumulés
Inutile 10 4,17 4,17
Utile 90 37,5 41,67
Très utile 80 33,33 75
Indispensable 60 25 100
240 100
.
La médiane: la modalité « très utile » : il y a autant de personnes qui trouvent le produit au
moins très utile que des personnes qui le considèrent au plus très utile.
Le premier quartile (Q1) est "utile" : il y a 25% de répondant qui pensent que la dentifrice
est inutile ou simplement utile .
Le quartile Q3 est « très utile" c'est à dire, il y a 75% de répondant qui trouvent le produit au
plus très utile mais pas indispensable.
Les intervalles (interquartile, interdécile) sont les seuls paramètres de dispersion que l'on
peut déterminer pour les variables ordinales.
intervalle interquartile: il y a au moins 50% des répondants qui estiment que le produit est
utile ou très utile.
Wahiba Kalboussi 18
I.2.Les variables quantitatives
(métriques)
Wahiba Kalboussi 19
Les outils statistiques propres aux
variables quantitatives
Dans le cas d'une variable métrique, la tendance
centrale est mesurée par la moyenne et la dispersion
par la variance ou l'écart type.
Wahiba Kalboussi 20
Mesure de la tendance centrale
La moyenne arithmétique :
La moyenne arithmétique d'une série x1, x2, x3,…, xN est la valeur centrale
de référence. Elle permet de résumer par un seul nombre l'ensemble des
observations de la série. Elle est égale à :
N
= x i
x i =1
Wahiba Kalboussi 21
Mesure de la tendance centrale
Le mode MO:
Si la variable est discrète, le mode correspond à la valeur du caractère pour laquelle l’effectif
est le plus important.
Si la variable est continue, le mode se calcule en deux étapes :
On calcule la classe modale à laquelle correspond l’effectif le plus important.
On calcule ensuite, la valeur du mode :
Wahiba Kalboussi 24
Mo=2000+ 1000(0.46-0.32)/ (0.46-0.32) +(0.46-0.15)
Mo ≈ 2311.1
Mesure de la tendance centrale
La médiane Me
Wahiba Kalboussi 26
Mesure de la tendance centrale
La médiane
Wahiba Kalboussi 28
Wahiba Kalboussi 29
F(275)= 0.3067
F(Me)=0.5
F(295)= 0.6
(295 -275)/(295 –Me) = (0.6 -0.3067)/ (0.6 -0.5)
Me= 288.18
Mesure de dispersion
Wahiba Kalboussi 36
Dispersion relative
Paramètres de forme:
asymétrie et aplatissement
Symétrie
Asymétrie positive
Asymétrie négative
Codification des variables sur SPSS
Vue des variables
Codification d’une Variable qualitative
échelle nominale
Variable: Genre
Codification d’une Variable qualitative
échelle nominale
Vente:
Oui
Non
Gestion:
Oui
Non
Planfication:
Oui
Non
Région:
Gafsa
Gabes
Tunis
Spécialité:
Génie mécanique
Génie électrique
Codification d’une variable ordinale
Degré de satisfaction
Codification d’une Variable
quantitative
Exemple: salaire
Analyse univariée sur SPSS
Wahiba Kalboussi 45
Analyse univariée:
Analyse descriptive
Tri simple
Le calcul de paramètres statistiques
wahiba kalboussi 48
Le calcul de paramètres statistiques
wahiba kalboussi 49
Asymétrie
La distribution normale
Leptokurtique k>0
Mesokutique k=0
Platykurtiquek<0
Wahiba Kalboussi 52
wahiba kalboussi 53
Output de SPSS
Base
wahiba kalboussi 54
Vérification des non réponses
Recherche des erreurs
Utilisation de l’option de recherche
Graphiques
IMPROMOG
600
500
400
300
200
IMMONOPR IMCARREF
400
Fréquence
100 Sigma = 1,16
trés mauv aise
Moy enne = ,2
ni bonne ni m auv ais e
300
0 N = 800,00
-2,0
as 0,0
sez bonne 2,0 4,0 6,0
200
IMPROMOG
100
Fréquence
tres bonne
0
trés mauv aise ni bonne ni m auv ais e tres bonne
as sez mauv aise as sez bonne
IMMONOPR
wahiba kalboussi 58
Wahiba Kalboussi 59