Vous êtes sur la page 1sur 7

5.

Analyse des donnes


Statistique descriptive
Statistique infrentielle
Modlisation
Reprsentations graphiques
Pour rsumer sur le traitement statistique

Lanalyse des donnes


Lanalyse des donnes
tapes pralables
La saisie
Le contrle des donnes
Outils : ceux de
la statistique exploratoire, descriptive
la statistique infrentielle
la modlisation
Consiste
Effectuer des tableaux de frquence
Calculer des indicateurs de tendance centrale (moyenne, mdiane, ) ou de
dispersion (variance, cart-type, )
tudier simultanment plusieurs variables (tris-croiss, analyses
factorielles,)
Rechercher leur indpendance ou corrlation
Modliser les relations entre variables
tablir le profil-type dun individu

Sondages et mthodes dchantillonnage 69


Statistique descriptive
tude dune variable

Lanalyse des donnes


Les paramtres de tendance
n
gnrale
1
Moyenne arithmtique : x = xi
n i=1
Mode : valeur de la variable qui correspond au plus grand effectif ou la
plus grande frquence
Mdiane : partage la srie en 2 sous-ensembles gaux
Quantiles : partagent la srie en 4 sous-ensembles gaux
Dciles : partagent la srie en 10 sous-ensembles gaux
Les paramtres de dispersion
n
1
Variance : V ( x) = ( x x ) Aussi appele cart quadratique moyen
i
n i =1
cart-type x : racine carre de la variance

Coefficient de variation : Cv = x
x
Sondages et mthodes dchantillonnage 70

Statistique descriptive
tude de deux variables (1)
Lanalyse des donnes
Tableau de dpart : individus x variables
Variable 1 Variable 2 Variable p
Individu 1
Individu 2

Individu n

Tableau crois : variable x variable


Modalit 1(2) Modalit 2(2) Modalit R(2) TOTAL
Rpartition selon la variable 1

Modalit 1(1)
Modalit 2(1)

Modalit Q(1)
TOTAL Nombre
total
dindividus
Rpartition selon la variable 2
Sondages et mthodes dchantillonnage 71
Statistique descriptive
tude de deux variables (2)

Lanalyse des donnes


3 formes de liaisons entre 2 variables
La liaison nulle ou indpendance : il ny a aucune influence dune
variable sur lautre
La liaison totale ou fonctionnelle
La liaison relative : les variables sont dpendantes lune de lautre
dans une certaine mesure
La mesure du Khi-Deux ()
Mesure lcart lindpendance
La corrlation
tudie la dpendance dune variable quantitative par rapport une
autre variable quantitative

Sondages et mthodes dchantillonnage 72

Statistique descriptive
tude de plusieurs variables (1)
Lanalyse des donnes

tude globale des individus et des variables


Reprsentations graphiques suggestives
Selon le type de problme et la nature des donnes
Analyse en Composantes Principales
Analyse Factorielle des Correspondances Binaires
Analyse Factorielle des Correspondances Multiples

Sondages et mthodes dchantillonnage 73


Statistique descriptive
tude de plusieurs variables (2)

Lanalyse des donnes


LACP
Objectif
tudier et visualiser les proximits, les ressemblances entre individus
tudier les positions des variables, dcomposer les associations entre elles
Phase dinterprtation des rsultats
Donner une signification aux axes
Trouver les individus et les variables responsables de leur existence
LAFC
Objectif
tudier les 2 variables (liaison existant entre elles) et leurs modalits
LACM
Objectifs
tudier les individus, les variables et les modalits
tablir une typologie des individus
tablir un bilan des liaisons entre variables et des ressemblances des modalits
Est toute ddie au traitement des enqutes

Sondages et mthodes dchantillonnage 74

Statistique descriptive
tude de plusieurs variables (3)
Lanalyse des donnes

Les mthodes de classification


Objectif
Structures de regroupement mettant en vidence les phnomnes de
ressemblance
Plusieurs mthodes
La Classification Ascendante Hirarchique
Hirarchie refltant les diffrents degrs de ressemblance entre individus
Le partitionnement
Partition de lensemble des individus en un nombre de classes q fix a priori

Sondages et mthodes dchantillonnage 75


Statistique infrentielle
Estimation et test dhypothses

Lanalyse des donnes


Estimation ponctuelle dun paramtre
Estimation dune esprance mathmatique (moyenne thorique), dune
variance thorique

Encadrement du paramtre inconnu

Test statistique
Rgle de dcision entre 2 hypothses sur un paramtre
2 types de tests
Paramtriques
Portent sur un paramtre de la loi de distribution de la variable
Non paramtriques
Un test statistique est par nature ngatif

Sondages et mthodes dchantillonnage 76

Statistique infrentielle
Modlisation
Lanalyse des donnes
Rgression linaire simple
1 seule variable explicative
Modle yi = 0 + 1 xi + ei
Mthode des moindres carrs ordinaires
Estimations pour 0 et 1

Rgression linaire multiple


Plusieurs variables explicatives
Modle yi = 0 + 1 xi1 + 2 xi 2 + ... + j xij + p xip + ei
Estimation des paramtres de lquation

Sries chronologiques
volution dune variable statistique quantitative repre dans le temps
Dcrit lvolution dune variable quantitative
Facilite llaboration de prvisions
Sondages et mthodes dchantillonnage 77
Reprsentations graphiques

Lanalyse des donnes


Variables qualitatives (non ordinales) Variables qualitatives (ordinales)
Diagramme circulaire ( camembert ) ou quantitatives discrtes
Diagramme en btons/en barres

30

20
Mod1 Mod2 Modk
10
Variables quantitatives (numriques)
0
Histogramme Mod1 Mod2 Modk
40% Boxplot

20%

0%
Classe 1 Classe 2 Classe k
Sondages et mthodes dchantillonnage 78

Pour rsumer sur le traitement statistique


Lanalyse des donnes

Sondages et mthodes dchantillonnage 79


Pour rsumer sur le traitement statistique

Lanalyse des donnes


Sondages et mthodes dchantillonnage 79

Vous aimerez peut-être aussi