Académique Documents
Professionnel Documents
Culture Documents
ASDchap 1
ASDchap 1
Les traitements élémentaires portent sur les opérations de tri et de présentation des
informations. Ils permettent d’effectuer les analyses statistiques de base, c’est-à-dire les
analyses unidimensionnelles ou univariées dont l’objet est d’obtenir les résultats simples
concernant le phénomène étudié en vue de le comprendre et saisir sa portée.
Le dépouillement des questionnaires consiste à passer des tableaux de collecte aux tableaux
de distribution par l’intermédiaire d’opérations de tri. Le tri peut être à plat ou croisé ; il peut
être complet ou filtré.
Le tri à plat est la méthode de dépouillement la plus simple. Il permet de construire des
tableaux de distribution unidimensionnelle :
1
Marque Prix d’acquisition moy
Renault 150
Peugeot 240
Mercedes 360
Ford 180
Fiat 120
Total 210
Tableau de valeurs moyennes
Il est filtré si le dépouillement est limité à une partie déterminée des questionnaires. Le filtre
s’impose lorsqu’on veut calculer des paramètres statistiques en fonction de ceux qui
répondent à un critère donné. Dans ce cas, le questionnaire doit comporter des questions
appelées questions filtres.
Par ailleurs, il peut être utile dans le but d’améliorer la présentation des tableaux, d’éclater des
modalités, de les regrouper ou de les supprimer.
Elles traitent d’une seule variable et permet d’effectuer deux types d’analyses : une analyse
descriptive graphique ou numérique et une analyse explicative au moyen des tests
d’hypothèses et la recherche de lois statistiques.
Les variables qualitatives nominales sont les variables qui offrent le moins de possibilités en
matière de traitement statistique. Seule la fonction de distribution (des effectifs ou des
fréquences) peut être étudiée ; la fonction de répartition n’a aucun sens et le calcul de
paramètre est impossible :
2
1.1- Analyse descriptive
Consiste à faire des tests d’hypothèse qui sont, dans le cas de variables nominales, des tests
non paramétriques d’ajustement ou d’adéquation opérés à l’aide de la loi χ2. Dans notre
exemple, on cherche à savoir s’il n’y a pas de différence significative entre les différentes
marques utilisées ou au contraire une marque se distingue des autres.
- Hypothèses :
Ho : il n’y a pas de différence entre les marques ou autrement dit il n’y a pas de
différence entre la distribution expérimentale et la distribution théorique ou uniforme ; c’est
l’hypothèse nulle.
Cette statistique suit une loi χ2k-1 sous Ho ; k étant le nombre de modalités de la variable.
3
xi niob nith (niob – nith)2 / nith
Renault 28 20 3,2
Peugeot 17 20 0,45
Mercedes 22 20 0,2
Ford 18 20 0,2
Fiat 17 20 0,45
Autre 18 20 0,2
Total 120 120 4,7
Ainsi, dc = 4,7.
Les variables qualitatives ordinales offrent également peu possibilités en matière d’analyse
statistique. Cependant, en plus de la fonction de distribution on peut construire la fonction de
répartition qui permet de faire des interprétations en termes de cumul.
- Description numérique : consiste à déterminer la valeur modale, ainsi que les quantiles dont
le calcul est fondé sur la notion de rang, particulièrement la médiane.
4
2.2- Analyse explicative
Le test non paramétrique du χ2 peut être appliqué dans les mêmes conditions que les variables
nominales. Néanmoins, on lui préfère le test spécifiquement conçu pour les variables
ordinales à savoir le test de Kolmogorov-Smirnov (qui n’impose pas la condition restrictive
d’avoir un effectif théorique au moins égal à 5 pour chaque classe).
- Hypothèses :
5
3 ) Analyse unidimensionnelle de variables quantitatives scalées
Dans ce type d’analyse, on retient généralement l’échelle d’Osgood conçue comme étant
d’intervalles. On estime en effet, que les distances entre les points sont relativement égales.
Notons que l’origine des échelles est totalement arbitraire ; on peut prendre 1 à 5 ou -2 à 2 ou
toute autre échelle, les résultats seront différents mais leur signification reste la même.
le mode
la médiane
la moyenne arithmétique
la quasi-variance
On peut effectuer des tests d’ajustement ou d’adéquation comme dans le cas de variables
nominales, mais en plus il y a possibilité de faire des tests paramétriques.
a- Test d’ajustement du χ2
- Hypothèses :
6
Si dc < dT alors on accepte Ho et on convient donc de l’absence de différence significative
entre les distributions.
dT χ2 4
Test à gauche : H0 : m = m0
H1 : m < m0
a = m0 – t σ/√n
Test à droite : H0 : m = m0
H1 : m > m0
b = m0 + t σ/√n
7
Test bidirectionnel (ou bilatéral) : on résout P (-t < T < t) = niv de conf
H0 : m = m0
H1 : m ≠ m0
a = m0 – t σ/√n
b = m0 + t σ/√n
Les mêmes analyses concernant les variables scalées peuvent être adaptées aux variables
numériques.
- Description graphique :
Il est possible d’effectuer les différents tests décrits précédemment. On peut également
vérifier si les distributions étudiées suivent telle ou telle loi statistique, en particulier la loi
normale.
a- Indicateurs de normalité
Il est souvent intéressant de calculer ces indicateurs pour faire un premier rapprochement
entre les distributions empirique et gaussienne. Lorsque ces paramètres sont suffisamment
proches de 0, l'hypothèse de compatibilité avec la loi normale peut être retenue.
Pour apprécier la forme d’une distribution, il est courant de calculer le coefficient d’asymétrie
ou de dissymétrie de Fisher :
γ1 = µ3
σ3
8
de la même distance
γ1 > 0 distribution asymétrique à droite : les xi s’étalent à droite
γ1 < 0 distribution asymétrique à gauche : les xi s’étalent à gauche.
g = 0 distribution symétrique
g > 0 distribution asymétrique à droite
g < 0 distribution asymétrique à gauche.
γ2 = µ4 - 3
σ4
b- Droite de Henri
Une autre technique graphique, pour établir la normalité, consiste à comparer les distributions
de deux ensembles de données. Il s’agit de construire la droite de Henry d’équation :
H = Xi – m
σ
Si les données sont compatibles avec la loi normale, les points ti seront alignés par rapport à
la droite de Henry tracée.