Vous êtes sur la page 1sur 8

CHAPITRE II TRAITEMENTS ELEMENTAIRES

ET ANALYSES UNIVARIEES

Les traitements élémentaires portent sur les opérations de tri et de


présentation des informations. Ils permettent d’effectuer les analyses statistiques
de base, c’est-à-dire les analyses unidimensionnelles ou univariées dont l’objet est
d’obtenir les résultats simples concernant le phénomène étudié en vue de le
comprendre et saisir sa portée.

I ) DEPOUILLEMENT DES DONNEES

Le dépouillement des questionnaires consiste à passer des tableaux de


collecte aux tableaux de distribution par l’intermédiaire d’opérations de tri. Le tri
peut être à plat ou croisé ; il peut être complet ou filtré.

Le tri à plat est la méthode de dépouillement la plus simple. Il permet de


construire des tableaux de distribution unidimensionnelle :

Nbre d’enfants (xi) Effectif des ménages (ni)


1 n1
2 n2
3
4
5 n5
Total n

Tableau unidimensionnel mettant en relation l’effectif


des ménages en fonction du nombre d’enfants à charge

Le tri croisé permet de construire des tableaux de distribution bi ou


multidimensionnelle. Selon la nature de l’information, on obtient des tableaux
d’effectifs dits de contingence, ou des tableaux de valeurs.

1
Marq / Qual Puissance Vitesse Confort Non réponse Total
Renault 4 2 3 1 10
Peugeot 2 2 1 0 5
Mercedes 5 2 1 0 8
Ford 4 1 1 0 6
Fiat 0 0 0 1 1
Total 15 7 6 2 30

Tableau de contingence mettant en relation les variables Marque du véhicule / Qualité

Marque Prix d’acquisition moy


Renault 150
Peugeot 240
Mercedes 360
Ford 180
Fiat 120
Total 210

Tableau de valeurs moyennes

Le tri est complet lorsque le dépouillement s’applique à la totalité des


questionnaires.

Il est filtré si le dépouillement est limité à une partie déterminée des


questionnaires. Le filtre s’impose lorsqu’on veut calculer des paramètres statistiques
en fonction de ceux qui répondent à un critère donné. Dans ce cas, le questionnaire
doit comporter des questions appelées questions filtres.

Par ailleurs, il peut être utile dans le but d’améliorer la présentation des
tableaux, d’éclater des modalités, de les regrouper ou de les supprimer.

II ) ANALYSE STATISTIQUE UNIDIMENSIONNELLE

Elle traite d’une seule variable et permet d’effectuer deux types d’analyses :
une analyse descriptive graphique ou numérique et une analyse explicative au
moyen des tests d’hypothèses et la recherche de lois statistiques.

2
1 ) Analyse unidimensionnelle de variables qualitatives nominales

Les variables qualitatives nominales sont les variables qui offrent le moins de
possibilités en matière de traitement statistique. Seule la fonction de distribution
(des effectifs ou des fréquences) peut être étudiée ; la fonction de répartition n’a
aucun sens et le calcul de paramètre est impossible :

Exemple : Distribution selon les marques de véhicules utilisés

Marque (xi) Effectif (ni) Fréquence (fi)


Renault 28
Peugeot 17
Mercedes 22
Ford 18
Fiat 17
Autre 18
Total 120

1.1- Analyse descriptive

Prend deux formes :

- Description graphique : s’effectue au moyen d’un diagramme circulaire,


diagramme en barres, en tuyaux d’orgue, etc.

- Description numérique : se limite à la détermination de la valeur modale ; dans


notre exemple, le mode correspond à la marque Renault.

1.2- Analyse explicative

Consiste à faire des tests d’hypothèse qui sont, dans le cas de variables
nominales, des tests non paramétriques d’ajustement ou d’adéquation opérés à
l’aide de la loi χ2. Dans notre exemple, on cherche à savoir s’il n’y a pas de
différence significative entre les différentes marques utilisées ou au contraire une
marque se distingue des autres.

3
Hypothèses :

Ho : il n’y a pas de différence entre les marques ou autrement dit il n’y a pas
de différence entre la distribution expérimentale et la distribution théorique ou
uniforme ; c’est l’hypothèse nulle.

H1 : la différence est significative ; c’est l’hypothèse alternative.

Règle de décision du Test du χ2 :

On calcule : dc = (niob – nith)2


nith

Cette statistique suit une loi χ2k-1 sous Ho ; k étant le nombre de modalités de
la variable.

On détermine ensuite une valeur critique dT à partir de la table du χ2 au


niveau de confiance requis (généralement 95 ou 99%).

Si dc < dT alors on accepte Ho et on convient donc de l’absence de


différence significative entre les distributions.

2 ) Analyse unidimensionnelle de variables qualitatives ordinales

Les variables qualitatives ordinales offrent également peu possibilités en


matière d’analyse statistique. Cependant, en plus de la fonction de distribution on
peut construire la fonction de répartition qui permet de faire des interprétations en
termes de cumul.

Exemple : Classement du délai d’obtention

Rang (xi) Effectif (ni) Fréquence (fi)


A 16 0,2
B 30 0,375
C 14 0,175

4
D 12 0,15
E 8 0,1
Total 80 1

2.1- Analyse descriptive

- Description graphique : s’effectue au moyen des diagrammes précédents


(circulaire, en barres, en tuyaux d’orgue), en plus des diagrammes en escaliers
correspondant à la fonction de répartition.

- Description numérique : consiste à déterminer la valeur modale, ainsi que les


quantiles dont le calcul est fondé sur la notion de rang, particulièrement la
médiane.

2.2- Analyse explicative

Le test non paramétrique du χ2 peut être appliqué dans les mêmes conditions
que les variables nominales. Néanmoins, on lui préfère le test spécifiquement conçu
pour les variables ordinales à savoir le test de Kolmogorov-Smirnov (qui n’impose
pas la condition restrictive d’avoir un effectif théorique au moins égal à 5 pour
chaque classe).

Hypothèses :

Ho : il n’y a pas de différence entre les classements de la distribution


expérimentale comparée à la distribution théorique ; c’est l’hypothèse nulle.

H1 : la différence est significative ; c’est l’hypothèse alternative.

Règle de décision du Test :

On calcule l’écart KSc en valeur absolue entre les fréquences cumulées


expérimentales et théoriques au niveau de chaque modalité et on retient l’écart
maximum.

On détermine ensuite une valeur critique KST à partir de la table de


Kolmogorov-Smirnov au seuil requis (5 ou 1%).

5
Si KSc < KST alors on accepte Ho et on convient donc de l’absence de
différence significative entre les distributions.

3 ) Analyse unidimensionnelle de variables quantitatives scalées

Dans ce type d’analyse, on retient généralement l’échelle d’Osgood conçue


comme étant d’intervalles. On estime en effet, que les distances entre les points
sont relativement égales. Notons que l’origine des échelles est totalement
arbitraire ; on peut prendre 1 à 5 ou -2 à 2 ou toute autre échelle, les résultats
seront différents mais leur signification reste la même.

Exemple : Etude de l’efficacité d’un produit

xi Code xi ni ECC xi . ni (xi – )2 . ni


Très ineff 1 15 15 15 41,83
Assez ineff 2 34 49 68 15,26
Juste eff 3 19 68 57 2,07
Assez eff 4 10 78 40 17,69
Très eff 5 12 90 60 65,15
Total - 90 - 240 142

3.1- Analyse descriptive

- Description graphique : diagramme en bâtons et diagramme cumulatif en


escaliers.

- Description numérique : on détermine,

le mode
la médiane
la moyenne arithmétique
la variance
la quasi-variance
les fréquences et éventuellement d’autres indicateurs.

6
3.2- Analyse explicative

On peut effectuer des tests d’ajustement ou d’adéquation comme dans le cas


de variables nominales, mais en plus il y a possibilité de faire des tests
paramétriques.

a- Test d’ajustement du χ2

Hypothèses :

Ho : il n’y a pas de différence significative entre les appréciations de


l’efficacité du produit (hypothèse nulle).

H1 : la différence est significative (hypothèse alternative).

b- Test de signification de la moyenne

La moyenne théorique étant m = 3 (c’est-à-dire juste efficace), on se


demande si l’attitude moyenne est bien l’appréciation juste efficace au niveau de
confiance de 95% (ou 99%).

Si n ≥ 30 alors  N (m ; σ/√n) ou N (m ; s/√n)

Quand n < 30 ;  St(n-1)

Le problème consiste à construire un intervalle [a ; b] autour de m et voir si X est


contenu dans cet intervalle auquel cas on retiendra l’hypothèse H0 d’une attitude
moyenne ‘neutre’.

Tests unidirectionnels (ou unilatéraux) : on résout P (T < t) = niv de conf

Test à gauche : H0 : m = m0
H1 : m < m0

a = m0 – t σ/√n

Test à droite : H0 : m = m0

7
H1 : m > m0

b = m0 + t σ/√n

Test bidirectionnel (ou bilatéral) : on résout P (-t <T < t) = niv de conf

H0 : m = m0
H1 : m ≠ m0

a = m0 – t σ/√n
b = m0 + t σ/√n