ASDchap2 PDF

CHAPITRE II TRAITEMENTS ELEMENTAIRES
ET ANALYSES UNIVARIEES
Les traitements élémentaires portent sur les opérations de tri et de

présentation des informations. Ils permettent d’effectuer les analyses statistiques
de base, c’est-à-dire les analyses unidimensionnelles ou univariées dont l’objet est
d’obtenir les résultats simples concernant le phénomène étudié en vue de le
comprendre et saisir sa portée.
I ) DEPOUILLEMENT DES DONNEES
Le dépouillement des questionnaires consiste à passer des tableaux de

collecte aux tableaux de distribution par l’intermédiaire d’opérations de tri. Le tri
peut être à plat ou croisé ; il peut être complet ou filtré.
Le tri à plat est la méthode de dépouillement la plus simple. Il permet de

construire des tableaux de distribution unidimensionnelle :
Nbre d’enfants (xi) Effectif des ménages (ni)

1 n1
2 n2
3
4
5 n5
Total n
Tableau unidimensionnel mettant en relation l’effectif

des ménages en fonction du nombre d’enfants à charge
Le tri croisé permet de construire des tableaux de distribution bi ou

multidimensionnelle. Selon la nature de l’information, on obtient des tableaux
d’effectifs dits de contingence, ou des tableaux de valeurs.
1
Marq / Qual Puissance Vitesse Confort Non réponse Total
Renault 4 2 3 1 10
Peugeot 2 2 1 0 5
Mercedes 5 2 1 0 8
Ford 4 1 1 0 6
Fiat 0 0 0 1 1
Total 15 7 6 2 30
Tableau de contingence mettant en relation les variables Marque du véhicule / Qualité
Marque Prix d’acquisition moy

Renault 150
Peugeot 240
Mercedes 360
Ford 180
Fiat 120
Total 210
Tableau de valeurs moyennes
Le tri est complet lorsque le dépouillement s’applique à la totalité des

questionnaires.
Il est filtré si le dépouillement est limité à une partie déterminée des

questionnaires. Le filtre s’impose lorsqu’on veut calculer des paramètres statistiques
en fonction de ceux qui répondent à un critère donné. Dans ce cas, le questionnaire
doit comporter des questions appelées questions filtres.
Par ailleurs, il peut être utile dans le but d’améliorer la présentation des
tableaux, d’éclater des modalités, de les regrouper ou de les supprimer.
II ) ANALYSE STATISTIQUE UNIDIMENSIONNELLE
Elle traite d’une seule variable et permet d’effectuer deux types d’analyses :
une analyse descriptive graphique ou numérique et une analyse explicative au
moyen des tests d’hypothèses et la recherche de lois statistiques.
2
1 ) Analyse unidimensionnelle de variables qualitatives nominales
Les variables qualitatives nominales sont les variables qui offrent le moins de
possibilités en matière de traitement statistique. Seule la fonction de distribution
(des effectifs ou des fréquences) peut être étudiée ; la fonction de répartition n’a
aucun sens et le calcul de paramètre est impossible :
Exemple : Distribution selon les marques de véhicules utilisés
Marque (xi) Effectif (ni) Fréquence (fi)

Renault 28
Peugeot 17
Mercedes 22
Ford 18
Fiat 17
Autre 18
Total 120
1.1- Analyse descriptive
Prend deux formes :
- Description graphique : s’effectue au moyen d’un diagramme circulaire,

diagramme en barres, en tuyaux d’orgue, etc.
- Description numérique : se limite à la détermination de la valeur modale ; dans

notre exemple, le mode correspond à la marque Renault.
1.2- Analyse explicative
Consiste à faire des tests d’hypothèse qui sont, dans le cas de variables
nominales, des tests non paramétriques d’ajustement ou d’adéquation opérés à
l’aide de la loi χ2. Dans notre exemple, on cherche à savoir s’il n’y a pas de
différence significative entre les différentes marques utilisées ou au contraire une
marque se distingue des autres.
3
Hypothèses :
Ho : il n’y a pas de différence entre les marques ou autrement dit il n’y a pas
de différence entre la distribution expérimentale et la distribution théorique ou
uniforme ; c’est l’hypothèse nulle.
H1 : la différence est significative ; c’est l’hypothèse alternative.
Règle de décision du Test du χ2 :
On calcule : dc = (niob – nith)2

nith
Cette statistique suit une loi χ2k-1 sous Ho ; k étant le nombre de modalités de
la variable.
On détermine ensuite une valeur critique dT à partir de la table du χ2 au

niveau de confiance requis (généralement 95 ou 99%).
Si dc < dT alors on accepte Ho et on convient donc de l’absence de

différence significative entre les distributions.
2 ) Analyse unidimensionnelle de variables qualitatives ordinales
Les variables qualitatives ordinales offrent également peu possibilités en

matière d’analyse statistique. Cependant, en plus de la fonction de distribution on
peut construire la fonction de répartition qui permet de faire des interprétations en
termes de cumul.
Exemple : Classement du délai d’obtention
Rang (xi) Effectif (ni) Fréquence (fi)

A 16 0,2
B 30 0,375
C 14 0,175
4
D 12 0,15
E 8 0,1
Total 80 1
- Description graphique : s’effectue au moyen des diagrammes précédents

(circulaire, en barres, en tuyaux d’orgue), en plus des diagrammes en escaliers
correspondant à la fonction de répartition.
- Description numérique : consiste à déterminer la valeur modale, ainsi que les

quantiles dont le calcul est fondé sur la notion de rang, particulièrement la
médiane.
Le test non paramétrique du χ2 peut être appliqué dans les mêmes conditions
que les variables nominales. Néanmoins, on lui préfère le test spécifiquement conçu
pour les variables ordinales à savoir le test de Kolmogorov-Smirnov (qui n’impose
pas la condition restrictive d’avoir un effectif théorique au moins égal à 5 pour
chaque classe).
Hypothèses :
Ho : il n’y a pas de différence entre les classements de la distribution

expérimentale comparée à la distribution théorique ; c’est l’hypothèse nulle.
H1 : la différence est significative ; c’est l’hypothèse alternative.
Règle de décision du Test :
On calcule l’écart KSc en valeur absolue entre les fréquences cumulées

expérimentales et théoriques au niveau de chaque modalité et on retient l’écart
maximum.
On détermine ensuite une valeur critique KST à partir de la table de

Kolmogorov-Smirnov au seuil requis (5 ou 1%).
5
Si KSc < KST alors on accepte Ho et on convient donc de l’absence de
différence significative entre les distributions.
3 ) Analyse unidimensionnelle de variables quantitatives scalées
Dans ce type d’analyse, on retient généralement l’échelle d’Osgood conçue

comme étant d’intervalles. On estime en effet, que les distances entre les points
sont relativement égales. Notons que l’origine des échelles est totalement
arbitraire ; on peut prendre 1 à 5 ou -2 à 2 ou toute autre échelle, les résultats
seront différents mais leur signification reste la même.
Exemple : Etude de l’efficacité d’un produit
xi Code xi ni ECC xi . ni (xi – )2 . ni

Très ineff 1 15 15 15 41,83
Assez ineff 2 34 49 68 15,26
Juste eff 3 19 68 57 2,07
Assez eff 4 10 78 40 17,69
Très eff 5 12 90 60 65,15
Total - 90 - 240 142
- Description graphique : diagramme en bâtons et diagramme cumulatif en

escaliers.
- Description numérique : on détermine,
le mode
la médiane
la moyenne arithmétique
la variance
la quasi-variance
les fréquences et éventuellement d’autres indicateurs.
6
On peut effectuer des tests d’ajustement ou d’adéquation comme dans le cas

de variables nominales, mais en plus il y a possibilité de faire des tests
paramétriques.
a- Test d’ajustement du χ2
Hypothèses :
Ho : il n’y a pas de différence significative entre les appréciations de

l’efficacité du produit (hypothèse nulle).
H1 : la différence est significative (hypothèse alternative).
b- Test de signification de la moyenne
La moyenne théorique étant m = 3 (c’est-à-dire juste efficace), on se

demande si l’attitude moyenne est bien l’appréciation juste efficace au niveau de
confiance de 95% (ou 99%).
Si n ≥ 30 alors  N (m ; σ/√n) ou N (m ; s/√n)
Quand n < 30 ;  St(n-1)
Le problème consiste à construire un intervalle [a ; b] autour de m et voir si X est

contenu dans cet intervalle auquel cas on retiendra l’hypothèse H0 d’une attitude
moyenne ‘neutre’.
Tests unidirectionnels (ou unilatéraux) : on résout P (T < t) = niv de conf
Test à gauche : H0 : m = m0
H1 : m < m0
a = m0 – t σ/√n
Test à droite : H0 : m = m0
7
H1 : m > m0
b = m0 + t σ/√n
Test bidirectionnel (ou bilatéral) : on résout P (-t <T < t) = niv de conf
H0 : m = m0
H1 : m ≠ m0
a = m0 – t σ/√n
b = m0 + t σ/√n

ASDchap2 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

ASDchap2 PDF

Transféré par

Droits d'auteur :

Formats disponibles

CHAPITRE II TRAITEMENTS ELEMENTAIRES

Les traitements élémentaires portent sur les opérations de tri et de

I ) DEPOUILLEMENT DES DONNEES

Le dépouillement des questionnaires consiste à passer des tableaux de

Le tri à plat est la méthode de dépouillement la plus simple. Il permet de

Nbre d’enfants (xi) Effectif des ménages (ni)

Tableau unidimensionnel mettant en relation l’effectif

Le tri croisé permet de construire des tableaux de distribution bi ou

Tableau de contingence mettant en relation les variables Marque du véhicule / Qualité

Marque Prix d’acquisition moy

Tableau de valeurs moyennes

Le tri est complet lorsque le dépouillement s’applique à la totalité des

Il est filtré si le dépouillement est limité à une partie déterminée des

II ) ANALYSE STATISTIQUE UNIDIMENSIONNELLE

Exemple : Distribution selon les marques de véhicules utilisés

Marque (xi) Effectif (ni) Fréquence (fi)

1.1- Analyse descriptive

Prend deux formes :

- Description graphique : s’effectue au moyen d’un diagramme circulaire,

- Description numérique : se limite à la détermination de la valeur modale ; dans

1.2- Analyse explicative

H1 : la différence est significative ; c’est l’hypothèse alternative.

Règle de décision du Test du χ2 :

On calcule : dc = (niob – nith)2

On détermine ensuite une valeur critique dT à partir de la table du χ2 au

Si dc < dT alors on accepte Ho et on convient donc de l’absence de

2 ) Analyse unidimensionnelle de variables qualitatives ordinales

Les variables qualitatives ordinales offrent également peu possibilités en

Exemple : Classement du délai d’obtention

Rang (xi) Effectif (ni) Fréquence (fi)

2.1- Analyse descriptive

- Description graphique : s’effectue au moyen des diagrammes précédents

- Description numérique : consiste à déterminer la valeur modale, ainsi que les

2.2- Analyse explicative

Ho : il n’y a pas de différence entre les classements de la distribution

H1 : la différence est significative ; c’est l’hypothèse alternative.

Règle de décision du Test :

On calcule l’écart KSc en valeur absolue entre les fréquences cumulées

On détermine ensuite une valeur critique KST à partir de la table de

3 ) Analyse unidimensionnelle de variables quantitatives scalées

Dans ce type d’analyse, on retient généralement l’échelle d’Osgood conçue

Exemple : Etude de l’efficacité d’un produit

xi Code xi ni ECC xi . ni (xi – )2 . ni

3.1- Analyse descriptive

- Description graphique : diagramme en bâtons et diagramme cumulatif en

- Description numérique : on détermine,

On peut effectuer des tests d’ajustement ou d’adéquation comme dans le cas

Ho : il n’y a pas de différence significative entre les appréciations de

H1 : la différence est significative (hypothèse alternative).

b- Test de signification de la moyenne

La moyenne théorique étant m = 3 (c’est-à-dire juste efficace), on se

Si n ≥ 30 alors  N (m ; σ/√n) ou N (m ; s/√n)

Quand n < 30 ;  St(n-1)

Le problème consiste à construire un intervalle [a ; b] autour de m et voir si X est

Tests unidirectionnels (ou unilatéraux) : on résout P (T < t) = niv de conf

Vous aimerez peut-être aussi