Académique Documents
Professionnel Documents
Culture Documents
Mesure de limpact
de la crise ivoirienne du 19 septembre 2002
sur lactivit des entreprises de la ville de Bassam
Ralis par :
CHASSEM Nacisse
DOKO Firmin
KOUETE Vincent
KAMDEM Raoul
OUEDRAOGO Boureima
SANOU Sali
Encadreur : FOHOPA KUE Rmon
Sous la direction de
CHITOU Bassirou, PHD,
Enseignant l'ENSEA d' Abidjan
Mai 2004
IV.7. Estimation par bootstrap des variances des estimateurs des Winzorised means et des
% trimmed means ...................................................................................................................... 12
Conclusion ............................................................................................................................... 14
Bibliographie ........................................................................................................................... 15
Annexes.................................................................................................................................... 16
Annexe 1 : Dictionnaire des variables ........................................................................................... 16
Annexe 2 : Box-plots des variables dintrt ................................................................................ 18
Annexe 3 : Stems and leaves........................................................................................................... 20
Annexe 4: Estimations de winzorised et alpha trimmed means.................................................. 21
Annexe 5 : Bootstrap sur les winzorised means ........................................................................... 22
Annexe 6: Etude des variables dintrt par secteurdactivt .................................................... 26
Annexe 7: Syntaxes SPSS pour lapurement de la base .............................................................. 34
I. Introduction
Les donnes issues des enqutes comportent gnralement de nombreuses incohrences
et dfauts dus la mauvaise comprhension du questionnaire par les enquteurs ou par les
enquts, la mauvaise fois des rpondants, des erreurs de saisie, des rponses aberrantes,
etc. Par ailleurs les non rponses, trs frquentes dans les bases de donnes, rendent caducs
les pondrations calcules selon le plan de sondage ex-ante. Il est alors indispensable de se
doter de techniques afin de redresser les donnes aprs enqute afin de se donner les
meilleures chances dapprocher les vraies valeurs des caractristiques quon cherche
mesurer sur la population.
Les mthodes de traitement et dexploitation des donnes denqute sont des techniques
de correction et destimation qui visent ce double objectif de production de donnes fiables et
destimateurs de qualit. Elles consistent en lapurement, au redressement des non rponses et
au calcul destimateurs fiables et robustes par des techniques qui prennent en compte les
insuffisances plus haut constates dans les donnes (rechantillonnage, post stratification,
mthodes du bootsrap, de Jackknife, ).
Ces techniques dapurement et de calculs destimateurs sont mises en uvre dans cet
article afin dapprhender limpact de la crise ivoirienne du 19 septembre 2002 sur lactivit
conomique des entreprises de la ville de Bassam et plus prcisment sur les lments de leur
compte dexploitation. Ce travail souligne galement, au vu de la description de la base
initiale, la difficult dobtention des donnes et la rigueur qui doit tre adopte dans la
collecte de ces donnes.
Aprs la prsentation dans la section II de la base de donnes sur laquelle porte notre
travail, il est question dans la section III du rtablissement de la cohrence dans
lidentification des entreprises, dans les modalits des rponses, du recodage des Sans
objet et de limputation des non rponses. La section IV est consacre au calcul
destimateurs sur quelques variables dintrt et la section V conclura ce travail.
Tous nos remerciements vont l'endroit de notre enseignant M. CHITOU.
Cycle dactivit
Les variables de dtermination des cycles dactivit des entreprises, codes de Q11
Q14, cherchent dterminer les jours, semaines, mois durant lesquels les activits dune
entreprise sont de forte, moyenne ou faible intensit. Par exemple, au niveau de la variable
Q11, la question pose est : En gnral les priodes ou votre activit marche trs bien,
marche moyennement ou ne marche pas du tout sont-elles dtermines selon le jour, la
semaine ou le mois ? .
-
Niveau de production
Ces questions concernent les montants des chiffres daffaire pour les activits
principales, les activits secondaires et les activits lextrieur de la Cte dIvoire, avant et
aprs le 19 septembre. Elles sont codes de Q181 q1144ap. Par exemple : Q193ap
Combien les activits secondaires de lentreprise rapportent-elles aprs le 19 septembre en
priode de moyenne intensit ?
-
Dautre part, il est important de dterminer parmi les non rponses celles qui sont des
Sans objet cest dire les non rponses (ou rponses) des personnes qui en principe ne
devraient pas rpondre aux questions considres. Cela permet de dterminer les non rponses
effectives afin de faire les imputations.
III.1. Correction des incohrences de la base
Il sagit dabord didentifier de faon unique tous les individus de la base : les individus
de la base doivent avoir les mmes identifiants que ceux de la base de dnombrement mais
des erreurs de saisie introduisent souvent des incohrences entre ces deux variables. Il sagit
galement de contrler la cohrence des modalits des variables discrtes avec celles
proposes par le questionnaire.
a) Identification des observations
Afin didentifier de faon unique chaque observation il est cr une variable Identif2
qui prend la valeur suivante : Identif 2 = 1011 + 109 * Q 01 + 106 * Q 02 + 103 * Q 03 + Q 04 . Les
variables Q01, Q02, Q03, Q04 dsignent respectivement le quartier, llot, la concession et le
numro de lentreprise.
Cette formule est conforme lidentification des entreprises dans le fichier
dnombrement . Aprs avoir confront les nouveaux identifiants ceux de la base de
dnombrement, les entreprises nayant pas de correspondants dans le fichier dnombrement
ont t supprimes de la base. Il a t par suite procd la recherche et suppression des
doublons, aprs avoir vrifi que les doublons portaient exactement les mmes observations.
Au terme de cette premire correction la base comporte 1470 observations au lieu de
1478 initialement.
b) Vrification des modalits des variables qualitatives
Cette vrification consiste assurer la cohrence entre les modalits des rponses avec
celles prvues par le questionnaire. Pour cela nous ralisons un tri -plat sur les variables
qualitatives. Cela a permis de sassurer quil nexiste aucune rponse aberrante au niveau des
variables qualitatives.
III.2. Traitement des non rponses :
a) Les non-rponses brutes
Lun des premiers constats que lon peut faire au vu de la base des donnes brutes est le
nombre impressionnant de valeurs manquantes.
Le taux de non rponse brut va de 0,75% pour la variable Q11 100% pour la variable
Q164av. Mais ces taux de non rponses incluent les non-rponses de type Sans objet et ne
nous permettent pas de dterminer les taux de non rponses effectives. Il a donc t procd
la Recherche et codification des rponses de type Sans objet .
b) Traitement des Sans objet
Les Sans objet ont lieu lorsque la rponse une question exclue celle dune autre
question. Par exemple, pour une entreprise cre aprs le 19 septembre, toutes les rponses ou
les non rponses aux questions concernant ses activits avant le 19 septembre sont des Sans
objet . Lorsquune entreprise dclare avoir un cycle dactivit journalier, il nest plus
pertinent de lui demander comment marchent ses activits dans la premire semaine du mois.
De plus certaines questions sont rserves spcifiquement certaines catgories dactivits.
Par exemple, le taux de remplissage moyen ne concerne que les htels, le nombre moyen de
dparts et le taux moyen de remplissage par dpart ne concernent que les transports.
La syntaxe pour la recodification des sans objet est prsent en annexe. Les Sans
objet ayant t reprs, sont par la suite recods comme suit. Pour les variables une
position (i.e. les modalits sont reprsentes par des nombres un seul chiffre), ils prennent la
valeur 9 ; 99 pour les variables deux positions ; et 9999,99 pour les variables continues. Ces
valeurs sont dclares comme donnes manquantes et ne doivent pas tre prises en compte
dans les calculs des estimateurs. Cela permet de rduire le taux de non rponse puisque les
non rponses restantes concernent uniquement les individus qui nont pas rpondu des
questions auxquelles elles sont censes rpondre. Le tableau ci-dessous donne, les taux de
non-rponses effectifs pour quelques variables.
Sans objet
non
rponse
Taux de non
rponse (%)
priodicit htel
1466
0,00
1466
25,00
1466
25,00
1466
50,00
Variable
1466
100,00
1424
46
3,13
819
296
355
30,24
1047
419
28,58
1266
204
13,88
767
296
407
34,67
955
513
34,95
766
294
410
34,86
962
507
34,51
Malgr la codification des Sans objet , on remarque quil subsiste encore un nombre
important de non rponses. Certaines variables prsentent mme plus de 50% de non rponses
effectives. La section suivante va consister limputation dun certain nombre de variables
dintrt
c) Imputation
Etant donn le taux de non rponses trs important pour certaines variables, il est
impossible dimputer des valeurs aux non rponses de toutes les variables. Aussi, avons-nous
choisi de faire limputation sur quelques variables dintrt et sur les variables qui prsentent
de trs faibles taux de non rponse. Cest le cas des variables sur la dtermination du cycle
dactivit qui ont entirement t imputes. Les variables dintrt sur lesquelles vont porter
le calcul destimateurs ont galement t imputes. Il sagit de lapport principal moyen avant
(q183av) et aprs (q183ap) et de montant marchandises moyen avant (q1113av) et aprs
(q1113av).
-
Nous avons donc essay de dterminer les mcanismes de non rponse pour les
variables concernant les ressources et les charges non financires. Les variables auxiliaires qui
6
nous ont paru pertinentes pour expliquer les non rponses ces variables dintrt sont :
Lactivit principal (Q013), la priodicit de lactivit principale (Q181). Linconvnient
majeur de la variable "activit principale" comme variable auxiliaire est quelle comporte
plusieurs modalits (97 modalits au total dans la base). Ce qui entrane de faibles nombres
d'entreprises par activit et des taux de non rponses atteignant souvent 100% l'intrieur de
ces activits. Nous ne l'avons donc pas utilise comme variable auxiliaire. Par contre, la
variable priodicit de l'activit principale n'a que trois modalits.
Tableau3 : Rpartition des non rponses la question q183av en fonction de la priodicit de lactivit
principal
Priodicit de
Nombre
Pourcentage
l'activit principale d'entreprises
Jour
194
54.6
Hebdo
24
6.8
Mois
110
31.0
Total
328
92.3
Manquantes
27
7.6
Total
355
100
Tableau4 : Rpartition des non rponses la question q1112av en fonction de la priodicit de lactivit
principal
Priodicit de
Nombre
Pourcentage
l'activit principale d'entreprises
Jour
224
55,0
Hebdo
31
7,6
Mois
134
32,9
Total
389
95,6
Manquantes
18
4,4
Total
407
100,0
Les tableaux ci-dessus montrent comment les non rponses aux questions "apport de
l'activit principale" et "montant marchandises" sont rparties en fonction de la priodicit de
l'activit principale. Nous remarquons une rpartition semblable pour les deux variables, ceci
est galement le cas pour la plupart de nos variables d'intrt. Ces tableaux indiquent que plus
de la moiti des non rponses proviennent des entreprises dont le cycle d'activit principale
est journalier. Cependant ces tableaux ne nous permettent pas de conclure quant la relation
entre la priodicit de l'activit principale et les non-rponses nos variables d'intrt puisque
la rpartition des entreprises selon la priodicit de l'activit principale est identique dans la
sous population des non rpondants que dans la population totale.
Jour
Hebdo
Mois
Total
Systme
manquant
Total
effectif pourcentage
906
61,6
118
8,0
400
27,2
1424
96,9
46
3,1
1470
100,0
On ne peut donc pas affirmer que les non rpondants sont les entreprises ayant une
activit principale journalire. Cependant, tant donn la similitude de la rpartition des
entreprises dans les sous populations des non rpondants et dans la population totale en
fonction de la priodicit de l'activit principale, cette dernire peut tre retenue pour
dterminer les proches voisins des non rpondants. Cela a l'avantage de ne pas modifier la
structure de la population.
-
Imputation
Etant donne que la mthode dimputation retenue est celle du plus proche voisin
associe la moyenne, il nous faut caractriser les plus proches voisins.
Nous dfinissons les plus proches voisins dune entreprise comme lensemble des
entreprises ayant la mme priodicit dactivit principale et la mme priodicit pour le
montant dclar. Par exemple lentreprise dont lidentifiant est identif2 = 113411001001 a
une activit principale journalire (Q181=1). Le montant de ces dpenses en matires
premires dclar est un montant mensuel (Q1111=3). Les plus proches voisins de cette
entreprise lorsquon veut imputer ses montants en dpenses de marchandises, sont les
entreprises qui prennent les valeurs Q181=1 et Q1111=3.
Comme nous le disions ci-dessus, la plupart des variables prsentes dans la base de
donnes avaient un nombre lev de valeurs manquantes. Pour limputation, nous avons
choisi les variables qui avaient moins de 40% de non rponses. Les autres variables cest-dire celles ayant plus de 40% de non rponses ont t simplement laisses comme telles.
Parmi les variables que nous avons imputes, certaines sont qualitatives et dautres
quantitatives. Pour les variables quantitatives, limputation est faite en fonction des variables
priodicit de lactivit principale (Q181) et priodicit montant marchandise (Q1111). On
calcule la moyenne de la variable imputer suivant les modalits des ces deux variables et on
laffecte tous les individus qui ont les mmes modalits pour les variables Q181 et Q1111.
Nk
avec N k le
nk
nombre dentreprises du secteur k prvues par le plan de sondage et nk le nombre
dentreprises du secteur k effectivement enqutes.
Pour une entreprise du secteur k, la formule de repondration est : pi =
Secteur
Production
Commerce
Service
Nk
480
730
535
nk
428
597
438
pi
1,121
1,223
1,221
n
La formule de la moyenne de Horwitz and Thomson est Y = h yh o :
h =1 n
nh est leffectif des entreprises du secteur h dans lchantillon ;
n est la taille totale de lchantillon, n=1470; et
yh est la moyenne de Y des entreprises du secteur h dans lchantillon
Les estimateurs des carts types de ces estimateurs sont donns par les formules
2
3
s2
N
V (Y ) = h (1 f h ) h o
nh
h =1 N
N h est lffectif du secteur h dans la population (N1=480 ; N2=730. N3=535)
N = Nh
h =1
fh =
nh
Nh
Min
Max
Somme
Moyenne
EcartType
Skewne
de la moy Ecarttype
ss
Kurtosis
1 388,66
0,02
126,69
10,82
403,21
11,45 176,17
1 739,11
0,02
75,23
8,03
334,83
14,29 243,67
1 393,22
0,03
87,73
7,47
278,84
13,76 266,98
1 743,78
0,03
9000
55,37
6,44
268,77
26,76 859,06
96 556,38
Lestimation de la moyenne montre une forte baisse des apports de lactivit principale
et des montants de dpenses en achats de marchandises et matires premires.
IV.3 Box-plots des variables dintrt
Lanalyse des box-lots des variables Q183av, 183ap, Q1113av, Q1113ap donne des
rsultats identiques et prsente des outliers extrmit droite de chaque distribution. Cela est
bien visible sur le graphique du Box-plot de la variable Q183av. les Box-plots des autres
variables sont reprsentes en annexe.
Figure 1 : Box plot de la variable q183av (Apport principal moyen avant)
apport principal moyen avant
7872
.02
10
Les stems and leaves des variables permettent de compter les outliers. Pour la variables
Q183av par exemple (figure2) les valeurs suprieures 1050 sont considres comme des
outliers. Cela permet didentifier 20 outliers.
Tableau 8 : Nombre doutliers par variable
Variable
Nombre
doutliers
Valeurs
suprieures
Poids des
Outliers ( Pout )
Taux
doutliers
20
12
1050
1000
23.63
13.91
1,70
0,80
14
800
16.65
1,19
11
600
13.21
0,95
Le poids doutliers dsigne la somme des poids individuels des outliers. Ces poids vont
servir pour le calcul de la moyenne de Windzor. La colonne valeurs suprieures dsigne
les montants au del desquels les valeurs sont considres comme outliers. Notons Vmax cette
valeur pour une variable donne.
IV.5. Calcul de la moyenne de Windzor
Cette moyenne prsente lavantage dliminer les effets des valeurs aberrantes qui
peuvent introduire un biais dans le calcul des estimateurs.
a) Formule
On suppose que les valeurs de la variable sont ordonnes de faon croissante et que les
outliers sont les valeurs strictement suprieures Vmax . La formule de Windzor est :
n
1 Vmax
W = pi yi + PoutVmax o nvmax dsigne lordre de Vmax et Pout est le poids des outliers.
n i =1
11
Variable
Apport principal moyen avant
Apport principal moyen aprs
Montant marchandise moyen avant
Montant marchandise moyen aprs
Moyenne de Windzor
102.68
58.44
73.03
42.95
b) Rsultats
Tableau 10 : Estimation par
% trimmed mean
Variable
Apport principal moyen avant
Apport principal moyen aprs
Montant marchandise moyen
avant
Montant marchandise moyen
aprs
% trimmed mean
86.28
50.85
97.51
40.74
L' estimation des moyennes des variables dintrt par la mthode du % trimmed
mean donne des valeurs encore plus faibles que le windzorised mean.
IV.7. Estimation par bootstrap des variances des estimateurs des Winzorised means et
des % trimmed means
Les variances du des Winzorised means et des % trimmed means ne peuvent tre
calcules par des formules analytiques. On utilise donc la mthode du Bootstrap afin de les
estimer.
12
Variable
Valeur
estime
Biais
Ecart
type
102.68
58.44
73.03
44.98
0.35
0.08
0.05
0.20
5.30
3.45
3.76
2.19
% trimmed mean
Variable
Valeur
estime
Biais
Ecart
type
86.28
50.85
64.23
40.74
0.33
0.06
0.07
0.04
3.77
2.46
2.88
1.69
Intervalle de
confiance
95%
Min
Max
93.37 114.13
51.84 65.58
66.57 81.58
41.05 49.74
Intervalle de
confiance 95%
Min
Max
79.52 93.93
46.59 56.92
58.97 70.01
38.04 44.77
13
Conclusion
Dans ce travail, nous avions traiter et exploiter un ensemble de 126 variables
concernant : le cycle dactivit, le niveau de production, les ressources non financires des
entreprises et leurs charges non financires. Le traitement consistait en lapurement et au
redressement des non rponses ou imputation. Au niveau de lexploitation, il sagissait de
calculer des estimateurs fiables et robustes laide des mthodes vues au cours (bootstrap,
Jacknife, ect.).
Au niveau de lapurement, nous avons remarqu quelques incohrences au niveau de
la date de cration des entreprises. Le problme crucial concernait les entreprises qui avaient
dclar tre cres aprs le 19 septembre 2002 et avaient rpondu plusieurs questions qui
concernaient lactivit conomique avant le 19 septembre; Nous avons trait ces entreprises,
dans la suite, comme des entreprises cres avant le 19 septembre.
Pour le redressement des non rponses, nous avons constat aprs apurement et
traitement des sans objets que les variables prsentaient toujours un taux de non rponses
brutes trs lev. Le taux de non rponses de certaines variables avoisinait 90%. Nous avons
dcid dimputer seulement les variables ayant un taux de non rponses brutes de mois de
40%. Pour presque la totalit des variables concernes par limputation, le mcanisme de non
rponse identifi pourrait tre le Not missing at random cest--dire, la probabilit de non
rponse pour la variable dintrt dpend delle-mme ou dautres variables non tudies.
Dans la majorit des cas, la mthode dimputation tait la mthode du plus proche voisin
couple de la mthode de la moyenne.
Une fois les donnes redresses, les variables dintrt que nous avons choisies sont
les apport principal moyen avant et aprs le 19 septembre 2002 et montant marchandise
moyen avant et aprs le 19 septembre 2002 . Il sagissait pour terminer, de donner les
estimateurs fiables et robustes pour ces variables. Les rsultats montrent que ce sont les
estimateurs % trimmed means qui donnent des estimations prcis et robustes.
Comme on peut ce rendre compte, que ce soit lapport principal moyen ou le montant
marchandise moyen, on se rend compte par le baisse des estimations de ces variables au
lendemain de la crise du 19 septembre 2002 que la crise eu cot considrable sur le
fonctionnement de lactivit conomique.
14
Bibliographie
ENSEA (2003), Manuel de codification : Enqute Impact socio conomique de la crise sur
la ville de BASSAM : aspect conomique de la crise , Abidjan, ENSEA.
CHITOU B. (2003), Support du cours sur lexploitation des donnes denqutes, Abidjan,
ENSEA.
DUSSAIX A.
solutions .
15
Annexes
Annexe 1 : Dictionnaire des variables
Variable Libll
Variable
Libll
localite
Localit
dec
q01
Quartier
jodec
q02
Ilot
janv
q03
Concession
jojanv
q04
N Entreprise
fev
ident
Identifiant
jofev
identif2
mars
q071
Jour de crtion
jomars
q072
Mois de cration
q151
Periodicit hotels
q073
Anne de cration
q152av
q08
Nature
q152ap
q013
Activit principale
q153av
q018
Repondant
q153ap
q11
q154av
lun
q154ap
mar
q161
Periodicit transport
mer
q162av
jeu
q162ap
ven
q163av
sam
q163ap
dim
q164av
q164ap
q171
q172av
q172ap
sem1
jo1
sem2
jo2
sem3
q173av
q173ap
sem4
q174av
jo4
q174ap
jo3
sept
q181
josept
q182av
oct
q182ap
jooct
q183av
nov
q183ap
jonov
q184av
16
Variable Libll
Variable
Libll
q184ap
q1134ap
q191
q1141
q192av
q1142av
q192ap
q1142ap
q193av
q1143av
q193ap
q1143ap
q194av
q1144av
q194ap
q1144ap
q1101
q1151
q1152av
q1152ap
q1153av
q1153ap
q1154av
q1154ap
q1111
q1161
q1162av
q1162ap
q1163av
q1163ap
q1164av
q1164ap
q1121
q1171
Periodicit sous-traitance
q1172av
q1172ap
q1173av
q1173ap
q1174av
q1174ap
q1131
17
.02
.02
18
.03
.03
19
45** 00
46** 77
60** 00
70** 00
65** 00
20
27** 66
90** 00
Obs
Weight
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------------------q183ap |
1453
1725.2015
50.8453
97.62976
.02
1000
21
*poids total
qui sum q183av [aw=poids]
local poidstot=r(sum_w)
22
(obs=1470)
Bootstrap statistics
Variable
Reps
Observed
Bias
Std. Err.
------------+---------------------------------------------------------------winzoq183av |
500
102.6786
-.352443
5.301452
92.26267
113.0945
(N)
92.78415
113.2341
(P)
93.37152
114.1259 (BC)
Pour les variables q183ap ; q1113av et q1113ap, le programme se modifie en remplaant les
textes griss suivant le tableau suivant :
Tableau 1
Variable
q183ap
q1113av
q1113ap
description
winq183av
winq183ap
winq1113av
winq1113ap
Nom du programme
q183av
q183ap
q1113av
q1113ap
1000
800
600
Bootstrap statistics
POOUR LA VARIABLE q183ap
Variable
Reps
Observed
Bias
Std. Err.
------------+---------------------------------------------------------------winzoq183ap |
|
500
58.43845
-.0796941
3.450431
51.65928
65.21761
(N)
51.77943
65.42441
(P)
|
51.84245 65.57652 (BC)---------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected
23
Bootstrap statistics
Variable
|
Reps
Observed
Bias
Std. Err.
[95% Conf. Interval]
------------+---------------------------------------------------------------winzoq113av |
500
73.02525 -.0505734
3.761854
65.63423 80.41628 (N)
|
66.36188 80.91783 (P)
|
66.56652 81.58176 (BC)
----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected
Reps
Observed
Bias
Std. Err.
-------------+--------------------------------------------------------------winzoq1113ap |
500
44.97741
-.1995108
2.185894
40.68272
49.2721
(N)
40.80772
49.09934
(P)
41.04801
49.73628 (BC)
Bootstrap statistics
Variable |
Reps
Observed
Bias
Std. Err.
---------+------------------------------------------------------------------bs1 |
500
86.27634
.3286153
3.768796
78.87167
93.681
(N)
79.65116
94.32502
(P)
79.51547
93.93105 (BC)
24
Bootstrap statistics
Variable |
Reps
Observed
Bias
Std. Err.
---------+------------------------------------------------------------------bs1 |
500
50.84529
-.0549498
2.464829
46.00257
55.68802
(N)
46.27514
55.87797
(P)
46.58707
56.92311 (BC)
Variable |
Reps
Observed
Bias
Std. Err.
---------+------------------------------------------------------------------bs1 |
500
64.23357
-.0738211
2.884513
58.56628
69.90085
(N)
58.54799
69.69091
(P)
58.96519
70.0144 (BC)
Reps
Observed
Bias
Std. Err.
---------+------------------------------------------------------------------bs1 |
500
40.74158
.042171
1.688072
37.42498
44.05819
(N)
37.58352
44.15766
(P)
38.03995
44.76864 (BC)
25
1.5
.02
26
.5
27
.11
.02
28
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183ap |
586
37.45999
64.86507
.02
375
.02
29
.2
.1
30
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113av |
462
64.89483
101.6774
.1
800
.03
31
.1
.07
32
.03
33
Les syntaxes pour le recodage des sans objets et limputation des non rponses sont
dun volume trs important, elles ne sont donc pas toutes places en annexe afin de ne pas
trop alourdir le document.
Syntaxe 1 : Rcodage des Sans objet pour les variables de cycle dactvit
* Cration d'une variable av_ap2 tenant compte uniquement des renseignements sur les variables avant.
get files file = "D:\raoul\exploitation_enqute\Gt_Bassam\entretest.sav".
execute.
COMPUTE av_ap2 = 0 .
VARIABLE LABELS av_ap2 'Existence avant le 19 sept 2002 suivant les donnes sur les variables avant' .
value labels av_ap2
1 'Cre avant le 19 sept 2002'
0 'Cre aprs le 19 sept 2002' .
EXECUTE .
DO IF ((q162av >= 0) | (q163av >= 0) | (q164av >= 0) | (q172av >= 0) |
(q173av >= 0) | (q174av >= 0) | (q182av >= 0) | (q183av >= 0) | (q184av >=
0) | (q192av >= 0) | (q193av >= 0) | (q194av >= 0) | (q1102av >= 0) |
(q1103av >= 0) | (q1104av >= 0) | (q1112av >= 0) | (q1113av >= 0) | (q1114av
>= 0) | (q1122av >= 0) | (q1123av >= 0) | (q1124av >= 0) | (q1132av >= 0) |
(q1133av >= 0) | (q1134av >= 0) | (q1142av >= 0) | (q1143av >= 0) | (q1144av
>= 0) | (q1152av >= 0) | (q1153av >= 0) | (q1154av >= 0) | (q1162av >= 0) |
(q1163av >= 0) | (q1164av >= 0) | (q1172av >= 0) | (q1173av >= 0) | (q1174av
>= 0)) .
RECODE
av_ap2 (0=1) .
END IF .
EXECUTE .
FILTER OFF.
USE ALL.
SELECT IF((av_ap=0)&(av_ap2=1)).
EXECUTE .
FREQUENCIES
VARIABLES=q11
/ORDER ANALYSIS .
* 11 valeurs mnquantes pour la variable Determination de la priodicit du cycle d'activit (q11).
* On reporte les valeurs de la priodicit de l'activit principale (q181) .
* les individus 105356005021et 105356002008 presentent des non rponses totales sur toutes les variables
exploitables.
DO IF (MISSING(q11)) .
compute q11 = q181 .
END IF .
EXECUTE .
* Cohrence entre priodicit du cycle d'activit (q11) et Commet marchent vos affaires ...(le jour) de la
semaine.
CROSSTABS
/TABLES=q11 BY lun mar mer jeu ven sam dim
/FORMAT= AVALUE TABLES
/CELLS= COUNT .
*Il ya cohrence mais prsence de valeurs manquantes pour les jours de la semaine.
* Cohrence entre priodicit du cycle d'activit (q11) et Comment marchent vos affaires ...(la semaine) du mois.
CROSSTABS
/TABLES=q11 BY sem1 sem2 sem3 sem4
/FORMAT= AVALUE TABLES
34
/CELLS= COUNT .
* Une entreprise prsente q11=3 et repond sem1=3. on la cherche pour traitement.
* Aprs filtrage. on constate qu c'est une erreur de saisie et on affecte cet individu le code SANS OBJET (9)
pour la variable sem1.
FILTER OFF.
USE ALL.
SELECT IF((q11=3)&(sem1=3)).
EXECUTE .
do if ((q11=3)&(sem1=3)).
recode sem1 (3=9).
end if.
execute.
* Cohrence entre priodicit du cycle d'activit (q11) et Comment marchent vos affaires ...(le mois) de l'anne.
CROSSTABS
/TABLES=q11 BY sept oct nov dec janv fev mars
/FORMAT= AVALUE TABLES
/CELLS= COUNT .
35
/BY periodic.
execute.
if sysmis(q1112av) q1112av=mq1112av.
if sysmis(q1112ap) q1112ap=mq1112ap.
if sysmis(q1113av) q1113av=mq1113av.
if sysmis(q1113ap) q1113ap=mq1113ap.
if sysmis(q1114av) q1114av=mq1114av.
if sysmis(q1114ap) q1114ap=mq1114ap.
execute.
FREQUENCIES
VARIABLES=q1112av q1112ap q1113av q1113ap q1114av q1114ap.
36