Vous êtes sur la page 1sur 37

RPUBLIQUE DE LA COTE DIVOIRE

Union Discipline Travail


*****************************
Ministre de lEnseignement Suprieur
***************************
cole Nationale Suprieure de Statistique et dconomie Applique
dAbidjan (E.N.S.E.A)
**********************

Mmoire d'Exploitation de Donnes dEnqutes

Mesure de limpact
de la crise ivoirienne du 19 septembre 2002
sur lactivit des entreprises de la ville de Bassam

Ralis par :
CHASSEM Nacisse
DOKO Firmin
KOUETE Vincent
KAMDEM Raoul
OUEDRAOGO Boureima
SANOU Sali
Encadreur : FOHOPA KUE Rmon

Sous la direction de
CHITOU Bassirou, PHD,
Enseignant l'ENSEA d' Abidjan

Mai 2004

Table des matires


I. Introduction ........................................................................................................................... 2
II. Prsentation de la base des donnes.................................................................................... 3
III. Traitement de la base.......................................................................................................... 4
III.1. Correction des incohrences de la base ................................................................................. 4
a) Identification des observations .................................................................................................................. 4
b) Vrification des modalits des variables qualitatives................................................................................ 4

III.2. Traitement des non rponses : ............................................................................................... 4


a) Les non-rponses brutes ............................................................................................................................ 4
b) Traitement des Sans objet .................................................................................................................... 5
c) Imputation ................................................................................................................................................. 6

IV. Calcul des estimateurs......................................................................................................... 9


IV.1 Repondration des entreprises enqutes............................................................................... 9
a) But ............................................................................................................................................................. 9
b) Formule ..................................................................................................................................................... 9

IV.2. Estimateurs de Horwitz and Thomson .................................................................................. 9


a) Intrt de la moyenne de Horwitz-Thomson ............................................................................................. 9
b) Formules.................................................................................................................................................... 9
c) Tableau des rsultats destimation........................................................................................................... 10

IV.3 Box-plots des variables dintrt ........................................................................................... 10


IV.4. Stems and leaves des variables dintrt ............................................................................ 10
a) Formule ................................................................................................................................................... 11
b) Tableau des rsultats ............................................................................................................................... 12

IV.6. Calcul des % trimmed mean ........................................................................................... 12


a) Formule ................................................................................................................................................... 12
b) Rsultats .................................................................................................................................................. 12

IV.7. Estimation par bootstrap des variances des estimateurs des Winzorised means et des
% trimmed means ...................................................................................................................... 12

Conclusion ............................................................................................................................... 14
Bibliographie ........................................................................................................................... 15
Annexes.................................................................................................................................... 16
Annexe 1 : Dictionnaire des variables ........................................................................................... 16
Annexe 2 : Box-plots des variables dintrt ................................................................................ 18
Annexe 3 : Stems and leaves........................................................................................................... 20
Annexe 4: Estimations de winzorised et alpha trimmed means.................................................. 21
Annexe 5 : Bootstrap sur les winzorised means ........................................................................... 22
Annexe 6: Etude des variables dintrt par secteurdactivt .................................................... 26
Annexe 7: Syntaxes SPSS pour lapurement de la base .............................................................. 34

I. Introduction
Les donnes issues des enqutes comportent gnralement de nombreuses incohrences
et dfauts dus la mauvaise comprhension du questionnaire par les enquteurs ou par les
enquts, la mauvaise fois des rpondants, des erreurs de saisie, des rponses aberrantes,
etc. Par ailleurs les non rponses, trs frquentes dans les bases de donnes, rendent caducs
les pondrations calcules selon le plan de sondage ex-ante. Il est alors indispensable de se
doter de techniques afin de redresser les donnes aprs enqute afin de se donner les
meilleures chances dapprocher les vraies valeurs des caractristiques quon cherche
mesurer sur la population.
Les mthodes de traitement et dexploitation des donnes denqute sont des techniques
de correction et destimation qui visent ce double objectif de production de donnes fiables et
destimateurs de qualit. Elles consistent en lapurement, au redressement des non rponses et
au calcul destimateurs fiables et robustes par des techniques qui prennent en compte les
insuffisances plus haut constates dans les donnes (rechantillonnage, post stratification,
mthodes du bootsrap, de Jackknife, ).
Ces techniques dapurement et de calculs destimateurs sont mises en uvre dans cet
article afin dapprhender limpact de la crise ivoirienne du 19 septembre 2002 sur lactivit
conomique des entreprises de la ville de Bassam et plus prcisment sur les lments de leur
compte dexploitation. Ce travail souligne galement, au vu de la description de la base
initiale, la difficult dobtention des donnes et la rigueur qui doit tre adopte dans la
collecte de ces donnes.
Aprs la prsentation dans la section II de la base de donnes sur laquelle porte notre
travail, il est question dans la section III du rtablissement de la cohrence dans
lidentification des entreprises, dans les modalits des rponses, du recodage des Sans
objet et de limputation des non rponses. La section IV est consacre au calcul
destimateurs sur quelques variables dintrt et la section V conclura ce travail.
Tous nos remerciements vont l'endroit de notre enseignant M. CHITOU.

II. Prsentation de la base des donnes


La base sur laquelle porte notre travail est la base des donnes sur les entreprises issue
de lenqute sur limpact de la crise Ivoirienne du 19 septembre 2002 sur la ville de
BASSAM. Nous travaillons plus prcisment sur des variables concernant le cycle dactivit,
le niveau de production, les ressources non financires des entreprises et sur leurs charges non
financires. 126 variables sont concernes et sont codes de Q11 Q1174ap.
-

Cycle dactivit

Les variables de dtermination des cycles dactivit des entreprises, codes de Q11
Q14, cherchent dterminer les jours, semaines, mois durant lesquels les activits dune
entreprise sont de forte, moyenne ou faible intensit. Par exemple, au niveau de la variable
Q11, la question pose est : En gnral les priodes ou votre activit marche trs bien,
marche moyennement ou ne marche pas du tout sont-elles dtermines selon le jour, la
semaine ou le mois ? .
-

Niveau de production

La dtermination du niveau de production selon les cycles dactivit avant et aprs le 19


septembre 2002, ne concerne que les activits htelires et de transport. Ces questions sont
codes de Q151av Q174ap. Elles cherchent dterminer les taux de remplissage, le nombre
de dparts (transport) pendant les priodes de forte, moyenne et basse intensit. Par exemple :
Q152av Si htel : quel tait le taux de remplissage moyen de votre rceptif avant le 19
septembre en priode de forte intensit ?
-

Estimation des ressources non financires

Ces questions concernent les montants des chiffres daffaire pour les activits
principales, les activits secondaires et les activits lextrieur de la Cte dIvoire, avant et
aprs le 19 septembre. Elles sont codes de Q181 q1144ap. Par exemple : Q193ap
Combien les activits secondaires de lentreprise rapportent-elles aprs le 19 septembre en
priode de moyenne intensit ?
-

Estimation des charges non financires

Ces questions vont de Q1111 Q1174ap et concernent la dtermination du montant des


dpenses en achats de marchandises et matires premires, en achats des fournitures, en
consommation dnergie, en transport, en traitement du personnel, en charges locatives et en
charges de sous traitance, lis aux activits de lentreprise, avant et aprs le 19 Septembre.
Exemple : Q1143 av Quel tait le montant des dpenses des transport, lies aux activit de
lentreprise avant le 19 Septembre 2002 ? .

III. Traitement de la base


La base des donnes de lenqute telle que saisie initialement contient de nombreuses
incohrences dues des causes diverses :
-

rponses incohrentes des enquts ;


erreurs de saisie ;

Dautre part, il est important de dterminer parmi les non rponses celles qui sont des
Sans objet cest dire les non rponses (ou rponses) des personnes qui en principe ne
devraient pas rpondre aux questions considres. Cela permet de dterminer les non rponses
effectives afin de faire les imputations.
III.1. Correction des incohrences de la base
Il sagit dabord didentifier de faon unique tous les individus de la base : les individus
de la base doivent avoir les mmes identifiants que ceux de la base de dnombrement mais
des erreurs de saisie introduisent souvent des incohrences entre ces deux variables. Il sagit
galement de contrler la cohrence des modalits des variables discrtes avec celles
proposes par le questionnaire.
a) Identification des observations
Afin didentifier de faon unique chaque observation il est cr une variable Identif2
qui prend la valeur suivante : Identif 2 = 1011 + 109 * Q 01 + 106 * Q 02 + 103 * Q 03 + Q 04 . Les
variables Q01, Q02, Q03, Q04 dsignent respectivement le quartier, llot, la concession et le
numro de lentreprise.
Cette formule est conforme lidentification des entreprises dans le fichier
dnombrement . Aprs avoir confront les nouveaux identifiants ceux de la base de
dnombrement, les entreprises nayant pas de correspondants dans le fichier dnombrement
ont t supprimes de la base. Il a t par suite procd la recherche et suppression des
doublons, aprs avoir vrifi que les doublons portaient exactement les mmes observations.
Au terme de cette premire correction la base comporte 1470 observations au lieu de
1478 initialement.
b) Vrification des modalits des variables qualitatives
Cette vrification consiste assurer la cohrence entre les modalits des rponses avec
celles prvues par le questionnaire. Pour cela nous ralisons un tri -plat sur les variables
qualitatives. Cela a permis de sassurer quil nexiste aucune rponse aberrante au niveau des
variables qualitatives.
III.2. Traitement des non rponses :
a) Les non-rponses brutes
Lun des premiers constats que lon peut faire au vu de la base des donnes brutes est le
nombre impressionnant de valeurs manquantes.

Tableau1 : Taux de valeurs manquantes pour quelques variables


Valide
Manquante taux de manquantes
Question
1459
11
0,75
Dtermination priodes d'activit
1424
46
3,13
Priodicit activit principale
1266
204
13,88
Priodicit montant marchandises
588
882
60,00
Montant fournitures moyen aprs
582
888
60,41
Montant transport fort avant
570
900
61,22
Charges locatives fort aprs
565
905
61,56
Montant fournitures fort aprs
557
913
62,11
Montant nergie moyen avant
552
918
62,45
Montant transport bas avant
550
920
62,59
Montant nergie fort aprs
547
923
62,79
Charges locatives moyen avant
530
940
63,95
Montant fournitures moyen avant
2
1468
99,86
Taux htels bas aprs
2
1468
99,86
Nombre dpart fort avant
2
1468
99,86
Nombre dpart moyen avant
1
1469
99,93
Nombre dpart bas aprs
0
1470
100,00
Nombre dpart bas avant

Le taux de non rponse brut va de 0,75% pour la variable Q11 100% pour la variable
Q164av. Mais ces taux de non rponses incluent les non-rponses de type Sans objet et ne
nous permettent pas de dterminer les taux de non rponses effectives. Il a donc t procd
la Recherche et codification des rponses de type Sans objet .
b) Traitement des Sans objet
Les Sans objet ont lieu lorsque la rponse une question exclue celle dune autre
question. Par exemple, pour une entreprise cre aprs le 19 septembre, toutes les rponses ou
les non rponses aux questions concernant ses activits avant le 19 septembre sont des Sans
objet . Lorsquune entreprise dclare avoir un cycle dactivit journalier, il nest plus
pertinent de lui demander comment marchent ses activits dans la premire semaine du mois.
De plus certaines questions sont rserves spcifiquement certaines catgories dactivits.
Par exemple, le taux de remplissage moyen ne concerne que les htels, le nombre moyen de
dparts et le taux moyen de remplissage par dpart ne concernent que les transports.
La syntaxe pour la recodification des sans objet est prsent en annexe. Les Sans
objet ayant t reprs, sont par la suite recods comme suit. Pour les variables une
position (i.e. les modalits sont reprsentes par des nombres un seul chiffre), ils prennent la
valeur 9 ; 99 pour les variables deux positions ; et 9999,99 pour les variables continues. Ces
valeurs sont dclares comme donnes manquantes et ne doivent pas tre prises en compte
dans les calculs des estimateurs. Cela permet de rduire le taux de non rponse puisque les
non rponses restantes concernent uniquement les individus qui nont pas rpondu des
questions auxquelles elles sont censes rpondre. Le tableau ci-dessous donne, les taux de
non-rponses effectifs pour quelques variables.

Tableau2 : Taux de non rponses effectives pour quelques variables


Rponses

Sans objet

non
rponse

Taux de non
rponse (%)

priodicit htel

1466

0,00

taux htel fort avant

1466

25,00

taux htel fort aprs

1466

25,00

nombre dpart moyen aprs

1466

50,00

Variable

nombre dpart bas aprs

1466

100,00

priodicit activit principale

1424

46

3,13

apport principal moyen avant

819

296

355

30,24

apport principal moyen aprs

1047

419

28,58

priodicit montant marchandises

1266

204

13,88

montant marchandises fort avant

767

296

407

34,67

montant marchandises fort aprs

955

513

34,95

montant marchandises moyen avant

766

294

410

34,86

montant marchandises moyen aprs

962

507

34,51

Malgr la codification des Sans objet , on remarque quil subsiste encore un nombre
important de non rponses. Certaines variables prsentent mme plus de 50% de non rponses
effectives. La section suivante va consister limputation dun certain nombre de variables
dintrt
c) Imputation
Etant donn le taux de non rponses trs important pour certaines variables, il est
impossible dimputer des valeurs aux non rponses de toutes les variables. Aussi, avons-nous
choisi de faire limputation sur quelques variables dintrt et sur les variables qui prsentent
de trs faibles taux de non rponse. Cest le cas des variables sur la dtermination du cycle
dactivit qui ont entirement t imputes. Les variables dintrt sur lesquelles vont porter
le calcul destimateurs ont galement t imputes. Il sagit de lapport principal moyen avant
(q183av) et aprs (q183ap) et de montant marchandises moyen avant (q1113av) et aprs
(q1113av).
-

Recherche des mcanismes de non rponse

Afin de dterminer la meilleure mthode dimputation dune variable, il est ncessaire


de connatre son mcanisme de non rponse. Il sagit de caractriser si possible, par une ou
plusieurs autres variables, les individus qui n'ont pas rpondu la question. Il existe trois
mcanismes possibles de non rponse :
-

Le Missing Completly at Random (MCR), la probabilit de non rponse pour la


variable dintrt est la mme pour toutes les units de la population et ne dpend ni
des variables auxiliaires, ni de la variable dintrt elle-mme.

Le Missing at Random (MAR), la probabilit de non rponse pour la variable dintrt


dpend dune ou de plusieurs variables auxiliaires

Le Non Missing at Random (NMR), la probabilit de non rponse de la variable


dintrt dpend de la variable dintrt ou dune autre variable non prsente dans le
questionnaire ou non tudi.

Nous avons donc essay de dterminer les mcanismes de non rponse pour les
variables concernant les ressources et les charges non financires. Les variables auxiliaires qui
6

nous ont paru pertinentes pour expliquer les non rponses ces variables dintrt sont :
Lactivit principal (Q013), la priodicit de lactivit principale (Q181). Linconvnient
majeur de la variable "activit principale" comme variable auxiliaire est quelle comporte
plusieurs modalits (97 modalits au total dans la base). Ce qui entrane de faibles nombres
d'entreprises par activit et des taux de non rponses atteignant souvent 100% l'intrieur de
ces activits. Nous ne l'avons donc pas utilise comme variable auxiliaire. Par contre, la
variable priodicit de l'activit principale n'a que trois modalits.
Tableau3 : Rpartition des non rponses la question q183av en fonction de la priodicit de lactivit
principal

Priodicit de
Nombre
Pourcentage
l'activit principale d'entreprises
Jour
194
54.6
Hebdo
24
6.8
Mois
110
31.0
Total
328
92.3
Manquantes
27
7.6
Total
355
100
Tableau4 : Rpartition des non rponses la question q1112av en fonction de la priodicit de lactivit
principal

Priodicit de
Nombre
Pourcentage
l'activit principale d'entreprises
Jour
224
55,0
Hebdo
31
7,6
Mois
134
32,9
Total
389
95,6
Manquantes
18
4,4
Total
407
100,0
Les tableaux ci-dessus montrent comment les non rponses aux questions "apport de
l'activit principale" et "montant marchandises" sont rparties en fonction de la priodicit de
l'activit principale. Nous remarquons une rpartition semblable pour les deux variables, ceci
est galement le cas pour la plupart de nos variables d'intrt. Ces tableaux indiquent que plus
de la moiti des non rponses proviennent des entreprises dont le cycle d'activit principale
est journalier. Cependant ces tableaux ne nous permettent pas de conclure quant la relation
entre la priodicit de l'activit principale et les non-rponses nos variables d'intrt puisque
la rpartition des entreprises selon la priodicit de l'activit principale est identique dans la
sous population des non rpondants que dans la population totale.

Tableau5 : Rpartition des entreprises en fonction de la priodicit de l'activit principale l'intrieur de


la population totale

Jour
Hebdo
Mois
Total
Systme
manquant
Total

effectif pourcentage
906
61,6
118
8,0
400
27,2
1424
96,9
46

3,1

1470

100,0

On ne peut donc pas affirmer que les non rpondants sont les entreprises ayant une
activit principale journalire. Cependant, tant donn la similitude de la rpartition des
entreprises dans les sous populations des non rpondants et dans la population totale en
fonction de la priodicit de l'activit principale, cette dernire peut tre retenue pour
dterminer les proches voisins des non rpondants. Cela a l'avantage de ne pas modifier la
structure de la population.
-

Imputation

Etant donne que la mthode dimputation retenue est celle du plus proche voisin
associe la moyenne, il nous faut caractriser les plus proches voisins.
Nous dfinissons les plus proches voisins dune entreprise comme lensemble des
entreprises ayant la mme priodicit dactivit principale et la mme priodicit pour le
montant dclar. Par exemple lentreprise dont lidentifiant est identif2 = 113411001001 a
une activit principale journalire (Q181=1). Le montant de ces dpenses en matires
premires dclar est un montant mensuel (Q1111=3). Les plus proches voisins de cette
entreprise lorsquon veut imputer ses montants en dpenses de marchandises, sont les
entreprises qui prennent les valeurs Q181=1 et Q1111=3.
Comme nous le disions ci-dessus, la plupart des variables prsentes dans la base de
donnes avaient un nombre lev de valeurs manquantes. Pour limputation, nous avons
choisi les variables qui avaient moins de 40% de non rponses. Les autres variables cest-dire celles ayant plus de 40% de non rponses ont t simplement laisses comme telles.
Parmi les variables que nous avons imputes, certaines sont qualitatives et dautres
quantitatives. Pour les variables quantitatives, limputation est faite en fonction des variables
priodicit de lactivit principale (Q181) et priodicit montant marchandise (Q1111). On
calcule la moyenne de la variable imputer suivant les modalits des ces deux variables et on
laffecte tous les individus qui ont les mmes modalits pour les variables Q181 et Q1111.

IV. Calcul des estimateurs


IV.1 Repondration des entreprises enqutes
a) But
Le problme de la repondration survient du fait que les entreprises prvues dans le plan
de sondage nont pas t toutes enqutes. En effet, le plan de sondage prvoyait 1745
entreprises parmi lesquelles 480 entreprises du secteur informel de production, 730
entreprises du secteur informel de commerce et 535 entreprises du secteur informel de
service. Ont t effectivement enqutes 1470 entreprises dont 428 entreprises du secteur
informel de production, 597 entreprises du secteur informel de commerce et 438 entreprises
du secteur informel de service. Le but de la repondration est dextrapoler les rsultats
obtenus sur les 1470 entreprises aux 1745 entreprises initiales.
b) Formule

Nk
avec N k le
nk
nombre dentreprises du secteur k prvues par le plan de sondage et nk le nombre
dentreprises du secteur k effectivement enqutes.
Pour une entreprise du secteur k, la formule de repondration est : pi =

Tableau 6 : Rcapitulation des poids des entreprises

Secteur
Production
Commerce
Service

Nk
480
730
535

nk
428
597
438

pi
1,121
1,223
1,221

IV.2. Estimateurs de Horwitz and Thomson


a) Intrt de la moyenne de Horwitz-Thomson
Dans le cas dun sondage stratifi comme cest le cas ici, la moyenne simple est biaise.
On utilise donc lestimateur de Horwitz-Thomson pour la moyenne qui est un estimateur sans
biais de la moyenne vraie.
b) Formules
3

n
La formule de la moyenne de Horwitz and Thomson est Y = h yh o :
h =1 n
nh est leffectif des entreprises du secteur h dans lchantillon ;
n est la taille totale de lchantillon, n=1470; et
yh est la moyenne de Y des entreprises du secteur h dans lchantillon

Les estimateurs des carts types de ces estimateurs sont donns par les formules
2

3
s2
N
V (Y ) = h (1 f h ) h o
nh
h =1 N
N h est lffectif du secteur h dans la population (N1=480 ; N2=730. N3=535)

N = Nh
h =1

fh =

nh
Nh

sh2 la variance empirique de Y dans la classe h


c) Tableau des rsultats destimation
Tableau 7 : Estimateurs Horwitz-thompson des variables d'intrt
Statistiques descriptives
Effectif N
Apport principal moyen
avant
Apport principal moyen
aprs
Montant marchandises
moyen avant
Montant marchandises
moyen aprs

Min

Max

Somme

Moyenne

EcartType
Skewne
de la moy Ecarttype
ss
Kurtosis

1 388,66

0,02

7872 175 933,47

126,69

10,82

403,21

11,45 176,17

1 739,11

0,02

7000 130 840,23

75,23

8,03

334,83

14,29 243,67

1 393,22

0,03

6500 122 223,76

87,73

7,47

278,84

13,76 266,98

1 743,78

0,03

9000

55,37

6,44

268,77

26,76 859,06

96 556,38

Lestimation de la moyenne montre une forte baisse des apports de lactivit principale
et des montants de dpenses en achats de marchandises et matires premires.
IV.3 Box-plots des variables dintrt
Lanalyse des box-lots des variables Q183av, 183ap, Q1113av, Q1113ap donne des
rsultats identiques et prsente des outliers extrmit droite de chaque distribution. Cela est
bien visible sur le graphique du Box-plot de la variable Q183av. les Box-plots des autres
variables sont reprsentes en annexe.
Figure 1 : Box plot de la variable q183av (Apport principal moyen avant)
apport principal moyen avant
7872

.02

10

IV.4. Stems and leaves des variables dintrt


Figure 2 : Stem and Leaf de la variable Q183av

Les stems and leaves des variables permettent de compter les outliers. Pour la variables
Q183av par exemple (figure2) les valeurs suprieures 1050 sont considres comme des
outliers. Cela permet didentifier 20 outliers.
Tableau 8 : Nombre doutliers par variable
Variable

Apport principal moyen avant


Apport principal moyen aprs
Montant marchandise moyen
avant
Montant marchandise moyen
aprs

Nombre
doutliers

Valeurs
suprieures

Poids des
Outliers ( Pout )

Taux
doutliers

20
12

1050
1000

23.63
13.91

1,70
0,80

14

800

16.65

1,19

11

600

13.21

0,95

Le poids doutliers dsigne la somme des poids individuels des outliers. Ces poids vont
servir pour le calcul de la moyenne de Windzor. La colonne valeurs suprieures dsigne
les montants au del desquels les valeurs sont considres comme outliers. Notons Vmax cette
valeur pour une variable donne.
IV.5. Calcul de la moyenne de Windzor
Cette moyenne prsente lavantage dliminer les effets des valeurs aberrantes qui
peuvent introduire un biais dans le calcul des estimateurs.
a) Formule
On suppose que les valeurs de la variable sont ordonnes de faon croissante et que les
outliers sont les valeurs strictement suprieures Vmax . La formule de Windzor est :
n

1 Vmax
W = pi yi + PoutVmax o nvmax dsigne lordre de Vmax et Pout est le poids des outliers.
n i =1

11

b) Tableau des rsultats


Tableau 9 : tableau des winzorized means

Variable
Apport principal moyen avant
Apport principal moyen aprs
Montant marchandise moyen avant
Montant marchandise moyen aprs

Moyenne de Windzor
102.68
58.44
73.03
42.95

Lestimation de la moyenne par la formule de Windzor donne pour lensemble des


quatres variables des valeurs plus petites que celles fournies par la formule de Horwitz et
Thomson. Cette diffrence sexplique par le fait que tous les outliers sont situs dans a partie
suprieure de la distribution et ceux pour lensemble des variables dintrt.
Les syntaxes de calcul des moyennes de Wndzor pour nos variables dintrt sont
prsents en annexe.
IV.6. Calcul des % trimmed means
Le % trimmed mean est galement un estimateur de la moyenne en cas de prsence
doutliers. A la diffrence du windzorised mean les outliers sont purement et simplement
laisss de ct dans le calcul de la moyenne.
a) Formule
En supposant lchantillon ordonn dans lordre croissant de la variable Y, le %
n
1 vmax
trimmed mean de Y scrit : y trim =
pi yi .
nvmax i =1

b) Rsultats
Tableau 10 : Estimation par

% trimmed mean

Variable
Apport principal moyen avant
Apport principal moyen aprs
Montant marchandise moyen
avant
Montant marchandise moyen
aprs

% trimmed mean
86.28
50.85
97.51
40.74

L' estimation des moyennes des variables dintrt par la mthode du % trimmed
mean donne des valeurs encore plus faibles que le windzorised mean.
IV.7. Estimation par bootstrap des variances des estimateurs des Winzorised means et
des % trimmed means
Les variances du des Winzorised means et des % trimmed means ne peuvent tre
calcules par des formules analytiques. On utilise donc la mthode du Bootstrap afin de les
estimer.

12

Les tableaux ci-dessous donnent les rsultats du bootstrap respectivement pour la


moyenne de Windzor et pour le % trimmed mean.
Tableau 11 : Rsultats du bootstrap pour la moyenne de windzor

Variable

Valeur
estime

Biais

Ecart
type

Apport principal moyen avant


Apport principal moyen aprs
Montant marchandise moyen avant
Montant marchandise moyen aprs

102.68
58.44
73.03
44.98

0.35
0.08
0.05
0.20

5.30
3.45
3.76
2.19

Tableau 12 : Rsultats du bootstrap pour le

% trimmed mean

Variable

Valeur
estime

Biais

Ecart
type

86.28
50.85
64.23
40.74

0.33
0.06
0.07
0.04

3.77
2.46
2.88
1.69

Apport principal moyen avant


Apport principal moyen aprs
Montant marchandise moyen avant
Montant marchandise moyen aprs

Intervalle de
confiance
95%
Min
Max
93.37 114.13
51.84 65.58
66.57 81.58
41.05 49.74

Intervalle de
confiance 95%
Min
Max
79.52 93.93
46.59 56.92
58.97 70.01
38.04 44.77

Le biais mesure lcart entre la moyenne bootstrape et la moyenne de windzor ou le


% trimmed mean. On remarque que les cart-types estims sont plus levs pour les
moyennes de windzor que pour les % trimmed means. Ce qui signifie que le % trimmed
mean est plus prcis dans ce cas et donc meilleur que la moyenne de Windzor. De ce fait nous
cnsidrerons comme estimation des valeurs des variables dintrt les estimations par les
% trimmed means.
Ainsi, on peut dire que les montants des apports des activs principales des entreprises
de Bassam ont connu une baisse aprs la crise du 19 septembre 2002. Cette baisse est de
41,1% pour les apports des activits principales et de 58,2% pour les dpenses en
marchandises et matires premires.

13

Conclusion
Dans ce travail, nous avions traiter et exploiter un ensemble de 126 variables
concernant : le cycle dactivit, le niveau de production, les ressources non financires des
entreprises et leurs charges non financires. Le traitement consistait en lapurement et au
redressement des non rponses ou imputation. Au niveau de lexploitation, il sagissait de
calculer des estimateurs fiables et robustes laide des mthodes vues au cours (bootstrap,
Jacknife, ect.).
Au niveau de lapurement, nous avons remarqu quelques incohrences au niveau de
la date de cration des entreprises. Le problme crucial concernait les entreprises qui avaient
dclar tre cres aprs le 19 septembre 2002 et avaient rpondu plusieurs questions qui
concernaient lactivit conomique avant le 19 septembre; Nous avons trait ces entreprises,
dans la suite, comme des entreprises cres avant le 19 septembre.
Pour le redressement des non rponses, nous avons constat aprs apurement et
traitement des sans objets que les variables prsentaient toujours un taux de non rponses
brutes trs lev. Le taux de non rponses de certaines variables avoisinait 90%. Nous avons
dcid dimputer seulement les variables ayant un taux de non rponses brutes de mois de
40%. Pour presque la totalit des variables concernes par limputation, le mcanisme de non
rponse identifi pourrait tre le Not missing at random cest--dire, la probabilit de non
rponse pour la variable dintrt dpend delle-mme ou dautres variables non tudies.
Dans la majorit des cas, la mthode dimputation tait la mthode du plus proche voisin
couple de la mthode de la moyenne.
Une fois les donnes redresses, les variables dintrt que nous avons choisies sont
les apport principal moyen avant et aprs le 19 septembre 2002 et montant marchandise
moyen avant et aprs le 19 septembre 2002 . Il sagissait pour terminer, de donner les
estimateurs fiables et robustes pour ces variables. Les rsultats montrent que ce sont les
estimateurs % trimmed means qui donnent des estimations prcis et robustes.
Comme on peut ce rendre compte, que ce soit lapport principal moyen ou le montant
marchandise moyen, on se rend compte par le baisse des estimations de ces variables au
lendemain de la crise du 19 septembre 2002 que la crise eu cot considrable sur le
fonctionnement de lactivit conomique.

14

Bibliographie
ENSEA (2003), Manuel de codification : Enqute Impact socio conomique de la crise sur
la ville de BASSAM : aspect conomique de la crise , Abidjan, ENSEA.
CHITOU B. (2003), Support du cours sur lexploitation des donnes denqutes, Abidjan,
ENSEA.
DUSSAIX A.
solutions .

et GROSBRAS J. : Exercices de sondages avec aide-mmoire et

ARDILLY P. (1994) Les techniques de sondages , Edit Technip-Paris.

15

Annexes
Annexe 1 : Dictionnaire des variables
Variable Libll

Variable

Libll

localite

Localit

dec

Comment marche vos affaires en decembre?

q01

Quartier

jodec

Nombre de jours ouvrs de decembre?

q02

Ilot

janv

Comment marche vos affaires en janvier?

q03

Concession

jojanv

Nombre de jours ouvrs de janvier

q04

N Entreprise

fev

Comment marche vos affaires en fevrier?

ident

Identifiant

jofev

Nombre de jours ouvrs de fevrier

identif2

mars

Comment marchent vos affaires en mars

q071

Jour de crtion

jomars

Nombre de jours ouvrs de mars

q072

Mois de cration

q151

Periodicit hotels

q073

Anne de cration

q152av

Taux htels fort avant

q08

Nature

q152ap

Taux htels fort aprs

q013

Activit principale

q153av

Taux htels moyen avant

q018

Repondant

q153ap

Taux htels moyen aprs

q11

Determination priodes d'activit

q154av

Taux htels bas avant

lun

Comment marche vos affaires le lundi?

q154ap

Taux htels bas aprs

mar

Comment marche vos affaires le mardi?

q161

Periodicit transport

mer

Comment marche vos affaires le mercredi?

q162av

Nombre depart fort avant

jeu

Comment marche vos affaires le jeudi?

q162ap

Nombre depart fort aprs

ven

Comment marche vos affaires le vendredi?

q163av

Nombre depart moyen avant

sam

Comment marche vos affaires le samedi?

q163ap

Nombre depart moyen aprs

dim

Comment marche vos affaires le dimanche?


Comment marche vos affaires la premire
semaine du mois?

q164av

Nombre depart bas avant

q164ap

Nombre depart bas aprs

Nombre jours ouvrs de la premire semaine


Comment marche vos affaires la deuxime
semaine du mois?

q171

Periodicit taux transport

q172av

Taux transport fort avant

Nombre jours ouvrs de la deuxime semaine


Comment marche vos affaires la troisime
semaine du mois?

q172ap

Taux transport fort aprs

sem1
jo1
sem2
jo2
sem3

q173av

Taux transport moyen avant

q173ap

Taux transport moyen aprs

sem4

Nombre jours ouvrs de la troisime semaine


Comment marche vos affaires la quatrime
semaine du mois

q174av

Taux transport bas avant

jo4

Nombre jours ouvrs de la quatrime semaine

q174ap

Taux transport bas aprs

jo3

sept

Comment marche vos affaires en septembre?

q181

Periodicit activit principale

josept

Nombre de jours ouvrs de septembre

q182av

Apport principal fort avant

oct

Comment marche vos affaires en octobre?

q182ap

Apport principal fort aprs

jooct

Nombre de jours ouvrs d'octobre

q183av

Apport principal moyen avant

nov

Comment marche vos affaires en novembre

q183ap

Apport principal moyen aprs

jonov

Nombre de jours ouvrs de novembre

q184av

Apport principal bas Avant

16

Variable Libll

Variable

Libll

q184ap

Apport principal bas Aprs

q1134ap

Montant energie bas aprs

q191

Periodicit activit secondiare

q1141

Periodicit montant transport

q192av

Apport secondaire fort avant

q1142av

Montant transport fort avant

q192ap

Apport secondaire fort aprs

q1142ap

Montant transport fort aprs

q193av

Apport secondaire moyen avant

q1143av

Montant transport moyen avant

q193ap

Apport secondaire moyen aprs

q1143ap

Montant transport moyen aprs

q194av

Apport secondaire bas avant

q1144av

Montant transport bas avant

q194ap

Apport secondaire bas aprs

q1144ap

Montant transport bas aprs

q1101

Periodicit montant chiffre d'affaires

q1151

Periodicit traitement personnel

q1152av

Traitement personnel fort avant

q1102ap Montant affaires fort aprs

q1152ap

Traitement personnel fort aprs

q1103av Montant affaires moyen avant

q1153av

Traitement personnel moyen avant

q1102av Montant affaires fort avant

q1103ap Montant affaires moyen aprs

q1153ap

Traitement personnel moyen aprs

q1104av Montant affaires bas avant

q1154av

Traitement personnel bas avant

q1104ap Montant affaires bas aprs

q1154ap

Traitement personnel bas aprs

q1111

Periodicit montant marchandises

q1112av Montant marchandises fort avant

q1161

Periodicit chrages locatives

q1162av

Traitement personnel fort avant

q1112ap Montant marchandises fort aprs

q1162ap

Charges locatives fort aprs

q1113av Montant marchandises moyen avant

q1163av

Charges locatives moyen avant

q1113ap Montant marchandises moyen aprs

q1163ap

Charges locatives moyen aprs

q1114av Montant marchandises bas avant

q1164av

Chrages locatives bas avant

q1114ap Montant marchandises bas aprs

q1164ap

Chages locatives bas aprs

q1121

q1171

Periodicit sous-traitance

q1122av Montant fournitures fort avant

Periodicit montant fournitures

q1172av

Sous-traitance fort avant

q1122ap Montant fournitures fort aprs

q1172ap

Charges locatives fort aprs

q1123av Montant fournitures moyen avant

q1173av

Sous-traitance moyen avant

q1123ap Montant fournitures moyen aprs

q1173ap

Sous-traitance moyen aprs

q1124av Montant fournitures bas avant

q1174av

Sous-traitance bas avant

q1124ap Montant fournitures bas aprs

q1174ap

Sous-traitance bas aprs

q1131

Periodicit montant energie

q1132av Montant energie fort avant


q1132ap Montant energie fort aprs
q1133av Montant energie moyen avant
q1133ap Montant energie moyen aprs
q1134av Montant energie bas avant

17

Annexe 2 : Box-plots des variables dintrt


Figure 3 : Box plot de la variable q183av (Apport principal moyen avant)
apport principal moyen avant
7872

.02

Figure 4 : Box plot de la variable q183ap (Apport principal moyen aprs)


apport principal moyen aprs
7000

.02

18

Figure 5 : Box plot de la variable q113av (Montant marchandises moyen avant)


montant marchandises moyen avant
6500

.03

Figure 6 : Box plot de la variable q113ap (Montant marchandises moyen aprs)


montant marchandises moyen apr
9000

.03

19

Annexe 3 : Stems and leaves


Stem-and-leaf plot for q183ap (apport principal moyen aprs)
0** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00, ... (1190)
1** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,20, ... (185)
2** 00,00,00,00,00,03,03,03,03,03,03,03,03,03,03,03,03,03,03,03, ... (47)
3** 00,00,00,00,00,05,50,50,60,60,74,75,90
4** 00,00,00,00,20
5** 00,00,88
6** 00,00
7** 00,20,50
8** 00
9** 00,05
10** 00,00
11**
12**
13** 00
14**
15** 00,00
16**
17**
18** 00,00
19**
20** 35
21** 00
22**
23**
24** 50

45** 00
46** 77

60** 00
70** 00

Stem-and-leaf plot for q1113av (montant marchandises moyen avant)


0** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00, ... (851)
1** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,01,02, ... (256)
2** 00,00,00,00,00,00,00,00,00,00,10,25,35,44,50,50,50,60,80
3** 00,00,00,00,00,00,00,00,00,00,05,15,33,50,56
4** 00,00,00,00,00,00,20,25,28
5** 00,80
6** 43,43,43
7** 00,30,47,50,50
8** 00,00
9**
10** 00,00
11** 00
12** 80
13** 20
14**
15** 00,00,00
16**
17** 08
18**
19**
20**
21** 00
22**
23**
24**
25** 00,50
26**
27** 66

65** 00

20

Stem-and-leaf plot for q1113ap (montant marchandises moyen aprs)


0** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00, ... (1310)
1** 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00, ... (112)
2** 00,00,00,00,00,20,25,25,26,40,40,50,63,80
3** 00,00,00,00,00,25,38,50,50,56,65
4** 00,40
5** 00,00,00,00,50,75
6** 00,00,00
7**
8** 15,40
9** 00,80,99
10** 00
11**
12** 80
13**
14**
15** 00
16**
17** 00

27** 66

90** 00

Annexe 4: Estimations de winzorised et alpha trimmed means

Pour la variable q183av


Winzorize mean : 102.67859
sum q183av [aw=poids] if (q183av<=1050)
local sommetrnq=r(mean)*r(sum_w)
local winzo=(23.6345735 *1050+`sommetrnq')/1388.66314
di `winzo'

Right tailed Alpha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Weight
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------------------q183av |
1152 1365.02857
86.27634
134.1837
.02
1050

Pour la variable q183ap


*Les 12 outliers reprsentent 13,91 individus au
vu des coefficients dexptrapolation

Winzorized mean : 58.438445

sum q183ap [aw=poids] if (q183ap<=1000)


local sommetrnq=r(mean)*r(sum_w)
local winzo=(13.9127512*1000+`sommetrnq')/1739.11426
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |

Obs

Weight

Mean

Std. Dev.

Min

Max

-------------+----------------------------------------------------------------q183ap |

1453

1725.2015

50.8453

97.62976

.02

1000

21

Pour la variable q1113av


Winzorized mean : 73.025254
sum q1113av [aw=poids] if (q1113av<=800)
local sommetrnq=r(mean)*r(sum_w)
local winzo=(16.6476055 *800+`sommetrnq')/1393.21965
di `winzo'

Right tailed Alpha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Weight
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------------------q1113av |
1162 1376.57205
64.23357
97.51233
.03
800

Pour la variable q1113ap


Winzorized mean : 42.947431
sum q1113ap [aw=poids] if (q1113av<=600)
local sommetrnq=r(mean)*r(sum_w)
local winzo=(13.2073723*600+`sommetrnq')/1393.21965
di `winzo'

Right tailed Alpha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Weight
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------------------q1113ap |
1458
1730.5699
40.74158
66.38721
.03
600

Annexe 5 : Bootstrap sur les winzorised means

Pour la variable q183av


Le programme STATA est le suivant
program define winq183av
version 7.0
if "`1'" == "?" {
global S_1 winzoq183av
exit
}
* poids des d outliers*
qui sum q183av [aw=poids] if q183av>1050
local poidsout= r(sum_w)

*poids total
qui sum q183av [aw=poids]
local poidstot=r(sum_w)

22

*calcul du winzorized mean winzo


qui sum q183av [aw=poids] if q183av<=1050
local sommetrnq=r(mean)*r(sum_w)
local winzoq183av=(`poidsout'*r(max)+`sommetrnq')/`poidstot'
post `1' (`winzoq183av')
end
bstrap winq183av, reps(500)

(obs=1470)

Bootstrap statistics

Variable

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

------------+---------------------------------------------------------------winzoq183av |

500

102.6786

-.352443

5.301452

92.26267

113.0945

(N)

92.78415

113.2341

(P)

93.37152

114.1259 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

Pour les variables q183ap ; q1113av et q1113ap, le programme se modifie en remplaant les
textes griss suivant le tableau suivant :
Tableau 1
Variable

q183ap

q1113av

q1113ap

description

winq183av

winq183ap

winq1113av

winq1113ap

Nom du programme

q183av

q183ap

q1113av

q1113ap

Nom de la variable concerne

winzoq183av winzoq183ap winzoq1113av winzoq1113ap Nom de lestimazteur bootstrap


1050

1000

800

600

Seuil au-del duquel on est considr comme


outlier

Bootstrap statistics
POOUR LA VARIABLE q183ap
Variable

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

------------+---------------------------------------------------------------winzoq183ap |
|

500

58.43845

-.0796941

3.450431

51.65928

65.21761

(N)

51.77943

65.42441

(P)

|
51.84245 65.57652 (BC)---------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

23

POOUR LA VARIABLE q1113av

Bootstrap statistics
Variable
|
Reps
Observed
Bias
Std. Err.
[95% Conf. Interval]
------------+---------------------------------------------------------------winzoq113av |
500
73.02525 -.0505734
3.761854
65.63423 80.41628 (N)
|
66.36188 80.91783 (P)
|
66.56652 81.58176 (BC)
----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

POOUR LA VARIABLE q1113ap


Bootstrap statistics
Variable

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

-------------+--------------------------------------------------------------winzoq1113ap |

500

44.97741

-.1995108

2.185894

40.68272

49.2721

(N)

40.80772

49.09934

(P)

41.04801

49.73628 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

Annexe 5 : Bootstrap sur les alpha trimmed means


Pour la variable q183av
bs "sum q183av [aw=poids] if q183av<=1050" "r(mean)", reps(500)

Bootstrap statistics
Variable |

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

---------+------------------------------------------------------------------bs1 |

500

86.27634

.3286153

3.768796

78.87167

93.681

(N)

79.65116

94.32502

(P)

79.51547

93.93105 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

24

Pour la variable q183ap


bs "sum q183ap [aw=poids] if q183ap<=1000" "r(mean)", reps(500)

Bootstrap statistics
Variable |

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

---------+------------------------------------------------------------------bs1 |

500

50.84529

-.0549498

2.464829

46.00257

55.68802

(N)

46.27514

55.87797

(P)

46.58707

56.92311 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

Pour la variable q1113av


bs "sum q1113av [aw=poids] if q1113av<=800" "r(mean)", reps(500)
Bootstrap statistics

Variable |

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

---------+------------------------------------------------------------------bs1 |

500

64.23357

-.0738211

2.884513

58.56628

69.90085

(N)

58.54799

69.69091

(P)

58.96519

70.0144 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

Pour la variable q1113av

bs "sum q1113ap [aw=poids] if q1113ap<=600" "r(mean)", reps(500)


Bootstrap statistics
Variable |

Reps

Observed

Bias

Std. Err.

[95% Conf. Interval]

---------+------------------------------------------------------------------bs1 |

500

40.74158

.042171

1.688072

37.42498

44.05819

(N)

37.58352

44.15766

(P)

38.03995

44.76864 (BC)

----------------------------------------------------------------------------N = normal, P = percentile, BC = bias-corrected

25

Annexe 6: Etude des variables dintrt par secteurdactivt


ETUDE DE LA VARIABLE q183av PAR TYPE DACTIVITE
Figure 7 : Box plot de q183av pour le secteur production
apport principal moyen avant
2700

1.5

nombre doultilers : 7 outliers (valeurs>900)


Taux de outliers : 7*100/370
Winzorize mean : 139.67214
sum q183av if (q183av<=900)&(type==1)
local sommetrnq=r(mean)*r(N)
local winzo=(7*900+`sommetrnq')/370
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183av |
363
125.0102
147.5182
1.5
900

Figure 8 : Box plot de q183av pour le secteur Commerce


apport principal moyen avant
7872

.02

26

Nombre doultilers : 11outliers (valeurs>686)


Taux de outliers : 11*100/469
Winzorize mean : 83.502548
sum q183av if (q183av<=686)&(type==2)
local sommetrnq=r(mean)*r(N)
local winzo=(11*686+`sommetrnq')/469
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183av |
458
69.03209
107.4264
.02
686

Figure 9 : Box plot de q183av pour le secteur Service


apport principal moyen avant
2100

.5

nombre doultilers : 10outliers (valeurs>420)


Taux de outliers : 10*100/333
Winzorize mean : 64.006116
sum q183av if (q183av<=420)&(type==3)
local sommetrnq=r(mean)*r(N)
local winzo=(10*420+`sommetrnq')/333
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183av |
323
52.98463
83.94014
.5
420

27

ETUDE DE LA VARIABLE q183ap PAR TYPE DACTIVITE

Figure 10 : Box plot de q183ap pour le secteur production


apport principal moyen aprs
4500

.11

nombre doultilers : 7 outliers (valeurs>720)


Taux de outliers : 7*100/428
Winzorize mean : 80.378697
sum q183ap if (q183ap<=720)&(type==1)
local sommetrnq=r(mean)*r(N)
local winzo=(7*720+`sommetrnq')/428
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183ap |
421
69.74366
94.12325
.11
720

Figure 11 : Box plot de q183av pour le secteur Commerce


apport principal moyen aprs
6000

.02

nombre doultilers : 9 outliers (valeurs>375)


Taux de outliers : 9*100/595

28

Winzorize mean : 42.56564


sum q183ap if (q183ap<=375)&(type==2)
local sommetrnq=r(mean)*r(N)
local winzo=(9*375+`sommetrnq')/595
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |

Obs

Mean

Std. Dev.

Min

Max

-------------+----------------------------------------------------q183ap |

586

37.45999

64.86507

.02

375

Figure 12 : Box plot de q183av pour le secteur Service


apport principal moyen aprs
7000

.02

nombre doultilers : 5 outliers (valeurs>420)


Taux de outliers : 5*100/442
Winzorize mean : 41.117318
sum q183ap if (q183ap<=420)&(type==3)
local sommetrnq=r(mean)*r(N)
local winzo=(5*420+`sommetrnq')/442
di `winzo'

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q183ap |
437
36.78228
69.57505
.02
420

29

ETUDE DE LA VARIABLE q1113av PAR TYPE DACTIVITE


Figure 13 : Box plot de q1113av pour le secteur Production
montant marchandises moyen avant
2765.75

.2

nombre doultilers : 7 outliers (valeurs>425)


Taux de outliers : 7*100/373
Winzorize mean : 71.344387
Right tailed Alpha trimmed mean: (alpha = taux de outliers)
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113av |
366
64.58048
75.03288
.2
425

Figure 14 : Box plot de q1113av pour le secteur Commerce

montant marchandises moyen avant


6500

.1

nombre doultilers : 7 outliers (valeurs>800)


Taux de outliers : 7*100/469
Winzorize mean : 75.866549

30

Right tailed Apha trimmed mean: (alpha = taux de outliers)


Variable |

Obs

Mean

Std. Dev.

Min

Max

-------------+----------------------------------------------------q1113av |

462

64.89483

101.6774

.1

800

Figure 15 : Box plot de q1113av pour le secteur Service


montant marchandises moyen avant
1500

.03

Nombre doultilers : 7 outliers (valeurs>333)


Taux de outliers : 7*100/334
Winzorize mean : 55.856502
Right tailed Apha trimmed mean: (alpha = taux de outliers)
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113av |
327
49.92377
63.98518
.03
333.33

31

ETUDE DE LA VARIABLE q1113ap PAR TYPE DACTIVITE

Figure 16 : Box plot de q1113ap pour le secteur Production


montant marchandises moyen apr
2765.75

.1

nombre doultilers : 7 outliers (valeurs>280)


Taux de outliers : 6*100/430
Winzorize mean : 38.669285
Right tailed Apha trimmed mean: (alpha = taux de outliers)
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113ap |
424
35.25423
41.88937
.1
280

Figure 17 : Box plot de q1113ap pour le secteur Commerce


montant marchandises moyen apr
1700

.07

nombre doultilers : 11 outliers (valeurs>400)


Taux de outliers : 11*100/596
Winzorize mean : 44.246485
Right tailed Apha trimmed mean: (alpha = taux de outliers)
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113ap |
585
37.5571
57.57528
.07
400

32

Figure 18 : Box plot de q1113ap pour le secteur Service


montant marchandises moyen apr
9000

.03

nombre doultilers : 1 outliers (valeurs>980)


Taux de outliers : 1*100/443
Winzorize mean : 45.664988
Right tailed Apha trimmed mean: (alpha = taux de outliers)
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------q1113ap |
442
43.55111
78.01332
.03
980

33

Annexe 7: Syntaxes SPSS pour le traitement de la base

Les syntaxes pour le recodage des sans objets et limputation des non rponses sont
dun volume trs important, elles ne sont donc pas toutes places en annexe afin de ne pas
trop alourdir le document.
Syntaxe 1 : Rcodage des Sans objet pour les variables de cycle dactvit
* Cration d'une variable av_ap2 tenant compte uniquement des renseignements sur les variables avant.
get files file = "D:\raoul\exploitation_enqute\Gt_Bassam\entretest.sav".
execute.
COMPUTE av_ap2 = 0 .
VARIABLE LABELS av_ap2 'Existence avant le 19 sept 2002 suivant les donnes sur les variables avant' .
value labels av_ap2
1 'Cre avant le 19 sept 2002'
0 'Cre aprs le 19 sept 2002' .
EXECUTE .
DO IF ((q162av >= 0) | (q163av >= 0) | (q164av >= 0) | (q172av >= 0) |
(q173av >= 0) | (q174av >= 0) | (q182av >= 0) | (q183av >= 0) | (q184av >=
0) | (q192av >= 0) | (q193av >= 0) | (q194av >= 0) | (q1102av >= 0) |
(q1103av >= 0) | (q1104av >= 0) | (q1112av >= 0) | (q1113av >= 0) | (q1114av
>= 0) | (q1122av >= 0) | (q1123av >= 0) | (q1124av >= 0) | (q1132av >= 0) |
(q1133av >= 0) | (q1134av >= 0) | (q1142av >= 0) | (q1143av >= 0) | (q1144av
>= 0) | (q1152av >= 0) | (q1153av >= 0) | (q1154av >= 0) | (q1162av >= 0) |
(q1163av >= 0) | (q1164av >= 0) | (q1172av >= 0) | (q1173av >= 0) | (q1174av
>= 0)) .
RECODE
av_ap2 (0=1) .
END IF .
EXECUTE .
FILTER OFF.
USE ALL.
SELECT IF((av_ap=0)&(av_ap2=1)).
EXECUTE .
FREQUENCIES
VARIABLES=q11
/ORDER ANALYSIS .
* 11 valeurs mnquantes pour la variable Determination de la priodicit du cycle d'activit (q11).
* On reporte les valeurs de la priodicit de l'activit principale (q181) .
* les individus 105356005021et 105356002008 presentent des non rponses totales sur toutes les variables
exploitables.
DO IF (MISSING(q11)) .
compute q11 = q181 .
END IF .
EXECUTE .
* Cohrence entre priodicit du cycle d'activit (q11) et Commet marchent vos affaires ...(le jour) de la
semaine.
CROSSTABS
/TABLES=q11 BY lun mar mer jeu ven sam dim
/FORMAT= AVALUE TABLES
/CELLS= COUNT .
*Il ya cohrence mais prsence de valeurs manquantes pour les jours de la semaine.
* Cohrence entre priodicit du cycle d'activit (q11) et Comment marchent vos affaires ...(la semaine) du mois.
CROSSTABS
/TABLES=q11 BY sem1 sem2 sem3 sem4
/FORMAT= AVALUE TABLES

34

/CELLS= COUNT .
* Une entreprise prsente q11=3 et repond sem1=3. on la cherche pour traitement.
* Aprs filtrage. on constate qu c'est une erreur de saisie et on affecte cet individu le code SANS OBJET (9)
pour la variable sem1.
FILTER OFF.
USE ALL.
SELECT IF((q11=3)&(sem1=3)).
EXECUTE .
do if ((q11=3)&(sem1=3)).
recode sem1 (3=9).
end if.
execute.
* Cohrence entre priodicit du cycle d'activit (q11) et Comment marchent vos affaires ...(le mois) de l'anne.
CROSSTABS
/TABLES=q11 BY sept oct nov dec janv fev mars
/FORMAT= AVALUE TABLES
/CELLS= COUNT .

* Il n'ya que le pb de valuers manquantes.


Syntaxe 2 : Imputation des variables montant marchandises
**Imputation de la variable q181 qui va servir de variable auxilaire pour imputer les variables de cxharges non
financires q1112av q1174ap.
if sysmis(q181) q181=q11.
frequencies q181.
**Imputation de q1111.
**Les individus 113368001002 et 113488001001 n'ont pas rpondu question q1111 et ont donn des mntants
sur leurs dpenses en marchnadises.
**pour les autres individus qui n'ont pas rpondu q1111 ni aux montants des dpenses.
if (sysmis(q1111)&identif2<>113368001002&identif2<>113488001001) q1111=q181.
frequencies q1111.
**on remarque que les valeurs des rponses de ces deux individus la question q1113av est plus proche des
montants journaliers donns par les autres individus, on les classe alors dans la modalit q1111=1.
if (identif2=113368001002 or identif2=113488001001) q1111=1.
frequencies q1111.
COMPUTE periodic = 10*q181+q1111 .
VARIABLE LABELS periodic 'juxtapose de q181 et q1111' .
execute.
AGGREGATE
/OUTFILE="c:\aggr.sav"
/BREAK=periodic
/mq1112av = MEAN(q1112av) /mq1112ap= MEAN(q1112ap) /mq1113av=
MEAN(q1113av) /mq1113ap= MEAN(q1113ap) /mq1114av= MEAN(q1114av) /mq1114ap
= MEAN(q1114ap)
mpu
execute.
SORT CASES BY periodic(a).
MATCH FILES /FILE=*
/TABLE="c:\AGGR.SAV"

35

/BY periodic.
execute.
if sysmis(q1112av) q1112av=mq1112av.
if sysmis(q1112ap) q1112ap=mq1112ap.
if sysmis(q1113av) q1113av=mq1113av.
if sysmis(q1113ap) q1113ap=mq1113ap.
if sysmis(q1114av) q1114av=mq1114av.
if sysmis(q1114ap) q1114ap=mq1114ap.
execute.
FREQUENCIES
VARIABLES=q1112av q1112ap q1113av q1113ap q1114av q1114ap.

36

Vous aimerez peut-être aussi