Vous êtes sur la page 1sur 30

1

ENSEMBLE DE PROGRAMMES PERMETTANT LANALYSE DES EVOCATIONS. EVOC2000


Version 15 oc o!re 200"

MAN#EL

Le programme Windows (Delphi 2 et 3) a t ralis par S $%&'ne SCANO et par C&ris i'n (#NI)#E *MMS+,. Les programmes Tubo-Pascal ont t raliss par Pierre VERGES (L !"#)$

Pour toutes in%ormations& assistance ou '(ugs)$ *ontacter Pierre +",-"# tlphone . (33) / /2 02 /1 20 %a1 . (33) / /2 02 /3 23 "-!ail . 4ergesp5mmsh$uni4-ai1$%r

A-resse . L' /'ri0o12e3 455 C&e6in BO#EN+O#RE3 1"070 Ai8 en Pro9ence3 /r'nce

Sommaire
SOMMAIRE..............................................................................................2 O. BIBLIOGRAPHIE...............................................................................3 1. MATRIEL REQUIS............................................................................3 2. INSTALLATION DU LOGICIEL EVOC2 3. LE PROGRAMME EVOC2 ........................................3

!ANAL"SE DES VOCATIONS#.......3

$. LE POINT DE DPART % UN QUESTIONNAIRE D&VOCATION.......' 5.1 cr$' ion -1n :ic&ier so1s E;EL................................................................5 5.2 cr$' ion -1n :ic&ier so1s <ORD...............................................................= 5." r$c1%$r' ion -1n 'ncien :ic&ier $cri so1s <ORD..................................4 5.5 L' -$:ini ion -es 6o s e -es s>n '06es.....................................................7 '. LA RECHERCHE DES MOTS...........................................................11 (. LE NETTO"AGE DU )ICHIER EST NCESSAIRE POUR LIMINER LES )AUTES D&ORTHOGRAPHE* LES ERREURS DE )RAPPE ET LES ERREURS DE D)INITION DES UNITS LE+ICALES.................................13 ,. UNE PREMI-RE DIRECTION % L&ANAL"SE LE+ICOGRAPHIQUE* L&TUDE DES )RQUENCES ET L&ANAL"SE DES RANGS.......................1$ .. UNE DEU+I-ME DIRECTION % LA D)INITION DE CATGORIE REGROUPANT LES DI))RENTS MOTS.....................................................21 /. POURSUIVANT CETTE DIRECTION ON RIN0ECTE DANS LE )ICHIER INITIAL LES CATGORIES DES MOTS QUI COMPOSENT LA 1ONE TE+TE DE CHAQUE ENREGISTREMENT..........................................23 1 . COMPARAISON DE LE+IQUES.....................................................2$ PRECONISATIONS...............................................................................2' Anne8e 1 . Les -i::$ren s :ic&iers 1 i2is$s %'r EVOC2000............................2? Anne8e 2 . 2es %rinci%es -e cons i 1 ion -es 6o s e s>n '06es....................2=

3 Anne8e " Co66en c&oisir 2es se1i2s 1 i2is$s %'r 2e %ro0r'66e RANG/R) ..................................................................................................................................... 24

O. Bi23io4ra56ie
6$($ -,78"& P$ +",-"#& $ #7L"! (eds)& 19:2& Salaris face aux nouvelles technologies& ed$ du *;,#& Paris$ P$ +",-"#& L<4ocation de l<argent . une mthode pour la d%inition du no=au central d<une reprsentation& Bulletin de Psychologie& n>/30& tome ?L+& 6an4ier-@4rier 1992& pp$ 233-239$

1. Ma78rie3 re9:i;
*es logiciels demandent au minimum un P* a4ec.
1A !o de , ! W7;DBW# 90 et 4ersion sui4ante un a%%ichage :33?A33 (o!2i0' oire3 une 4ersion en /:3?A/3 est possible en Couant des ascenseurs)

2. I<;7a33a7io< =: 3o4i>ie3 EVOC2


Bu4rir le *D choisir le rpertoire D 7nstallation "4oc2333 E puis le sous rpertoire D DisF1 E puis cliGueH sur le programme D setup$e1e E 7l dcompresse les %ichiers dans le rpertoire ' Program @ilesI"4oc2333 ) et inscrit D "4ocation 2333 E dans la base de registre et dans le menu D Dmarrer E$ Po1r 1 i2iser 2e %ro0r'66e 4ous pou4eH %aire D Dmarrer E puis D Programmes E puis D "4ocation 2333 E$ +ous pou4eH aussi crer un raccourci sur le (ureau (icJne ' "4oc$e1e )) . pour cela ou4rir le dossier D Program %ilesI"4oc2333 E et crer le raccourci du %ichier D "4oc$e1e E$ A en ion si 9o1s '9e@ <in-oA2000 o1 ;P e si 21 i2is' e1r nes %'s '-6inis r' e1r *c's -es s'22es $ 1-i'n s, . 4ous de4eH ou4rir le compte D administrateur E et dans ce compte %aire les oprations sui4antes . ou4rir le rpertoire D Program %iles E puis le sous rpertoire D "4oc2333 E puis cliGueH a4ec le bouton droit pour obtenir le menu conte1tuel& choisir D Proprits E puis lKonglet D #curit E et coc&er (comme indiGuer dans lKimage cran sui4ante) pour les D utilisateurs a4ec pou4oir E et pour les D utilisateurs E la case D utorisation "criture E$

3. Le 5ro4ramme EVOC2

!A<a3?;e =e; 8@o>a7io<;#

rchitecture de lKensemble des programmes et de leurs %ichiers$

/ La %enLtre de gestion de 4otre anal=se se prsente ainsi$

#i cet cran nKest pas entier il %aut modi%ier 4otre d%inition cran (+ido)$ "lle doit Ltre de :33 1 A33 (ou tra4ailler a4ec les ascenseurs)$ La modi%ication se %ait dans Windows 7nstallation$ *haGue bouton est un programme Gui e1cute une des %onctions ncessaires M lKanal=se des 4ocations$ *es programmes permettent deu1 t=pes dKanal=ses . a- le1icographiGue b- catgorisation pour une anal=se de contenu$ L' %roc$-1re -e r'i e6en es 2' s1i9'n e . On co66ence %'r cr$er 1n :ic&ier so1s E;EL ou sous Word (c%$ /$1 et /$2)$ Bn d%init le 4ocabulaire du corpus& pour cela on cre le L"?7NO" on le Trie (T,7"+B*)& on nettoie le %ichier initial des erreurs de %rappes ou des mots inutiles (;"TTB7"& c%$ 0)$ LKanal=se du le1iGue comprend un ensemble de programmes (c%$ 2$) . , ;-!BT donne la %rGuence et la distribution des rangs pour chaGue mot& L7#T+B* donne la liste de tous les mots dans leur conte1te& 7D"* T anal=se les cooccurrences des mots les plus %rGuents& , ;-@,N cre& pour la recherche du no=au central et des priphries& le tableau rang 1 %rGuence$ LKanal=se des catgories (c%$ :) commence par la cration du regroupement des termes au sein des catgories d%inies par lKanal=ste (* T"+B* et possibilit de correction par ,"*BD* T)$ "lle se poursuit par lKanal=se des catgories cres . D7#* T donne la %rGuence et la distribution des rangs des mots de chaGue catgorie& #T T* T %ait la statistiGue de la consistance des catgories& * T7;7 reconstitue le %ichier initial (111$T?T) en insrant les catgories utilises dans chaGue enregistrement et permet ensuite une anal=se de similitude par le programme #7!72333 (c% 9$) On ensemble de programme permet la comparaison des le1iGues de souspopulations . #"L"+B* cre les sous %ichiers d%inis par une 4ariable du %ichier

0 "?"L initial& *B!PL"? compare les le1iGues de deu1 sous-%ichiers& , ;-!BTP anal=se les mots Gui ont t marGu par un astrisGue (c% /$2)$ No ' . Bn peut 4isualiser les sorties de chaGue programme (et les %ichiers eu1mLme) en c2iB1'n sur le bouton du programme (ou sur le nom du %ichier) a4ec le !o1 on Droi de la souris P alors apparaQt une boite indiGuant ' ,apport ) et en dessous ' +isualiser )$ 7l %aut alors cliGuer a4ec le !o1 on G'1c&e sur ' +isualiser )$

$. Le 5oi<7 =e =85ar7 % U< 9:e;7io<<aire =&8@o>a7io<.


#oit le Guestionnaire sui4ant .
1a) Nui& M 4otre a4is& Coue un rJle important dans lKconomie& 4ous pou4eH donner au moins 3 et au plus : rponses 1$$.Etat$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ 2$$$Patron........................................................................................................... 3$$$Investissement.. Production$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ /$$$Scurit Sociale$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ 0$$$Commerce..................................................................................................... A$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ 2$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ :$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$ 1b) +euilleH souligner les deu1 rponses les plus importantes$ 4.1 cration dun fichier sous EXEL.

*haGue ligne de cette rponse se trou4e sur une colonne de la page "?"L$ Bn nKa pas besoin dKindiGuer le numro de ligne$ insi on a crit R"tat en colonne D& Rpatron en colonne " P in4estissement production en colonne @ etcS$ Bn doit a4oir une premiTre colonne donnant le numro dKordre du suCet et on peut a4oir ensuite un ensemble de colonne donnant des in%ormations sur le suCet (Uge& se1eS)$

7ci la colonne indiGue le numro de suCet la colonne ( le se1e& la colonne * un Uge (cod en trois positions)$ Les lignes de rponse se trou4ent dans les colonnes sui4antes (de D M !)$

2 *e tableau doit Ltre sau4egard sous la %orme ???$*s4

ATTENTION ne s'19e0'r-er B1e les colonnes et les lignes comprenant des in%ormations$ Bn obtient les enregistrements sui4ants . les colonnes sont spares par des points-4irgules$
1;1;3;*Etat;*patron;investissement production;scurit-sociale;commerce 2;1;2;;;;; 3;1;2;;;;; 4;2;1;;;;;

5;2;1;;;;;

4.2 cration dun fichier sous WORD.

On %ichier ???$t1t est cr sous %orme dKun te1te (te1te-seul sous Word par e1emple)$ *e %ichier est compos dKenregistrements comprenant . une ou plusieurs Hone(s) D identi%iant E le suCet (son numro puis de maniTre optionnelle des 4ariables de signaltiGue . se1e&

: Uge $$$)& ces Hones sont en dbut dKenregistrement et sont spares par des points-4irgules$ une Hone D te1te E oV se trou4e les di%%rents mots 4oGus prcds de leur rang dK4ocation (et dKun astrisGue si le mot est soulign)$ TT";T7B; il ne doit pas = a4oir de point-4irgules dans la Hone D te1te E La longueur de lKensemble de ces deu1 Hones est limite M 033 caractTres& sKil = en a plus il %aut crer plusieurs enregistrements en reportant la mLme Hone D identi%iant E sur tous ces enregistrements$ Bn obtient pour lKe1emple ci-dessus lKenregistrement sui4ant (suCet 331) . 001;1; ; 1!Etat "! Patron Commerce Investissement Production # Scurit$Sociale %

7l nKest pas ncessaire de laisser un blanc entre les chi%%res (ou lKastrisGue) et les mots$
4.3 rcupration dun ancien fichier crit sous WORD.

On %ichier ???$t1t a t cr sous la %orme dKun te1te (te1te-seul sous Word par e1emple)$ *e %ichier est compos dKenregistrements comprenant . une Hone D identi%iant E le suCet (son numro)& cette Hone est en dbut dKenregistrement$ une Hone D te1te E oV se trou4e les di%%rents mots 4oGus prcds de leur rang dK4ocation (et dKun astrisGue si le mot est soulign)$ TT";T7B; il ne doit pas = a4oir de point-4irgules dans la Hone D te1te E La longueur de la deu1iTme Hone est limite M 200 caractTres$ !BD" BP", TB7," . Bn ou4re "?"L& on se trou4e de4ant lKcran sui4ant .

Bn choisi le t=pe de %ichier . D largeur %i1e E$ Pois on passe M lKcran sui4ant .

7l indiGue GuKil 4a crer 2 colonnes& la premiTre comprend le numro& la seconde le te1te$ TT";T7B; il %aut 4ri%ier Gue "?"L nKa pas crer des colonnes supplmentaires$ Pour cela on dplace le curseur en dessous du te1te pour e1plorer toute la %enLtre$ #Kil e1iste des lignes 4erticales indiGuant des colonnes il %aut les supprimer$ Bn passe M lKtape sui4ante et on termine cette opration$ Bn se trou4e de4ant une %euille "?"L oV la premiTre colonne comprend le numro& la seconde le te1te$

Bn peut M ce moment lM importer dKautres colonnes (4enant dKun autre %ichier comprenant les mLme suCets) permettant dKidenti%ier les suCets (age& se1eS par e1emple)$ 7ci on a crer la colonne ($ Bn sau4egarde ce %ichier sous le %ormat ???$*#+ (sparateur point 4irgule)$ Bn peut ensuite ou4rir le logiciel "+B* et appeler ce %ichier ???$*#+$
4.4 La dfinition des mots et des synta mes.

Bn discute en anne1e 2 les problTmes de la d%inition des mots et s=ntagmes Gue le programme isole et comptabilise$ #i on 4eut crer une unit le1icale comprenant plusieurs mots& il %aut remplacer les espaces ou les apostrophes par le tiret ( C ou le D) . Par e1emple co&t$de$la$vie ou bonusWmalus$ #i on se trou4e a4ec une apostrophe en

13 milieu de mot . il %aut la remplacer par un tiret . par e1emple moyen$d$change$ LKapostrophe est un dlimiteur$ Par e1emple . l'avenir de4iendra avenir (le l' sera supprim)$ Dans lKe1emple ci-dessous on a 4oulu Gue scurit sociale soit en un seul mot car il reprsente un agent conomiGue& alors on accole les 2 mots par un tiret (-) . scurit$sociale$ 7n4ersement on laisse un blanc entre Investissement et Production pour bien les sparer$ 001;1; ; 1!Etat "! Patron Commerce Investissement Production # Scurit$Sociale %

Les sparateurs permettant dKisoler une Onit le1icale sont . Le blanc X LKapostrophe X Le guillemet $ Le point $ & La 4irgule & P Le point 4irgule P . Le deu1 points . Y Le point dKe1clamation Y Z Le point dKinterrogation Z R LKastrisGue R ( ) Les parenthTses ou4ertes et %ermes ( ) [ Le signe gal [ \ Le signe plus \ 3M9 Les chi%%res 3123/0A2:9

C's %'r ic12ier o% ionne2 . Bn a demand au suCet dKindiGuer& par un soulignement& les rponses les plus importantes$ la saisie on a& par con4ention& mis un astrisGue de4ant le mot si le mot est soulign (c%$ dans lKe1emple du / et /$1 les deu1 premiers mots)$ A en ion si 2e s1Ee n' so12i0n$ B11ne %'r ie -e son e8 e on encadre cette partie par un astrisGue a4ant et une aprTs$ #i le te1te est le sui4ant (oV le mot production est le seul soulign M la ligne 3) . 1 "tat 2 patron 3 in4estissement production / scurit-sociale 0 commerce on doit crire le mot production encadr par un astrisGue a4ant et une aprTs . D 1P1P3PR"tatPRpatronPin4estissement RproductionR Pscurit-socialePcommerce E

11

'. La re>6er>6e =e; mo7;.


D'ns 1n %re6ier e6%s& il %aut indiGuer oV se trou4e le %ichier des 4ocations grUce au bouton ]O19rir /ic&ier^ (en haut M gauche du graphiGue)$

TT";T7B; . 2e :ic&ier -es -onn$es es Csoi cr$er so1s E;EL (c%$ cration du %ichier "?"L en /$1 et rcupration dKanciens %ichiers en /$3) et a4oir t sau4egard so1s 2' :or6e ;;;.Cs9 (s$%'r' e1r %'r 1n %oin 9ir012e)$ Ds lKou4erture le %ichier est automatiGuement con4erti en %ichier ???$t1t utilisable par lKensemble des programmes ici utiliss$ - soi cr$er so1s 1n $-i e1r -e e8 e (c%$ cration du %ichier sous Word ou WordPad en /$2 ) P il doit alors a4oir t sau4egard en mode ' Te1te seulement ) so1s 2' :or6e ;;;. 8 $ Dans un second temps on 4a crer le 4ocabulaire des 4ocations$ Pour cela on 4a cliGuer sur les deu1 boutons ]L"?7NO"^ et ]T,7"+B*^$

Nuand 4ous cliGuer sur ]L"?7NO"^ il 4ous demande le nombre de colonnes "?"L de lKidenti%iant pour sa4oir oV commence le te1te des 4ocations (ici lKidenti%iant a 3 colonnes . numro& se1e& Uge)$

12

I2 :'1 o1Eo1rs c2iB1er s1r FE;EC#TERG '%rHs '9oir s$2ec ionner 1n o1 %21sie1rs !o1 ons. ]L"?7NO"^ isole les Onits le1icales du %ichier slectionn ???$t1t (ici @,N1$t1t)$ 7l cre le %ichier ???$tm1$ Bn tri ce %ichier par ordre alphabtiGue a4ec le programme T,7"+B*$ la sortie on a un %ichier ???$tm2$ *e %ichier est plus gros Gue le %ichier initial car il comporte autant dKenregistrement Gue de mots 4oGus$ dKliminer au ma1imum les articles (il reste ceu1 de 3 lettres . les( des( aux$$$)$ #i on a des mots de deu1 lettres Gue lKon tient M conser4er& il %aut leur aCouter une troisiTme lettre& par e1emple l'or sera crit l'ore$

No ' . les mots de une et deu1 lettres ne sont pas pris en considration a%in

13

(. Le <e77o?a4e =: Ai>6ier e;7 <8>e;;aire 5o:r 83imi<er 3e; Aa:7e; =&or76o4ra56e* 3e; erre:r; =e Ara55e e7 3e; erre:r; =e =8Ai<i7io< =e; U<i78; 3eBi>a3e;.
Le %ichier peut comprendre un certain nombre de mots indsirables (articles& et dans certains cas les 4erbes du t=pe Ltre& a4oir$$$)& ou mal d%inis (oublie de tiret -)& ou encore des mots crits au singulier et dKautres %ois au pluriel (masculin W %minin) dont la marGue singulier W pluriel nKest pas signi%icati4e pour le corpus$ Bn e%%ectue alors un D netto=age E du %ichier pour recrer un nou4eau %ichier ???$tm1 plus correct& permettant en particulier des statistiGues meilleures (sans biais) et une dition sans mots inutiles$ A en ion ce e $ '%e ne 9isen %'s I r$-1ire 2es s>non>6ies o1 I cons i 1er -es 0ro1%es -e 6o s %'r 2e1r r'cine o1 encore I re6%2'cer 2es 6o s %'r 1ne c' $0oris' ion c'r 2'n'2>se 2e8ico0r'%&iB1e -es $ '%es s1i9'n es en ser'i s$rie1se6en '::ec $e. Bn e1cute le programme ];"TTB7"^$ 7l en rsulte un %ichier ???$tm1 B1i -oi J re -e no19e'1 rier %'r FTRIEVOCG pour obtenir un nou4eau %ichier$ 7l %aut dKabord cliGuer sur le bouton ];"TTB7"^$ LKcran se prsente comme ci-dessous . M gauche se trou4e les mots par ordre alphabtiGue et M droite le conte1te dans leGuel ils se situent (une partie de lKenregistrement initial)$ +ous slectionneH une ligne (ici $)ut$lucratif)$ Le mot apparaQt en haut dans une Hone oV 4ous pou4eH le modi%ier (ici il %aut crire *$)ut$ lucratif)$

*e programme ne modi%ie pas le mot dans la Hone D te1te E initiale (M droite) Gui reste tel Guelle est dans le %ichier initial ???$t1t . *eci permet de conser4er le te1te

1/ e1act de la rponse& en particulier Guand on dite la liste de tous les conte1tes (par le programme ]L7#T+B*^& 4oir plus loin) 7l 4ous est propos plusieurs options de modi%ication . +ous pou4eH modi%ier le seul mot en surbrillance . bouton ],emplacer une %ois^$ +ous pou4eH modi%ier en une seule %ois tous les mots Gui ont e1actement la mLme orthographe (ici par e1emple Pm remplac par P+E) . bouton ],emplacer partout^$ A en ion se placer sur le premier mot$ +ous pou4eH remplacer le mot en surbrillance par le mot Gui se trou4e Custe au-dessus ou Custe en dessous (cela simpli%ie le tra4ail de correction) . boutons ]*opier le mot du haut^& ]*opier le mot du bas^$ +ous pou4eH supprimer le mot uniGuement sur la ligne en surbrillance . bouton ]#upprimer une %ois^$ +ous pou4eH aussi supprimer tous les mots identiGues M celui en surbrillance (par e1emple tous les articles des) . bouton ]#upprimer partout^$ +ous pou4eH 4ous dplacer M 4otre guise dans le %ichier grUce M lKascenseur de droite P et donc re4enir sur des corrections antrieures$ Vo1s s'19e0'r-e@ 2e :ic&ier par le bouton ]@erme et enregistre les modi%ications^$ +ous pou4eH touCours re4enir sur ce %ichier en appelant ];"TTB7"^ pour le corriger une nou4elle %ois$ A en ion i2 :'1 o1Eo1rs '%rHs 2e8$c1 ion -e NETTOIE e8$c1 er FTRIEVOCG %o1r '9oir 1n no19e'1 :ic&ier ;;;. 62 co6%or 'n 2es correc ions e::ec 1$es sinon on se re ro19e '9ec 2'ncien :ic&ier3 '9'n correc ion. 7l est possible de 4isionner les di%%rents %ichiers ???$tm1 et ???$tm2 en cliGuant sur leur nom a4ec le bouton Droi $

,. U<e 5remiCre =ire>7io< % L&a<a3?;e 3eBi>o4ra56i9:e* 3&87:=e =e; Ar89:e<>e; e7 3&a<a3?;e =e; ra<4;
=.1 Bn e1cute le programme FRANGMOTG. 7l 4ous est demand une %rGuence seuil pour le calcul des rangs mo=ens Gui apparaissent dans le listing (le plus sou4ent on conser4e la 4aleur par d%aut)$ Pour a4oir le listing il %aut cliGuer sur le bouton ], ;-!BT^ a4ec le !o1 on Droi alors apparaQt une boite indiGuant ],apport ,angmot^ et en dessous ]+isualiser^$ 7l %aut alors cliGuer a4ec le !o1 on G'1c&e sur ]+isualiser^$

10

1A "n sortie on obtient un listing de la distribution des rangs pour tous les mots$

La %rGuence des 0 premiers rangs se trou4e sur la mLme ligne Gue le mot$ Les %rGuences des rangs A M 10 se trou4ent& Guand elles e1istent& sur la ligne sui4ante$ la %in de ce listing on trou4era& en outre& la distribution des mots par %rGuence$

12

Bn trou4e en haut de cette partie du listing . le nombre de mots di%%rents (ici /1/)& le nombre dK4ocation (ici 1/02)& puis la distribution (ici il = a 2:2 mots Gui ne sont apparus GuKune %ois& un seul mot est apparu 3/A %ois)$ *ette distribution suit une loi logarithmiGue (loi de 87P@@)$ "lle permet dKidenti%ier trois Hones de %rGuences . celle oV les mots sont trTs peu nombreu1 pour une mLme %rGuence (ici de 13 M 3/A) P celle oV les mots sont peu nombreu1 pour une mLme %rGuence (ici de 0 M 9) P puis la Hone oV le nombre de mots est trTs important pour une mLme %rGuence (ici de 1 M /)$ Bn peut connaQtre par les deu1 distributions cumules lKimportance de chacune de ces Hones de %rGuences$ 7ci la Hone de 13 M 3/A reprsente 01_ des 4ocations (nb [ 2/3) P la Hone de 1 M / reprsente 32_ des 4ocations (nb [ 032)$ Ce e %'r i ion 9o1s %er6e r' %21s 2oin -e c&oisir 2es -i::$ren s se1i2s 1 i2is$s -'ns 2e %ro0r'66e RANG/R) Gue 4ous propose le tableau D ,ang 1 @rGuence E$ *e programme cre un nou4eau %ichier ???$dis contenant lKimage de la distribution des rangs pour chaGue mot$ Si on ' in-iB1$ %'r 1n 's $risB1e 2es 6o s so12i0n$s on %e1 $ '!2ir 1ne co6%'r'ison en re 2' :r$B1ence -es 6o s si2s son o1 non so12i0n$s %'r 2e %ro0r'66e FRANGMOTPG. =.2 Bn e1cute le programme FRANG/R)G$ *e programme 4ous permet dKtablir le tableau permettant dKidenti%ier les mots les plus centrau1 dKune reprsentation$ 7l 4ous propose le tableau D ,ang 1

1: @rGuence E . dans chacun des Guatre Guadrants 4ous trou4eH les mots correspondant au1 critTres de seuil sur la %rGuence et sur le rang mo=en

$ "n haut et au milieu 4ous trou4ereH les boutons 4ous permettant de %aire 4arier le seuil du rang mo=en et les seuils de la %rGuence !inimale (pour considrer le mot comme un mot %rGuent) et le seuil 7ntermdiaire (permettant dKisoler les mots trTs %rGuents)$ Le Guadrant en haut et M gauche comprend les mots M la %ois trTs %rGuents et cits dans les premiers rangs$ Le Guadrant en haut et M droite et celui en bas et M gauche comprennent les mots pour leGuel il = a une contradiction entre le critTre du rang et de la %rGuence$ Le dernier Guadrant en bas et M droite comprend les mots les plus ' priphriGues )$ +ous pou4eH diter la liste des mots par Guadrant en cliGuant sur ]"diter^& puis lKimprimer$ =." Bn e1cute le programme FLISTVOCG$ *e programme cre la liste de tous les conte1tes pour tous les mots (liste ordonne par ordre alphabtiGue)$ *ette liste est trTs longue$ Bn peut bien s`r lKimprimer$ 7l est conseill de la conser4er sous %orme dKun %ichier Gue lKon peut interroger a4ec un traitement de te1te pour tudier le conte1te de certains mots (attention pour conser4er les alignements prendre une police de caractTre non proportionnelle& du t=pe *ourrier ;ew)$ =.5 Le programme FAIDECATG$

19 Pour aider M la catgorisation on 4a sKappu=er sur les mots les plus sou4ent cits par les suCets$ Le programme 4a identi%ier les mots les plus %rGuents (de lKordre de 33 M /3 mots) et leur a%%ecter un numro$
fichier initial : C:\Etudiant\a nes\evocat!"m3 1 2 3 4 5 % & ' ( 1) 11 12 13 14 15 1% 1& 1' 1( 2) 21 22 23 24 25 2% 2& 2' : : : : : : : : : : : : : : : : : : : : : : : : : : : : acheter-vendre action ar ent #an$ue #oursicota e #oursier cac cotation cours crac* dollards do+-,ones entreprises fortune a ner ain internet investissement ,eu march nasda$ placement plus-value ris$ue sicav spculation valeurs +allstreet

Bn recherche si ces mots apparaissent ensemble ou non pour 4oir sKils %orment dCM des catgories spontanes ou des dimensions di%%rentes de lKuni4ers des rponses$ Le programme tablit la matrice de cooccurrence entre ces mots et la matrice dite de D pr%rence E entre ces mots$ *ette matrice indiGue le solde du nombre de %ois oV un mot est apparu a4ant un autre (solde [ nombre de %ois oV le mot est cit a4ant le mot ( moins le nombre de %ois oV le mot est cit aprTs le mot ()$ 7l ordonne les mots du mot le plus sou4ent cit a4ant les autres au mot le plus sou4ent cit aprTs les autres$ Pour tablir la catgorisation on tient compte des %rGuences& de ces deu1 matrices et du sens des termes$ La %orte cooccurrence peut 4ouloir dire deu1 choses . soit elle indiGue deu1 mots %aisant partie de la mLme catgorie& soit elle indiGue lKe1istence dKune relation entre deu1 catgories associes M des dimensions di%%rentes de lKobCet 4oGu$ Bn repTre aussi les D s=ntagmes %igs E tel D gagner de lKargent E& dans les matrices sui4antes on obser4e Gue gagner (n>10)est apparu / %ois a4ec argent (n>3) et GuKil est apparu a4ant argent ces / %ois$ La matrice D des galits E permet immdiatement ce reprage$

23

E-."./0 -E 12 32"4.CE -E5 64E7E4E0CE5 ************************************* 0umero Cate ! 3 & 2 2% 2) 24 2' 1% 1( % 23 15 ************************************************************** 3 * ) 3 12 5 2 ' 4 % % -2 1 -4 & * -3 ) 3 2 -1 -1 3 ) ) 1 1 2 2 * -12 -3 ) ) ) 2 -1 -1 2 -2 ) -1 2% * -5 -2 ) ) ) -1 ) 1 ) -1 -1 1 2) * -2 1 ) ) ) 1 1 -1 ) ) 1 ) 24 * -' 1 -2 1 -1 ) 1 1 ) ) -2 ) 2' * -4 -3 1 ) -1 -1 ) -1 1 ) ) ) 1% * -% ) 1 -1 1 -1 1 ) -1 ) ) ) 1( * -% ) -2 ) ) ) -1 1 ) ) ) 1 % * 2 -1 2 1 ) ) ) ) ) ) 1 1 23 * -1 -1 ) 1 -1 2 ) ) ) -1 ) ) 15 * 4 -2 1 -1 ) ) ) ) -1 -1 ) ) ( * -1 ) -3 -1 ) ) ) 1 ) ) ) ) 21 * ) -4 1 ) ) ) -1 ) ) ) 1 ) 1' * -4 -1 -1 -2 ) -1 2 1 ) -1 -2 )

etcS

E-."./0 -E 12 32"4.CE -E5 C//C84E0CE5 ************************************* 0umero Cate ! 3 & 2 2% 2) 24 2' 1% 1( % 23 15 ************************************************************** 3 * ) 11 22 13 4 ' % % ' 2 1 4 & * 11 ) ( 1) 3 1 & 2 ) 3 3 2 2 * 22 ( ) ' 2 4 5 5 4 2 ) 1 2% * 13 1) ' ) 2 1 2 3 2 1 1 1 2) * 4 3 2 2 ) 1 3 1 ) ) 1 ) 24 * ' 1 4 1 1 ) 1 1 2 ) 2 ) 2' * % & 5 2 3 1 ) 1 1 ) 2 ) 1% * % 2 5 3 1 1 1 ) 1 ) ) ) 1( * ' ) 4 2 ) 2 1 1 ) ) ) 1 % * 2 3 2 1 ) ) ) ) ) ) 1 1 23 * 1 3 ) 1 1 2 2 ) ) 1 ) ) 15 * 4 2 1 1 ) ) ) ) 1 1 ) ) ( * 1 2 3 1 ) ) ) 1 ) ) ) ) 21 * ) % 1 ) 2 ) 3 ) ) ) 1 )

etcS

7ci le mot D argent E (n>3) est apparu 12 %ois a4ant le mot D actions E (n>2) et 0 %ois aprTs (cooccurrence . 12 \ 0 [ 22) le solde est de 12 (12 a 0)$ #=ntagme %ig . gagner (n>10) est apparu / %ois a4ec argent (n>3) et GuKil est apparu a4ant argent ces Guatre %ois (solde a/)$

21

.. U<e =e:BiCme =ire>7io< % La =8Ai<i7io< =e >a784orie re4ro:5a<7 3e; =iAA8re<7; mo7;.


4.1 Bn e1cute le programme FCATEVOCG. Principe . Bn cre les catgories et on a%%ecte M chaGue mot le numro de la catgorie Gui lui correspond$

Bn cre les catgories M tout instant en cliGuant sur le bouton en haut M droite ];ou4elle catgorie^ et en lui donnant un nom dans la boite de dialogue Gui sKa%%iche au centre de lKcran$ Bn a%%ecte la catgorie M un mot en cliGuant sur la catgorie (elle se met en surbrillance) puis en double cliGuant sur le mot (on peut aussi utiliser le bouton au centre ] ssigner^)$ Bn peut M tout instant modi%ier le numro dKune catgorie a%%ecte M un mot$ Bn se dplace sur toute la liste des mots par lKascenseur$ +ous pou4eH demander la liste des mots dCM a%%ects M une catgorie par le bouton en bas M droite ]liste des mots^$ Pour terminer 4ous cliGueH sur le bouton ]creH %ichiers^$ Le programme cre M ce moment lM le %ichier ???$par Gui 4ous permettra plus tard de %aire une anal=se de similitude a4ec le %ichier ???$dat (cr par * T7;7)$ *e %ichier ???$par comprend lKindication du nombre de catgories& du nombre de colonnes de lKidenti%iant et les di%%rentes catgories cres$ "n sortie on obtient le %ichier ???$tm/ Gui contient un enregistrement par mot$ *e %ichier est tri par ordre alphabtiGue$

22 4.2 Pour se %aire une ide des di%%rents mots (et de leur %rGuence) mis dans une mLme catgorie on trie le %ichier ???$caa par le programme ]T,7* TG$ Bn obtient en sortie le %ichier tri par catgories . ???$cat GuKil su%%it dKimprimer(cliGuer a4ec le bouton Droit sur ???$cat& puis sur +isualiser puis sur le menu 7mprimer)$ #i on 4eut& pour la suite des oprations& modi%ier la catgorie a%%ecte M certains mots& il su%%it dKe1cuter le programme de recodage ],"*BD* T^$ "nsuite il %aut reprendre ]T,7* T^ pour mettre M Cour le %ichier des catgories$ ttention ],"*BD* T^ ne permet pas dKaCouter de nou4elles catgories 1$ 4." On ensemble de statistiGues peut Ltre ralis sur les catgories$ Le programme ]#T T* T^ donne trois in%ormations . - le nombre de mots par catgorie (en nombre et en _) - le nombre dK4ocation par catgorie (en nombre et en _) - le nombre dK4ocation des mots considrs comme %rGuents . il 4ous est demand un seuil de %rGuence$ 7l est conseill de prendre le seuil minimum du tableau D rang 1 %rGuence E$ Bn calcule alors lKimportance des mots de ce tableau de r%rence dans chaGue catgorie$ 7ci par e1emple la catgorie 3 comprend 12 mots (/&1_) Gui ont t 4oGus 22 %ois (2_)$ Les mots %rGuents reprsentent 0A 4ocations sur les 22& donc 22&2_ des 22 4ocations$ Bn a ainsi un indicateur de la Gualit de la catgorie . est-elle construite a4ec peu de mots de %orte %rGuence ou a4ec beaucoup de mots de %aible %rGuence Z
fichier initial : C:\6ro ram 7iles\Evoc2)))\E9emples\74:1!C2" 0# 3ots Cat orie : Cat orie : Cat orie : Cat orie : "/"21 : ) ; 1 ; 2 ; 3 ; 41& 1& 4!1 1)(4 21 5!) && &!) 3%3 '&!1 1% 3!' 3) 2!& /ccurences (%2 '&!( 25 2!3 3ots fre$uents 4(5 51!5 % 24!) ) )!) 5% &2!& 55& 5)!( en nom#re et ; sur /ccurences

Le programme FDISCATG donne la statistiGue des rangs pour chaGue catgorie$ *eci permet de Guali%ier les catgories dKune maniTre comparable M celle des mots (programme , ;-!BT)$

Bn peut cependant et en prenant beaucoup de prcaution aCouter des catgories$ Pour cela il %aut diter le %ichier ???$P , et aCouter M la %in de liste initiale des catgories la (ou les) nou4elles catgories sans oublier dKcrire sur les 2 premiTres colonnes le numro de la catgorie$ 7l %aut aussi modi%ier le nombre des catgorie . modi%ier le premier nombre de la premiTre ligne du %ichier$ "nsuite on relance ,"*BD* T et on a%%ecte les mots M cette nou4elle catgorie(s)$
1

23

/. Po:r;:i@a<7 >e77e =ire>7io< o< r8i<De>7e =a<; 3e Ai>6ier i<i7ia3 3e; >a784orie; =e; mo7; 9:i >om5o;e<7 3a Eo<e 7eB7e =e >6a9:e e<re4i;7reme<7.
Bn e1cute le programme ]* T7;7^$ Principe . Bn 4a enrichir le %ichier initial ???$t1t par les in%ormations du %ichier catgorie ???$caa$ Bn rcrit les enregistrements dans le %ichier ???$dat en insrant en dbut dKenregistrement les colonnes de lKidenti%iant puis une nou4elle Hone comprenant les catgories correspondantes au1 mots du te1te (on pr4oit au ma1imum 33 mots catgoriss)$ Le listing de sortie de ce programme donne des in%ormations complmentaires$

7l indiGue le nombre de suCets pour lesGuels une catgorie est plus ou moins redondante$ Les mots de la mLme catgories peu4ent& en e%%et& se trou4er une ou plusieurs %ois dans la rponse dKun mLme suCet$ 7ci la catgorie 2 est apparu cheH A suCets& deu1 suCets lKont nonc 1 seule %ois& trois suCets 2 %ois et un suCet 3%ois$ LKa4ant derniTre colonne indiGue lKimportance de cette catgorie en terme du pourcentage de suCet a=ant nonc la catgorie (ici la catgorie 1 la t nonc par 0 suCets soit 0WA [ :3&3_)$ La derniTre colonne indiGue le poids de la redondance (la catgorie a t nonc 2 ou plusieurs %ois) . dans le cas de la catgorie 1& 1 suCet est dans ce cas soit 1W0 [ 23_$ Le listing se poursuit par la matrice de cooccurrence (en nombre)& celle dKimplication (133 R cooccurrences W la %rGuence de la catgorie la plus petite) et celle de pr%rence entre les catgories$ Ce :ic&ier es cr$$ %o1r %er6e re 2'n'2>se -e si6i2i 1-e -es c' $0ories& le %ichier ???$P , ncessaire a t cr par le programme * T"+B*$ Bn peut ensuite directement e1cuter le logiciel dKanal=se de similitude$ A en ion choisir dans ce logiciel le programme ";T,"#7! puis %aire le choi1 de lKindice de similitude . en premier utiliser lKindice de *ooccurrence puis %aire une anal=se a4ec lKindice dK7mplication Gui permet de 4oir les inclusions entre catgories$

2/

1 . Com5arai;o< =e 3eBi9:e;.
Bn peut maintenant crer des sous-populations$ Pour cela on utilise le programme ]#"L"+B*^$ 7ci on

cre le %ichier des suCets D Ceunes E . slectionns par les codes 1 et 3 (spares par un blanc2) dans la colonne 2 de lKidenti%iant$ prTs a4oir 4alid et e1cut on obtient un ensemble de %ichiers (111$T!1& 111$T!2& 111$T!3 et 111$T!/& 111$* si on a prcdemment e1cute * T"+B* sur le %ichier de la population totale)$ #ur ces %ichiers on peut %aire les anal=ses prcdentes (, ;-!BT& , ;-@,N& L7#T+B*& 7D"* T& D7#* T& #T T* T& * T7;7& , ;-!BTP)$ "lles donnent des rsultats pour cette sous-population$ #i on rpTte cette opration sur les suCets Ugs (code 2 et / et 0 de la colonne 2) on peut comparer les le1iGues par le bouton ]*B!PL"?^$ Le rsultat est un listing comprenant les mots uniGuement dans le premier %ichier (ici Ceunes)& ceu1 uniGuement dans le second %ichier& puis les mots communs a4ec leurs %rGuences respecti4es et une comparaison des spci%icits sur les mots apparus plus de 0 %ois$

Bn peut %aire la slection sur un ou plusieurs codes$ Dans ce dernier cas il %aut les sparer par un blanc$

20

PRECONISATIONS
7l 4aut mieu1 utiliser le programme "+B*2333 par bloc . L"?7NO" \ T,7"+B* puis ;"TTB7" Ne %'s o1!2ier ens1i e -e re%'sser TRIEVOC pour a4oir un %ichier ???$tm2 correct #ui4ant les besoins lancer , ;-!BT& L7#T+B*& 7D"* T et , ;-@,N (tableau rang W %rGuence)$ *atgorisation a4ec * T"+B* puis T,7* T et si ncessaire ,"*BD* T P terminer par #T T* T et D7#* T * T7;7 . constitution du %ichier ???$D T pour lKanal=se de similitude le %ichier ???$P , a t cre au ni4eau de * T"+B*$ Bn peut anal=ser les mots souligns (ici prcds dKun astrisGue) par le programme ], ;-!BTP^$ 7l produit le mLme listing Gue ], ;-!BT^ mais en tenant compte Gue des mots souligns (prcds dKun astrisGue)$ Bn peut %aire une anal=se de sous-populations en les d%inissant par ]#"L"+B*^ puis en les comparant 2 M 2 par ]*B!PL"?^$ TT";T7B; tablir les sous-populations Guand 4ous a4eH ralis le plus possible de programmes (au moins CusGuKM , ;-!BT et au mieu1 aprTs ,"*BD* T)$

2A

!nne"e 1 # Les diffrents fichiers uti$iss par E%O&2'''.

???$t1t est le %ichier des donnes ???$tm1 est un %ichier temporaire ???$tm2 est le %ichier des mots tris par ordre alphabtiGue (a4ec le te1te intgral des rponses du suCet) ???$tm3 est identiGue M T!2 mais comprend en plus la %rGuence du mot ???$tm/ est identiGue M T!3 mais comprend en plus la catgorie du mot ???$dis est le %ichier de la distribution des rangs pour chaGue mot ???$caa est le %ichier des mots et de leur catgorie par ordre alphabtiGue ???$cat est le %ichier des mots et de leur catgorie par ordre de catgorie ???$dat est identiGue M ???$t1t (%ichier initial) mais on aCoute& entre lKidenti%iant et le te1te initial& les catgories des mots du te1te$ ce %ichier est associ le %ichier paramTtre ???$P , permettant une anal=se de similitude des catgories$ ???$7D" est cr par le programme L"?7NO" P cKest un %ichier comprenant les colonnes de lKidenti%iant& il permet de crer le %ichier ???$D T$ Pour +isualiser lKun de ces %ichiers il %aut cliGuer sur le nom du %ichier a4ec le !o1 on Droi alors apparaQt une boite indiGuant ]le nom du %ichier^ et en dessous ]+isualiser^ 7l %aut alors cliGuer a4ec le !o1 on G'1c&e$

22

A<<eBe 2 # $es principes de constitution des mots et synta mes.


Bn appliGue le plus sou4ent les rTgles sui4antes$ Bn spare s=stmatiGuement lKadCecti% du nom$ Bn conser4e le nom compos Gui ren4oie M une entit uniGue . premierministre& balance-des-paiement& banGue-de-@rance$ !ais on spare les complments de nom Gui ren4oie M deu1 entits di%%rentes . le pre de pierre& lKaction du gou4ernement& le budget de lK"tat$ Bn peut conser4er les 4erbes a4ec leurs temps$ Bn peut choisir de perdre cette in%ormation et de conser4er les 4erbes M lKin%initi%$ A en ion le programme nKest pas per%ormant pour lKanal=se des phrases$ Dans le cas oV il = aurait de nombreuses phrases& il %aut alors re4enir au conte1te des 4erbes (par le listing de L7#T+B*)$

2:

A<<eBe 3 Comme<7 >6oi;ir 3e; ;e:i3; :7i3i;8; 5ar 3e 5ro4ramme RANG)RQ

Princi,e Bn se r%Tre M une loi d%inissant la distribution thoriGue du le1iGue . la loi de 87P@@$ Bn recherche les carts M cette loi thoriGues$ La distribution obser4e sKen carte de deu1 maniTres . les mots de %aibles %rGuences sont plus nombreu1 Gue pr4us& les mots de %ortes %rGuences sont moins nombreu1 Gue pr4us par la loi$ -oici un exem,le Bn cherche ces deu1 Hones . ici on 4oit sur la distribution du nombre de mots (deu1iTme colonne) GuKil = a un changement %ort entre la %rGuence A et la %rGuence 0 (de A M 1A en colonne 2) et Gue les %rGuences a=ant peu de mots (1 ou 2) sont suprieures ou gale M 11$ Pour 4ri%ier cela on calcule la loi de 87P@@ sous deu1 %ormes . "n colonne / on calcule (colonne1 1 colonne2) Gui de4rait Ltre gale M une constante (ici on a di4is le rsultat par la mo=enne de la colonne 3) "n colonne 0 on calcule (Log (colonne2)) Gui de4rait Ltre aussi gale M une constante %reGuence nb$ mots ;b 1 ,g (nb 1 ,g) W !o=enne Log(;b) 1 339 339 0&02 0&:3 2 22 1// 2&30 /&2: 3 29 :2 1&/2 3&32 / 12 A: 1&11 2&:3 0 1A :3 1&33 2&22 A A 3A 3&09 1&29 2 / 2: 3&/A 1&39 : 2 1A 3&2A 3&A9 9 / 3A 3&09 1&39 13 / /3 3&A0 1&39 11 1 11 3&1: 3&33 12 1 12 3&23 3&33 13 2 2A 3&/2 3&A9 1/ 1 1/ 3&23 3&33 1A 1 1A 3&2A 3&33 21 2 /2 3&A: 3&A9 22 1 22 3&// 3&33 02 1 02 3&93 3&33 :2 1 :2 1&/2 3&33 !o=enne A1&32 1&33 1&/3 87P@@ ,g 1 ;b [ *onstante

29

33

!Ra<4 B )r89:e<>e# F mo?e<<e


6,00

6,00 5,00
4,00 3,00 2,00 1,00

4,00 2,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Srie1

0,00 0,00

20

40

60

80

100 N2 mo7;

La norme est 1$ Bn sKaperboit Gue les mots a=ant une %rGuence suprieure M A ont une 4aleur in%rieure M 1 (sau% le tout premier)$ Dans le deu1iTme graphiGue on trou4e une Hone Gui4alente . les mots a=ant une %rGuence suprieure M A ont une 4aleur in%rieure M 1&:$

Lo4!<2 mo7;# 8,00 6,00 4,00 2,00 0,00 -2,00 0 20 40 60 80 100 N2 mo7;

Bn 4oit nettement dans les deu1 cas Gue les 4aleurs de A ou 2 indiGuent le seuil minimal et Gue sur la courbe logarithmiGue la 4aleur de 11 indiGuent une 4aleur intermdiaire$

Vous aimerez peut-être aussi