Vous êtes sur la page 1sur 22

LING3822 : SYNTAXE

LABORATOIREs DOBSERVATION DE LA LANGUE


au moyen de lanalyseur linguistique

Auteure : Gisle Chevalier chevalg@umoncton.ca

CRLA, Universit de Moncton Automne 2005


En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -1-

Ce cahier est un premier pas vers llaboration dun matriel daccompagnement pour lenseignement/lapprentissage de la syntaxe destin des tudiants qui ne se sentent pas de vocation pour la linguistique, mais qui doivent obligatoirement aborder ce domaine sans toujours matriser les notions grammaticales pralbles. Les cinq laboratoires que je mets en ligne dans lespoir de trouver une ventuelle collaboration, visent montrer comment apprhender NooJ et obtenir des rsultats assez rapidement. Cest un premier jet, improvis en quelques heures, qui, je lespre mnera une trousse bien structure dans quelques mois.

Vous pouvez tlcharger le programme NooJ gratuitement et vous joindre la communaut NooJ en allant sur le site suivant : http://perso.wanadoo.fr/rosavram/pages/noojpag.html Les activits exploitent le texte La dame de trente ans, qui vient avec le logiciel et les ressources lexicales du franais. Le dveloppement de ce matriel est fond sur le manuel dutilisation de INTEX, et des des chapitres disponibles en novembre 2005 des manuels complmentaires en prparation pour lutilisation de NooJ, celui que prpare Michel Roux, pour le franais, et celui de Max Silberztein, pour langlais. (Consulter longlet (doc & help) sur le site NooJ).

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -2-

Premier laboratoire

NooJ et les donnes numriquess sur un texte


Prambule La prsente police de caractre indique les actions faire. Les apostrophes contiennent un choix dans un menu droul. La flche indique le rsultat des actions prises : apparition dune nouvelle fentre, ou modification dans la fentre active ou la barre de menu. Le point introduit des commentaires sur les informations que produisent les fonctions que lon explore ou vous invite faire des observations particulires. Les paragraphes fond verdtre contiennent des suggestions concernant la navigation dans laccomplissement de certaines tches rptitives.

1. Ouverture du programme NooJ Programme >> NooJ Une bote apparat Run OK pour tout message, sil y a lieu, jusqu louverture de NooJ. 2. Choisir la langue de travail Info >> Preferences General : fr Lexical Analysis : cocher o delaf.nod : lextension .nod correspond NooJ Dictionary) o lision.nod : reconnaissance des lisions du, de la, des, au, etc. Syntactic analysis : ne pas modifier. OK
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -3-

3. Ouvrir un texte analyser Project >> run project >> la femme de trente ans.nop o REM : ce texte est exempt de droits dauteurs. Son utilisation est libre. o REM : .nop signifie NooJ Project Plusieurs fentres apparaissent. La premire fentre qui apparat donne des informations sur lauteur du projet, sur la source du texte ouvert, et des donnes statistiques sur le texte : -nombre de paragraphes -le nombre de tokens : nombre de formes diffrentes qui apparaissent au moins une fois, et indpendamment de leur frquence; -le genre de tokens; -les annotations, soit le nombre de mots tiquets quant la catgorie grammaticale. La 2e fentre : Locate pattern (la fermer pour linstant) La 3e fentre : Cest le texte traiter : La femme de trente ans La grande fentre Windows indique PROJECT MODE en rouge, dans la marge infrieure droite.

Dans NooJ, plusieurs fentres souvrent successivement. Loption Cascade de Windows dans la barre de menus, ou les titres des fentres vous aideront naviguer dune fentre lautre. 1 clic dans la fentre du texte le mot TEXT apparat alors dans la barre de Menu, droite de WINDOWS. 2 clics sur annotations dans le cadre blanc de la bande titre grise Fentre untitled apparat, ainsi que Vocabulary constains 17707 entries dans la zone grise, juste en-dessous. NooJ prsente la liste des mots par ordre de frquence (freq). On peut cliquer sur entry de la barre, pour obtenir un classement par ordre alphabtique et revenir lordre par frquence en cliquant sur freq. OBSERVATION : o de quelles catgories sont les mots les plus frquents? o quels sont les premiers mots de classe majeure, et quel rang (10e, 20e, 30e mot de la liste?) commencent-ils apparatre, de quelles catgories sont-ils? o quelle est la catgorie des mots de freq. de 100, de 50? 5. Fermer NooJ Project >> close project File >> exit

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -4-

Deuxime laboratoire

NooJ et les statistiques lexicales sur un texte

1. Ouvrir NooJ DEMARRER >> NooJ Info >> Preferences >> General : fr >> Lexical Analysis : delaf.nod et lision>>OK Pour ne pas perdre de vue les fentres que NooJ rapetisse occasionnellement : agrandir la fentre de NooJ en pointant le curseur sur le bas de fentre et en tirant la fentre vers le bas, sans quelle ne touche la barre des tches de Windows. 2. Ouvrir le texte analyser Project >> Run project >> la dame de trente ans.nop 1 clic dans fentre du texte 2 clics sur annotations Remarquez que le mot TEXT dans la barre de menu est remplac par DICTIONARY. Pour mieux visualiser la suite : Clic sur WINDOWS dans la barre de menus >> TILE VERTICALY Ajuster les fentres VOCABULARY et LA DAME DE TRENTE ANS de faon ce quelle ne se touchent pas et ne remplissent pas compltement la fentre de NooJ.

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -5-

3. Exploration du tableau de vocabulaire du texte La femme de trente ans 1 clic sur DICTIONARY >> view as a table :

Une table de style chiffrier apparat. Cest la liste des mots contenus dans le texte, et leurs proprits morphologiques, syntaxiques et smantiques dcrites dans les diffrentes colonnes. Agrandir la fentre en cliquant sur le carr du milieu de la barre de menu dans le coin droit suprieur. Rduire la largeur de la colonne S-lemme en cliquant sur la barre verticale entre S-lemme et catgorie, et en draguant la barre vers la gauche, de faon avoir toutes les colonnes lcran. OBSERVATIONS : partir des colonnes du tableau de vocabulaire, comparez les informations prescrites dans un dictionnaire catgoriel selon la grammaire gnrative avec les informations que fournit le dictionnaire de NooJ. Information morphologique : Genre. Nembre. Personne. Temps. Information grammaticale : V, N, A, ADV, PREP, PRON, CONJS, INTER, etc. Information smantique : les contraintes de slection Information structurale : la structure des noms composs et il est possible dajouter des catgories, comme les domaines (mdical, transport, etc.), le cadre de sous-catgorisation. REM : NooJ est bas sur les principes de la grammaire distributionnelle de Harris et de nombreux ouvrages ont t consacrs la description exhaustive des mots du franais, et de nombreuses autres langues. 4. Observer la description des units particulires Aller aux mots suivants en utilisant lascenseur, droite de lcran, et remarquez entre autre : abaisse z3 abattt z2 Pourquoi z2 ou z3? Connaissez-vous ces mots? REM : Dans NooJ acadien, on pourrait utiliser z2 pour les rgionalismes, et z3 pour les emprunts, en chiac.

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -6-

agent de change air froid

sous Sem (smantique), il y a la note Hum, sous Structure, NDN, c.a.d. Nom compos dun nom, de la prposition de suivie dun nom. sous Sem (smantique), il y a la note Conc (concret), et sous Structure, NA, c'est--dire, que cest un mot compos dun nom suivi dun adjectif.

1 clic sur le titre de la colonne Sem les entres sont ordonnes selon les informations smantiques (en commenant par labsence de donnes) Aller la fin du texte en descendant lascenseur dans la barre verticale droite, jusqu la fin. Noter les annotations smantiques en remontant tranquillement lascenseur: Hum, Coll, Conc, Anl, Abst, etc. o bon got et grand air, ont le trait [Abst] o air froid a le trait [Conc]
rem : air est-il concret ou abstrait, au bout du compte?!

1 clic sur lentte de la colonne Struct les entres sont ordonnes alphabtiquement selon les codes de la structure. Quels mots ont une information dans la colonne structure? Daprs les entres du dictionnaire du texte de Balzac, quelle est la signification des annotations dans le dictionnaire. XX VX NX4 NDN NAN XN VN XA PN

1 clic sur genre Les mots fminin sont regroups, puis les mots masculins (quand il y a une valeur) ET ainsi de suite pour toutes les enttes de colonnes. REM : *multi* veut dire que le mot pour prendre de multiples catgorisations, c.a.d. quil est morphologiquement ambigu. 5. Fin du deuxime laboratoire Project >> close project File >> exit
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -7-

Troisime laboratoire

Lanalyse lexicale du texte


Ouvrir NooJ choisir la langue de travail et prparer le matriel (texte et ressources lexicales) DEMARRER >> NooJ Info >> Preferences >> General : fr >> Lexical Analysis : delaf.nod et lision>>OK Project >> Run project >> la dame de trente ans.nop 1 clic dans fentre du texte

1. Gnrer le tableau de concordance pour un mot Dans la fentre du texte 2 clics sur tokens Tokens in La femme de trente ans dans la bande bleue 1 clic sur le premier mot >> 1 clic sur un bouton de couleur (au bas de la bote) Concordance for La femme de trente ans indique le nom de la fentre dans la bande bleue : Selected tokens 3/3 (dans la bande grise du bas de la bote) NooJ prsente la squences recherche au centre du tableau, et un court contexte gauche et droite de chaque occurrence (token). Dans le coin infrieur droit : le nom de la squence recherche et le nombre doccurrences trouves.

Faire en sorte que la fentre TEXTE et la fentre Concordance soient cte cte.

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -8-

Dans la fentre Concordance 1 clic sur un des mots de la colonne Seq. le mot est surlign dans la fentre du texte et donne ainsi voir un contexte large. 1 clic sur le bouton clear concordance dans le coin suprieur gauche. les donnes sont effaces : RE = token recherche 0/0 le bouton exporter permet de conserver les donnes dans un fichier .txt, pour exploitation dans un autre logiciel, de traitement de texte, chiffrier ou base de donnes. Ce fichier sera enregistr dans le classeur NooJ qui a t cr lors de louverture du programme. Au labo, ce classeur est enregistr sur le serveur P, ladresse de votre compte. 2. Colorier le texte Ne pas colorier le texte sil y a plus de 200 occurrences, car le systme, dans son tat actuel risque de geler , et vous obliger de repartir zro. Dmarrer >> NooJ, etc. Dans la fentre du texte 1 clic sur tokens (pour avoir lordre alphabtique) CTRL+clic sur main (43) et mains (17) >> 1 clic sur un bouton de couleur la liste des occurrences apparat Dans la fentre Concordance 1 clic droite de la souris une bote de menu contenant deux sries de commandes 1 clic sur coloring matching sequence text

les occurrences sont en couleur dans le texte 2 clics sur la 11e occurrence ( aissa tomber sur la main dArthur ) : Voir le rsultat dans la fentre du texte 1 clic sur le bouton Clear Concordancedans le coin suprieur gauche. 3. Fin du 3e labo Project >> close project File >> exit

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. -9-

Quatrime laboratoire

Les requtes lexicales au moyen dexpressions naturelles


` Dmarrer >> NooJ Project >> run project >> La dame de trente ans.nop 1. Trouver les occurrences de formes du mme mot (Locate Pattern) Dans la fentre du texte (un clic de souris) CTRL + L (ou 1 clic droite sur la souris) >> locate pattern Apparat Locate pattern in La femme de trente ans Cette fonction permet de chercher dans le texte des suites de mots, les diffrentes formes dun mot ( main au singulier et au pluriel), des constructions particulires ( auxiliaire + participe pass)

Au cours de ce labo, nous passerons alternativement dans les fentres TEXTE, Concordance, Locate pattern. Pour naviguer plus facilement, choississez la disposition Cascade dans Windows, et disposez les fentre de sorte quelles ne se cachent pas lune derrire lautre. -aller dans Windows >> Cascade, puis cliquer dans la bande de titre des fentres utiles; -aller dans Windows >> cliquer sur le nom de la fentre que vous voulez en premier plan -minimier les fentres inactives, et arranger vos fentres actives pour quelles ne se touchent pas, et cliquer de lune lautre. Pour toute nouvelle requte, CTRL+L vous ramne la fentre des requtes.

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 10 -

1 clic dans a NooJ regular expression taper main dans la fentre rectangulaire

1 clic sur un bouton de couleur table de concordance (noter le nombre : 43). RE= main 43/43

Retour la fentre Locate pattern ou TEXTE : (CTRL + L) taper : mains dans la fentre rectangulaire >> choisir une autre couleur table de concordance. RE = main 60/60) (mme titre de requte, pas mains) Dans la fentre de concordances Ascenseur vers la fin les occurrences du pluriel se sont ajoutes celle du singulier

2. Requte par disjonction : SOIT main SOIT mains Dans la fentre du texte CTRL+L >> taper (mains+main) >> clic sur le bouton gris table de concordance. RE=main 120/120 Dans le tableau de concordance 1 clic droite sur la souris >> Color matching sequences in text

les occurrences sont colories ou soulignes (bouton gris) dans le texte. Dans Concordance : clear concordance

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 11 -

3. Requte par lemme Dans la fentre Locate pattern Taper <mains> >> clic sur une couleur table la concordance : RE=main 60/60 le nom est au singulier, alors que la requte est exprime au pluriel le tableau donne les occurrences de main et de mains.

Taper <main> >> clic sur gris table de concordance : RE=main 120/120 Dans la fentre Concordance 1 clic droite sur la souris >> Color matching sequences in text

Dans la fentre du texte 1 clic sur la 3e occurrence avant la fin (chot de ses propres mains) Agrandir la fentre texte trois occurrences du mot main devraient tre visibles votre cran Toutes les occurrences sont la foi soulignes et colories, ce qui signifie que la forme au pluriel et singulier entoures des crochets ouvrant ( < ) et fermant ( >) sont interprtes par NooJ comme la mme forme de base, appele le LEMME.

Dans la fentre Concordance clic sur clear concordance (dans le coin gauche suprieur) Amusez vous taper des verbes conjugus des formes rares, des formes des verbes trs irrguliers, des pronoms ou des articles qui ont plusieurs formes

Fin du 4e laboratoire Project >> close project File >> exit

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 12 -

Cinquime laboratoire

Les requtes lexicales par catgorie grammaticale


Dmarrer >> NooJ Project >> run project >> La dame de trente ans.nop 1. Recherche de mots dune catgorie par disjonction : le+la+les+l Ctrl+L Dans la fentre locate pattern slectionner dans le cadre Limitation (en bas droite) Only : 100 matches Comme nous travaillons sur une catgorie autre frquence dans les textes, limiter le nombre doccurrences 200 avant de demander de colorier les articles dans le texte, au risque de causer une panne du programme. Le cas chant, fermez le programme en utilisant le programme de gestion des tches : [ctrl+alt+supprimer] >> terminer le programme. INUTILE denvoyer le message derreur. Revenir la case dpart Redmarrer tout. Dans NooJ regular expression taper : le+la+les+l >> bouton rouge >> 1 clic droite >> color matching sequences in text les 100 premiers articles dfinis sont en couleur dans le texte. Dans le tableau de concordance clic sur len-tte de la colonne seq les articles sont ordonns alphabtiquement Tous les articles sont-ils utiliss dans les 100 premires occurrences? Essayez la mme requte en essayant diffrentes combinaisons de majuscules et minuscules. NooJ discrimine-t-il la majuscule et la minuscule dans ce contexte? Organisez les fentre de concordance et de texte cte cte, pour aller facilement de lune lautre
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 13 -

Dans le tableau de concordance click sur les la colonne seq les mots sont ordonns alphabtiquement 2. Recherche des articles par le lemme : <le> Dans la fentre Concordance Clear concordance (dans le coin suprieur gauche) les occurrences sont toutes effaces Ctrl+L >> a NooJ regular expression >> taper <le> >> bouton de couleur Table de concordance : Query 100/100 (5054/5054, si on demande all matches) nimporte quelle forme devrait avoir le mme rsultat remarquez que lorsquon utilise les crochets simples, le tableau de concordance ne spcifie pas le nom de la requte Toutes les formes sont-elles prises en compte dans la requte? Dans la fentre de locate pattern All matches Taper : <le>+l >>> bouton Concordance : Query : 5991/5991 occurrences Est-ce que toutes les occurrences de la sont bien des dterminants dfinis? (trouvez quelques cas contraires, si cest possible de catgories diffrentes) Comment formuler une requte pour vfirier si les formes la et l sont ambigus pour NooJ?

3. Recherche des variantes dun mot par catgorie Dans la fentre Concordance Clear concordance (dans le coin suprieur gauche) les occurrences sont toutes effaces. Dans la fentre du TEXTE CRTL + L >> taper <DET> >> bouton gris Querry : 15 239 / 15 239 Quest-ce quun DET pour NooJ? Trouvez toutes les sous-classes de DET dans la liste de concordance. Si par malheur vous avez demand de colorier les occurrences dans le texte, repartez la case de dpart : CTRL+ALT+SUPPRIMER >> terminer maintenant et vous savez maintenant comme revenir au point o NooJ est tomb en panne. Fin du 5e laboratoire Project >> close project File >> exit
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 14 -

Sixime laboratoire

Les requtes au moyen de graphes


Dmarrer >> NooJ Projet >> run project >> la dame de trente ans.nop >> CRTL + L Un graphe est outil qui reprsente sous forme de transducteurs. Il consiste dcrire une srie de trajets suivre pur quune information passe dun point de dpart un point darrive. Le graphe est, entre autres choses, un moyen de formaliser les expressions naturelles et de les sauvegarder pour appliquer les mmes requtes rptition sur un texte ou dans plusieurs textes. Les graphes sont produits et sauvegards dans le classeur syntactic analysis , que nous avons pass sous silence dans le permier laboratoire. 1. crire un graphe pour lextraction des dterminants articles dfinis File >> New >> Grammar (dernier choix du menu droulant) Create a new grammar (1) choisir la langue : fr (2) crire son nom (3) clic sur create a syntactic grammar Fentre untitled. Le choix de la langue est confirm. deux symboles apparaissent : la borne initiale (flche), la borne finale (cercle barr sur pied) loigner les deux symboles pour mettre des nuds entre les deux. Clic sur borne finale + tenir enfonc >> glisser vers la droite >> lcher >> clic dans fentre, mais pas sur des noeuds ctrl+clic au milieu de la fentre
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 15 -

un carr apparat avec le symbole <E> en bleu, au milieu, des ronds jaunes aux quatre coins.. >> clic sur le <E> le fond bleu disparat supprimer le E >> taper le >>> RETOUR >>> taper la >>> RETOUR >>> taper les >>> RETOUR >>> taper l >>> CTRL + ENTER la liste de dterminants apparat Si on quitte sans sauvegarder, le signe <E> apparat. Il faut alors ctrl+click sur le <E> et recommencer, et click+Enter, pour sauvegarder. Si on fait une erreur, cliquer nimporte o dans la fentre puis slectionner le carr ou le texte en trop (1 clic dessus), et RETOUR. clic sur borne initiale >> clic sur liste >> la liste de mot est dans un cadre et deux points sont relis clic sur liste >>> clic sur borne finale les trois points sont relis Attention, toujours aller de gauche droite. En cas derreur, pour effacer les liens indsirables, refaire exactement les mmes actions, et ce, dans le mme ordre. Prendre lhabitude de cliquer dans la fentre avant de commancer une nouvelle action. CTRL + S une fentre apparat pour la sauvegarde du graphe dans le rpertoire des grammaires (.nog = NooJ grammar) Tapez un nom descriptif >> OK 2. Appliquer le graphe au texte Dans la fentre du texte CTRL+L >>> a NooJ grammar Fentre open grammar 2 clics sur le fichier que vous venez de crer ( ou 1 clic >>> OK) retour de la fentre locate pattern clic sur une couleur Concordance : query 100/100 Fin du 6e laboratoire Project >> close project File >> exit

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 16 -

LISTE DE CODES UTILISS DANS LES DESCRIPTIONS, EXPRESSIONS RATIONNELLES, GRAPHES1 Codes relatifs aux mots <E> : empty string # : no space <WF> : any word form <UPP> : any word form in UPPERCASE <LOW> : any word form in lowercase <CAP> : any word form in Capital <L> : any one-letter word form <U> : any one-letter word form in UPPERCASE <W> : any one-letter word form in lowercase <P> : any delimiter <DIG> : any digit <NB> : any number, i.e. sequence of digits o Codes des catgories syntaxiques : N nom V verbe A adjectif DET dterminant ADV adverbe PREP prposition CONJ conjonction PRO pronom o Codes relatifs aux temps des verbes PR present INF infinitif I imparfait F futur C conditionnel S prsent du subjonctif IS imparfait du subjonctif PP participe pass o Nombre m masculin s singulier

Tir du manuel de Monsieur iMarcel Rux, de lUniversit de Marseille (France)

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 17 -

# NooJ V1 # Dictionary properties' definition # Language is: fr # Special Characters: '=' '+' '#' ' ' # List categories and properties associated with features # Example: N_Number = m + f; # Special KEYWORD: INFLECTION lists all inflectional features (used by variables $xF) # Example: INFLECTION = m + f + Present + Futur; INFLECTION = m + f + s + p + 1+2+3+ Inf + G + PP + P + Ip + S + C + I + PS + IS + F; A_Genre = m + f; A_Nombre = s + p; DET_Genre = m + f; DET_Nombre = s + p; N_Genre = m + f; N_Nombre = s + p; N_Sem = Anl + Hum + HumColl + Conc + Alim + Anim + Abst + Pol + PR; N_Struct = AAN + AN + E01 + NA + NAA + NAN + NCN + NDN + NN + NPN + NPNPN + NPV + NX + NX4 + PN + VN + VV + VX + XA + XN + XV + XX; PRO_Genre = m + f; PRO_Nombre = s + p; PRO_Pers = 1 + 2 + 3; V_Pers = 1 + 2 + 3; V_Temps = INF + G + PP + PR + IP + S + C + I + PS + SI + F; V_Synt = tr + intr + pro + aux; V_Genre = m + f; V_Nombre = s + p; X_Genre = m + f; X_Nombre = s + p;
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 18 -

TRAVAUX APPLIQUS EN SYNTAXE Quel genre de questions se poser en syntaxe et les rsoudre avec NooJ? Lest trois dmarches illstres vous proposent une marche suivre pour accomplir un travail pratique soumis dans le cadre du cours de syntaxe lautomne 2005. Vous avez le choix de travailler sur le corpus littraire du module franais, sur le corpus acadien du module ac, ou sur un texte de votre choix. Question 1 : la sous-catgorisation des adjectifs (<A>). a) quel genre de complment peut avoir un adjectif? b) quels adjectifs prennent des complments dans le texte ltude? c) lesquels nont pas de complment -est-ce que ce sont des complments slectionns? -est-ce que ce sont des complments non-slectionns? i. ii. crire une expression rationnelle pour trouver 100 occurrences. dans la concordance, liminer slectionner les squences qui ne sont pas des adjectifs (le texte na pas t tiquet quant aux catgories). -clic sur la 1re squence, CTRL+clic sur les autres squences pour conserver toutes les squences liminer. CTRL+clic DRT >>> filter out selected lines le sq. non adjectif disparaissent, mais restent en mmoire. Le nombre de sq. filtres est dduit du total doccurrences (voir dans la marge infrieure droite). -dans concordance, CTRL+clic DRT >>> export concordance vous choisissez lendroit pour sauvegarder le fichier (la cl, la disquette, ou P) iii. dans concordance, cliquez sur les adjectifs qui ont un complment slectionn, puis sauvegarder les squences CTRL+clic DRT >>> filter out unselected lines les squences qui restent sont celles que vous avez identifies comme ayant la structure A Adj SP slectionn CTRL+clic DRT >>> export concordance -nommez le fichier par un nom descriptif : ex. ADJ_SP -ouvrez le fichier (P (sur le bureau), et trouvez le fichier .txt

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 19 -

-ouvrir, OK pour les options proposes par Word -choisir le format paysage dans la mise en page et vous aurez un tableau clair. SEULES LES OCCURRENCES QUE VOUS AVIEZ SLECTIONNES SONT L. iv. dans concordance, CTRL+clic DRT >>> reset toutes les concordances trouves (y compris les non adjectifs) reviennent -trouvez les adjectifs qui nont pas de SP slectionn. Sil ny en a pas, refaire la requte en levant la limite. NOOJ NE RISQUE PAS DE TOMBER EN PANNE, SI VOUS NESSAYEZ PAS DE COLORIER LE TEXTE. Vous pouvez en tout moment visionner une occurrence particulire dans le texte, sans crainte de panne, quelque soit le nombre doccurrences. CEST LE COLORIAGE SIMULTAN DE TOUTES LES SQUENCES QUI OCCASIONNE DES PANNES (jusqu preuve du contraire)

Autres applications possibles a) On pourrait appliquer la dmarche aux formes verbales pour comparer par exemple, les usages des verbes acadiens et des verbes franais (par ex., le verbe appartenir est-il le seul verbe acadien qui na pas le mme cadre de sous-catgorisation quen franais et une grille thmatique diffrente (les rles smantiques sont inverss) (voir les contraintes smantiques dans votre manuel de syntaxe.) fr. : appartenir,V/ _____ SP (la maison appartient mon pre) Appartenir (thme, bnficiaire) ac. : appartenir,V/ ______ SN (mon pre appartient cette maison-l) Appartenir (bnficiaire, thme)

REM : appartenir est un verbe dtat plutt quun verbe daction. Cest pourquoi la personne qui est propritaire nest pas considre comme un agent, mais comme un bnficiaire. - partir dun corpus dextraits dattestations de phrases dans un corpus acadien, construites avec un verbe anglais, dcrire le cadre de sous-catgorisation des verbes anglais, crire le cadre de sous-catgorisation

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 20 -

Question 2 : les locutions prpositives Les squences PREP MOT PREP sont trs ambigus. Selon le sens, elles peuvent tre des complments slectionns, des complments non slectionns, mais galement des locutions prpositives. Pour lever certaines ambiguts, on peut construire la liste des locutions prpositives et de les intgrer dans le dictionnaire de NooJ, sous forme de mots composs. Ces formes seront codes UAMB, cad, unambiguous. Lorsque NooJ analyse un texte (annotations) ces squences ont priorits sur les formes simples, et rduisent, en principe, le risque de confondre les SP en squence libre (les complments) et les locutions prpositives. Dmarche suggre Composer une expression rationnelle (suites de mots ou symboles catgoriels) qui permette dextraire des occurrences de la squence ambigu. -Dans le texte, CTRL+Clic DRT >>> locate pattern >>> Only 100 >>> crire lexpression rationnelle >>> OK Concordance : soit que vous avez une bonne formule, et NooJ a trouv 100 occurrences soit vous avez une expression qui ne respecte pas la syntaxe de NooJ. Vrifier les symboles la dernire page du guide de labo : il est facile doublier de fermer ou ouvrir les parenthses, de confondre lutilisation des MAJ et MIN -Dans la fentre concordance, i. se dbarrasser des squences inutiles : slectionner les squences non-conformes ce que vous cherchez et filtrer les squences slectionnes CTRL+clic DRT >>> filter out selected lines le sq. non adjectif disparaissent, mais restent en mmoire. Le nombre de sq. filtres est dduit du total doccurrences (voir dans la marge infrieure droite). ii. sauvegarder les squences restantes -dans concordance, CTRL+clic DRT >>> export concordance vous choisissez lendroit pour sauvegarder le fichier (la cl, la disquette, ou P) iii. les importer dans un chiffrier (excel, par exemple) Ouvrir excel, OK pour toutes les options. Ajuster la largeur des marges pour y voir clair. liminez les squences qui ne conviennent toujours pas. Dans la colonne des locutions, remplacer les prpositions lides (d, a,) par de et liminez la colonne du contexte avant, et aprs la locution. crivez PREP dans la colonne droite de la 1re locution, UNAMB dans la colonne suivante.
En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 21 -

POUR ACCLRER LE PROCESSUS :Copier le contenu de ces deux cellules (CTrL+ C) et le coller dans toutes les cellules jusqu la fin de la liste. (moyen rapide : Slectionner les deux colonnes jusquau bout de la liste, puis faites CTRL+ V). Dans une 3e colonne, dcrire la structure en suivant le modle observ dans le 2e laboratoire (le dictionnaire en tableau). Sauvegarder frquemment(CTRL+S). Copier le fichier dans Word pour la suite. Crer un dictionnaire : suivre le guide pour la cration dun nouveau dictionnaire / venir me consulter. Suite donner Vous pouvez maintenant - vous exercer sur un plus grand nombre doccurrences, - essayer de trouver les locutions avec dterminant, - chercher des loc. prpositives dans un corpus acadien, pour voir si on y trouve les formes du franais littraire, sil ny aurait pas des formes non usites en franais littraire. REM : le franais parl comprend toujours moins de diversit de formes que le franais crit. Les formes PROTOTYPIQUE sont plus frquentes que les formes plus complexes. Dans la mesure o sera exprim par si dans le discours non surveill. Les locutions prpositives ont des squences varies (de manire , la condition de, partir de). Vous pouvez faire une requte par construction, ou, si vous avez la bosse mathmatique et logique, essayer de formuler une expression rationnelle qui trouvera les diffrentes combinaisons. (Voir le manuel NooJ anglais pour plus de dtails) 3e Question de syntaxe : les dterminants Les dterminants reconnus par NooJ, dans son dictionnaire actuel, ne couvre pas tous les types de dterminants. Mis part larticle lid, il nextrait pas les dterminants qui ont une forme compose. (voir le paragraphe sur la dfinition des dterminants dans votre manuel). Beaucoup de, une foule de, etc. En suivant essentiellement une dmarche similaire celle de la questions 2 sur les locutions prpositives, nous pourrions soit ajouter la liste des dterminants de forme compose dans le dictionnaire, et les tiquetter comme des formes UNAMB. Suite possible Voir si les locutions qui servent de dterminant sont utilises en fr. acadien et si le fr. acadien en a qui ne sont pas ressorties du corpus littraire que vous avez explor. Reprsenter la grammaire des dterminants sous forme de graphe pour extraire les occurrences dans dautres corpus (voir le manuel INTEX et NooJ pour suivre le modle)

En cas de panne mineure aller (1) . En cas de panne majeure aller (2) , puis rouvrir le fichier: (1) Project >> close >> Project >> Run project >> La dame de trente ans.nop. (2) Fermer NooJ >> DEMARRER >> NooJ >> Info >> Preferences >> General >> fr >> Lexical Analysis >> delaf.nod et lision. - 22 -

Vous aimerez peut-être aussi