Vous êtes sur la page 1sur 13

Analyse thematique de textes

pour permettre une lecture


rapide
Brigitte Grau
Nicolas Hernandez
Groupe LR LMS (Orsay)
Besoins utilisateurs
Questions propos des points traits dans
un texte
De quoi ce texte parle-t-il ?
Est-il pertinent pour mon besoin d'information ?
Vue informative
Questions prcises sur des points
spcifiques
Ce texte contient-il la rponse que je cherche ?
Dans quelle partie ?
Vue indicative

Systmes existant pour acceder au


contenu des documents
Systmes usuels : Google, Tilebars (Heast 96)
Brve description selon la requte : filtre
Entrane la lecture de l'ensemble du texte
Exploitation de la structure logique
La structure est dj prsente explicitement !
Bien adapt pour de gros documents (Jacquemin et al. 02)
Dtection automatique de la structure
Boguraev et al. 97, Salton et al. 96
Description et rsum selon l'axe des thmes
SumUM (Saggion et al. 00)
Notre proposition
Visualisation et navigation intra-texte
Donner des clefs de lecture
Une prsentation intelligible et rapidement lisible
Plus prcise que la prsentation d'un rsum
Sans procd de gnration (par extraction)
Moyens
Analyse thmatique des textes
Dcomposition en segments
Structuration hirarchique des segments
Caractrisation des segments
Thme : descripteurs thmatiques
Rle : meta-descripteurs argumentatifs

pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Thmes globaux : sirop, jus de fruits, vin, Iait
pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Lxemple d'exploration d'un texte
pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Thmes globaux : sirop, jus de fruits, vin, Iait
pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Theme |oca| :
Theme g|oba| :
Heta-descr|pteurs :
vin
mlange, compos
analyse, technique
Themes |ocaux :
Theme g|oba|:
Heta-descr|pteur :
vin
got, noisette
caractristique
Lxemple d'exploration d'un texte

pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Thmes globaux : sirop, jus de fruits, vin, Iait
pid"p1"~En1991.alaStationINRAdeDiion.PatrickEtievantetBrunoMartincommencaientl'analyseduviniaune.
produitseulementdansleJura.LegotspeciIiquedecesvinsresultedeleurtechniqued'elevage:onlaisselevinvieilliren
tonneaupendantplusieursannees.sousunvoileepaisdelevuresSaccharomycescerevisiae.Cetypedevinestegalement
IabriqueenAlsace.enBourgogneetaGaillacsouslenomdevindeIleurouvindevoile;iln'ad'equivalental'etranger
quedans lexeres. les sherrys ouletokaydeHongrie. Quelles molecules sont responsables desongot
caracteristique?/p~
pid"p2"~Lesvinscontiennentdescentainesdecomposesvolatils.dontundixiemesontaromatiques.desortequela
detectiondesmoleculesresponsablesd'unarmeparticulierestnotoirementdiIIicile:chercherlecoupable.parmi300
suspects...Audebutdesannees1970.certainsavaientcruquelasolerone(le4acetylgammabutyrolactone)etaitl'arme
principalduviniaune.mais.en1982.PierreDubois.aDiion.retrouvalasoleronedansdesvinsrouges:lamoleculeavait
unalibi./p~
pid"p3"~Onsoupconnaalorsle4.5dimethyl3hydroxy2(5H)Iuranone.ousotolon.moleculeconstruiteautourd'un
cycledequatreatomesdecarboneetd'unatomed'oxygene.Commelesotolonetlasoleronesontenconcentrations
minimesdanslesvinsdevoileet.desurcrot.chimiquementinstables.leschimistesdiionnaisontchercheaoptimiserleur
extractionaIindedeterminerlamoleculeresponsabledugotdeiaune./p~
pid"p4"~L'analyselaplusdirected'extraitsdevinsestlachromatographie:oniniecteunechantillondansunsolvant
quel'onvaporiseetonIaittraverseraumelangeunecolonnerevtueinterieurementd'unpolymere.quiretientlesdivers
composesdumelangeadesdegresdivers;enbasdelacolonne.ondetectelasortiedescomposessepares.Lepremier
travaildeschimistesIutlamiseaupointd'unevariantedecettetechniquepouridentiIierlescomposespresentsen
quantitesminimesdansdesmelangescomplexes./p~
pid"p5"~Leschromatogrammesd'echantillonsdevinIurentalorscomparesaceuxdesolutionspuresdesotolonetde
soleronedesynthese:lesotolonestainsipresententre40et150partiesparmilliarddanslessherrys;lasoleronesemble
moinsspeciIique.etsesconcentrationssontsuperieuresdanslessherrys.cequiexpliquepourquoionl'ad'abordtrouvee
danscesvins./p~
pid"p6"~EnIinlesdosages.completesdetestssensorielsdesIractionsseparees.montrerentquelasolerone. aux
concentrationstrouveesdansdusavagnin(lecepageapartirduquelonIabriqueleviniaune).n'etaitpercueparles
consommateursnidanslesvins.nidansdessolutionsmodeles:lasoleronen'etaitpaslamoleculecaracteristique;le
iugementetaitsansappel./p~
pid"p7"~En1992.leschimistesseconsacrerentalorscompletementausotolon.quiavaiteteobservedansdesmolasses
decanneasucre.dansdesgrainesdeIenugrec.dansdelasaucedesoia.dansdusake...Iletaitegalementpresentdans
certainsvinsbotrytises.c'est-a-direIaitsapartirderaisinssurmaturesetatteintsparlapourriturenoble:cechampignon.
Botrytiscinerea.Iait.parexemple.lessauternesoulesvinsditsdevendangestardives.Lesotolonn'apasetetrouvedansles
vinsrougesnidanslesvinsoxydeset.surtout.ilIutdeterminequesonseuildeperceptionetaitde15partiesparmilliard
seulement./p~
pid"p8"~Mieuxencore.destestsdeconsommationmontrerentquelesvinsdevoileetaientiugestypiques.avecune
notedenoix. quandlaconcentrationensotolonetaitIortedanscesvins. AplusIorteconcentration. lesiurysde
degustationdecrivirentunenotedecurry./p~
pid"p9"~Lapistedusotolonestauiourd'huisuivieparElisabethGuichard.quiamisaupointunemethoderapidede
dosage:laconcentrationensotolondanslevindepaille(unvinprepareapartirdebaiessecheessurdesclaies).quin'avait
paseteobservee.estcompriseentre6et15partiesparmilliard;lesotolonduviniauneestsynthetisealaIindelaphasede
croissanceexponentielledeslevures.Dansdesvinsvieillisrespectivementunan.deuxans.troisans.quatreans.cinqanset
sixans.laquantitedesotolonestIaibledanslesdebutsdelamaturationetaugmentenotablementapresquatreansd'elevage.
surtoutdanslescavespastropIraches./p~
pid"p10"~DesprelevementsadiIIerentesproIondeurs.souslevoile.danslestonneaux.ontrevelequelesotolonestdeux
IoisplusconcentreaumilieuetauIonddestonneauxqueiustesouslevoile.Onsupposequelesotolonestindirectement
produitparleslevuresduvoile.quandledegrealcooliqueesteleve:celles-citransIormeraientunacideamineduvinenun
cetoacide.quiseraitliberealamortdeslevures.tombantauIonddutonneau;puisunereactionchimiquetransIormeraitle
cetoacideensotolon.enrichissantd'abordleIond.puislemilieu.puislescouchessuperieuresduvin./p~
pid"p11"~Puisquelesotolonestbienlamoleculedugotdeiaune.onchercheauiourd'huidessouchesdelevuresqui
ontlacapacited'enproduirebeaucoup;onchercheaussilesconditionsquiIavorisentlaproductiondecegot./p~
Themes |ocaux :
Theme g|oba| :
Heta-descr|pteurs :
vin
mlange, compos
analyse, technique
Lxemple d'exploration d'un texte
<seg>
L'analyse la plus directe d'extraits de
vins est la chromatographie : on injecte
un chantillon dans un solvant que l'on
vaporise et on fait traverser au
mlange une colonne revtue
intrieurement d'un polymre, qui
retient les divers composs du
mlange des degrs divers ; en bas
de la colonne, on dtecte la sortie des
composs spars. Le premier travail
des chimistes fut la mise au point d'une
variante de cette technique pour
identifier les composs prsents en
quantits minimes dans des mlanges
complexes.
</seg>
Themes |ocaux :
Theme g|oba|:
Heta-descr|pteur :
vin
got, noisette
caractristique
Vue d'ensemble du systme
Corpus
Pour l'acquisition des meta-descripteurs : textes scientifiques
(anglais et franais)
Corpus franais : 81 articles (TALN et RECTAL)
4100 mots
Pour l'analyse de textes : textes expositifs, faiblement structurs
(La Recherche, Pour la science)
Document
Segmentation du
texte
Identification des
thmes
Etiquetage
des
thmes et
des rIes
Prsentation

I'utiIisateur
Meta-descripteurs
acquis
automatiquement
Structuration du
texte
b
Segmentation thematique
La cohsion lexicale d'un
segment de texte reflte sa
cohrence thmatique
Analyse de la frquence et
de la distribution des mots
Unit = le paragraphe
Calcul de distance
Rupture -> Changement
Ferret, 1998 ; Hearst, 1997
Structuration
Notre intrt : structure embote
Digressions, dveloppement d'aspects particuliers
Frquent dans textes expositifs
Mme mthode que pour la segmentation
mais avec les segments comme units
Masson, 1998 ; Salton, 1996
o
Structuration
Algorithme
Mise en vidence du
niveau le + englobant
Recherche des 2
segments les plus lis et
non-conscutifs
R-application rcursive
pour les segments
englobs
Intersection des phrases
Intersection des segments
Intersection des documents
Caracterisation des descripteurs
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxx
Xxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxx
Meta-
descripteurs
C
o
r
p
u
s
Descripteurs
thmatiques
gIobaux
Descripteurs
thmatiques
Iocaux
D
o
c
u
m
e
n
t
S
e
g
m
e
n
t
7
Acquisition de meta-descripteurs
Un meta-descripteur = une locution (flexible
ou fige)
Par exemple, Nous allons montrer que, etc
Reprage d'expressions sur l'ensemble du
corpus
N-gram de 1 5 tokens de 5 occurrences
minimum
Token : mot, signe de ponctuation
Slection des formes figes dfinitives
Dans cet article ou dans cet article, nous ?
Utilisation d 'un principe de voisinage
Liste obtenue
Environ 2000 formes (forme lemmatise)
1700 obtenues sur l 'anglais
Formes pertinentes
Marqueurs argumentatifs : en consquence, par exemple
Marqueurs de mise en relief : dans cet article, nous
il se agir de
point de vue
DET reprsentation
figure CARD :
tre fonder sur
se appuyer sur
en fonction de+ DET
qui permettre de
DET rsultat de
dfinition
DET type de
DET approche
voici quelque exemple
de+ DET relation
DET type de approche
processus de
naturel reconnatre
par exemple ,
au regard de
de une part
dans ce cas
le aide de
DET prsence
en oeuvre
comprendre
composer
. DET rsultat tre
de manire
. cependant ,
sous forme de
DET notion de
proposer une mthode
dans le cadre de DET
8
Descripteurs thematiques
Caractrisation des thmes de chaque
segment
Quelque soit son importance au niveau global
Un descripteur = un groupe nominal
Boguraev et al., 1997, Saggion et al., 2000
Extraction dynamique
Sans connaissances pralables
Pertinence : selon la rptition et la position dans
le segment
Principe
Retrouver une entit sous ses diffrentes
formes
Rsolution robuste des anaphores
Rle thmatique dans la structure du texte
Selon la distribution
Thme local : descripteur interne un segment
Thme global : descripteur prsent dans plusieurs
segments
Vers une structuration hirarchique du texte
9
Application au texte
3. Defecfion de Io sfrucfure
du fexfe
I. Seqmenfofion
por cohesion IexicoIe
Z. Descripfion des seqmenfs
: idenfificofion du fhme +
onoIyse orqumenfofive
0. Pre-froifemenf
AnoIyse morpho-synfoxique + reperoqe
des phroses ef des poroqrophes
Pheforique : Infroducfion
Thme : A
Pheforique : ExempIe
Thme : A
Thme : 8
Thme : C
Pheforique : ConcIusion
Conclusion
Structure thmatique
Perspective : tudier d'autres critres
Marques linguistiques, hirarchisation de concept
dentification des thmes
dentification des rles des segments
Perspective :
Mieux slectionner les meta-descripteurs en contexte
Typer les descripteurs : mise en relief, indication du rle
argumentatif (introduction, rsultat, approfondissement,
etc.)
I0
Conclusion (suite)
Travail commun entre linguistique et TAL
Lattice (M. Charolle) et Lalicc (J.L. Minel)
Projet REGAL (projet cognitique)
ntgration des critres de cohsion lexicale et
des marques linguistiques
Pour la dtection de segments
Cadres thmatiques, marques d 'intgration linaire (ML)
Premire tude pour la structuration (ML)
Visualisation dans Context'0
Perspectives
Rsum dynamique
Mettre en oeuvre la navigation
Diffrents types de rsums
Evaluation de la prsentation du texte
propose
Par des utilisateurs et selon diffrents besoins
Exploration d'un texte pour en prendre connaissance
Recherche d'informations sur un sujet
Recherche d'une rponse prcise
Evaluation de la navigation
Les critres de navigation
II
Google
Prsentation des titres des document et surlignage des mots de la
requte dans des passages ou dans le document complet
Back
Hearst, 96 1ilebars
Ajout d'indicateurs graphiques indiquant quels segments contiennent
les termes de la requte
Plus d'information sur la structure du texte (taille et couverture d'un
thme)
Titre du
document
Termes de la requte
Segments du
texte contenant
les termes de la
requte
Un document
Back
IZ
Jacquemin et al. 02
Visualisation graphique 3D dynamique
Bien adapt pour une structure importante
Plus on rentre dans la structure, moins l'utilisation du graphisme est
adapt pour abstraire
Complter par du texte Back
Boguraev et al. 97
Dcomposition du texte en segments thmatiquement
homognes
Abstraction des segments par leur termes les plus saillants
Topic
stamps
Contenu
d'un
segment
Contenu du
document
Back
I3
Saggion et al. 00 SumUM
Rsum de textes scientifiques
Slection de l'information pertinente par application de patrons
lexico-syntaxiques
Meilleur rsumeur DUC 2002
Cot d'criture manuelle des patrons
Back

Vous aimerez peut-être aussi