Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
La sémantique est une branche de la linguistique qui étudie les signifiés, ce dont
on parle, ce que l'on veut transmettre par un énoncé. Le support de la sémantique,
la syntaxe, concerne pour sa part le signifiant, sa forme, sa langue, sa graphie,
sa grammaire, etc. ; c'est la forme de l'énoncé.
Sommaire
1 Étymologie
2 Différence entre l'analyse sémantique et l'analyse syntaxique
3 Applications à l'exploration de données
3.1 La découverte des connaissances dans les bases de données
3.2 Cas particulier de la fouille textuelle
3.3 Cas particulier des ontologies
4 Voir aussi
4.1 Bibliographie
4.2 Articles connexes
4.2.1 Listes
4.3 Liens externes
5 Notes et références
Étymologie
Le mot sémantique est dérivé du grec σημαντικός (sêmantikos), « signifié », lui-
même formé à partir de σημαίνω (sêmainô), « signifier, indiquer » ou σῆμα (sêma), «
signe, marque ». Il a été repris à la fin du xixe siècle par le linguiste français
Michel Bréal, auteur du premier traité de sémantique, Essai de sémantique paru en
18972,3.
L'analyse syntaxique s'occupe des syntagmes, par rapport à une phrase. Il n'est pas
possible de réaliser une analyse syntaxique du mot « petites » par exemple s'il
n'est pas inclus dans une phrase, en relation avec d'autres mots compléments ou
chefs de groupe.
L'analyse syntaxique peut ainsi être identifiée comme une analyse des structures
fonctionnelles pouvant être obtenues au moyen de l'exercice des règles de la
grammaire.
Exemple :
On analysera ainsi le mot « petites » :
PETIT (Adj. ⇒ qui n'est pas grand) + E (marque de féminin) + S (marque de pluriel)
[PETIT – la base ou le radical du mot (signe lexical), E + S - sont des signes
grammaticaux].
À partir de ce même mot, d'autres analyses sont possibles sans forcément mettre en
lumière un énoncé entier (cf. introduction).
La distinction entre analyse syntaxique et analyse sémantique qui est établie ici
correspond à l'approche la plus répandue en linguistique contemporaine, celle qui
hérite du structuralisme introduit par Ferdinand de Saussure5. On rencontrera les
termes d'analyse structurale ou analyse componentielle employés comme équivalents
pour signifier au plus directement l'approche utilisée pour effectuer l'analyse
sémantique selon cette théorie. La structure est perçue comme directement sous-
jacente à la phrase, cette dernière étant une structure ainsi qu'il est mis en
évidence par la syntaxe ou la grammaire, et le mot étant considéré comme associé à
ses traits sémantiques. D'autres approches, comme principalement la grammaire de
dépendance de Lucien Tesnière, antérieure au structuralisme, réservent la
qualification de structure au niveau syntaxique. Pour Tesnière, le niveau
syntaxique est appelé plan structural tandis que le plan sémantique est considéré
comme relevant de la psychologie, et également de la logique6.
le tableau ;
le graphe : réseau sémantique, réseau maillé d'objets, de concepts, etc ;
l'arbre : cas particulier de graphe nécessitant une théorie et une exploitation
spécifiques.
Ce sont des signifiants, au sens où ils représentent les connaissances. De telles
structures sont ensuite annotées dans les données de départ, chaque donnée portant
alors la marque de son appartenance à une branche de l'arbre, une case du tableau,
etc. L'analyse reprend alors à un niveau de compréhension plus complexe.
Est-ce connu ?
Est-ce explicable ?
Est-ce utile ?
L'idéal est d'avoir un triplet NON/OUI/OUI[pourquoi ?].
Un tel projet est appelé « découverte des connaissances dans les bases de données
», en anglais KDD, Knowledge Discovery in Databases.
Ce sont en fait des données sur les données, des métadonnées. Des architectures
informatiques spécifiques permettent de gérer ces métadonnées, on parle de client
ou de serveur de métadonnées. Un système connu est le Dublin Core Metadata
Initiative (DCMI).
Le Web sémantique est un projet du même type que DCMI, visant à créer, gérer et
exploiter des métadonnées systématiques pour chaque page web. Ainsi, le contenu de
chaque page web étant explicité vers des signifiants, la machine serait capable de
raisonner sur la pertinence du contenu et non plus sur des statistiques lexicales.
Cela peut avoir des conséquences remarquables sur les technologies de recherche
d'informations, ainsi que l'allure et le fonctionnement des moteurs de recherche.
Le résumé automatique ;
L'indexation automatique ;
La génération d'index de livre (vedettes et sous-vedettes) ;
L'extraction et la cartographie de concepts ;
La classification automatique ;
Le rapprochement entre textes.
L'approche sémantique a une littérature plus féconde que l'approche syntaxique :
même si cette dernière a des résultats supérieurs, les ressources de calcul
demandées font souvent pencher la balance en faveur de l'analyse sémantique.
Les liens entre concepts peuvent être beaucoup plus complexes que la simple
subordination, sortant ainsi du cadre du thésaurus. Si les concepts sont
assimilables à des groupes nominaux, les liens sont assimilables à des groupes
verbaux : on regroupe ces liens en catégories de liens. La structure du réseau est
parfois appelée topic map.
En pratique, on pourrait ainsi traduire automatiquement un manuel d'histoire en
ontologie, en considérant cinq types de concepts (date, lieu, événement, personne
physique, personne morale) et une trentaine de catégories de liens verbaux.
En plus des lexicons, les instances peuvent pointer vers des ressources ou URI.
Généralement, ce sont les documents que l'on cherche à indexer.
Pour la machine, raisonner sur les connaissances ainsi représentées revient à « se
promener » dans le réseau de concepts, à la manière d'un réseau routier. Il existe
des algorithmes spécifiques, par exemple les chercheurs de chemins (Pathfinder),
qui cherchent le plus court chemin d'un concept à l'autre en respectant un critère
d'économie : « plus petit nombre de concepts », « plus grand nombre de langues », «
plus grand nombre de synonymes », etc. Les résultats peuvent être spectaculaires,
surtout si l'on garde présent à l'esprit que le point de départ et le point
d'arrivée ne sont pas les concepts, mais bien les URI indexés (documents de
l'entreprise).
Voir aussi
Bibliographie
Document utilisé pour la rédaction de l’article : document utilisé comme source
pour la rédaction de cet article.
John Langshaw Austin, Quand dire, c'est faire (Seuil, 1991, (ISBN 978-2-02-012569-
7))
Marc Baratin et Claude Moussy, Conceptions latines du sens et de la signification,
Centre Alfred Ernout, 1999.
Michel Bréal, Essai de sémantique : science des significations, Paris, Hachette,
1897, 349 p. (lire en ligne [archive])
Rudolf Carnap, Le dépassement de la métaphysique par l’analyse logique du langage
(1931), in Antonia Soulez, Manifeste du Cercle de Vienne et autres écrits, PUF,
1985, (ISBN 978-2-13-038852-4))
Noam Chomsky, Questions de sémantique (Seuil, 1975, (ISBN 978-2-02-002748-9))
Paul Grice, Meaning [archive], The Philosophical Review 66: 377-88. (1957)
Roland Grossmann, « Michel Bréal (1832-1915) : un homme des marches », Mémoires de
l'Académie nationale de Metz, 2008, p. 221-241 (lire en ligne [archive])
John Lyons, Éléments de sémantique (Larousse, 1978, (ISBN 978-2-03-070344-1))
Bernard Normier, L'apport des technologies linguistiques au traitement et à la
valorisation de l'information textuelle, Éditions ADBS, 2007 (ISBN 978-2-84365-092-
5) ;
François Rastier, Sémantique interprétative (Presses Universitaires de France,
1987, 2e éd. revue et augmentée 1996)
Gérard Sabah, L'intelligence artificielle et le langage, Hermès, 1988, 1989, (ISBN
978-2-86601-134-5) (ISBN 978-2-86601-187-1)
Alfred Tarski in Gilles-Gaston Granger'et al., Logique, sémantique,
métamathématique, 1923-1944 (Armand Colin, 1974)
Irène Tamba, La sémantique (PUF, Que sais-je ?, 2005, (ISBN 978-2-13-054856-0))
(en) Anna Wierzbicka, Semantics : Primes and Universals, Oxford University Press,
1996 (ISBN 978-0-19-870003-6)