Vous êtes sur la page 1sur 119

Universidade Federal de Santa Catarina

Ps-graduao em Literatura
Ncleo de Pesquisas em Informtica, Literatura e Lingustica
Florianpolis Santa Catarina - Brasil

Bento Carlos Dias da Silva


Faculdade de Cincias e Letras
UNESP/Araraquara

27 a 29 de abril de 2011 1
27 de abril
9:00 - 12:00

28 de abril
9:00 - 12:00

14:00 - 17:00

29 de abril
9:00 - 12:00

14:00 - 17:00

2
28 de abril
9:00 - 12:00

14:00 - 17:00

3
O que a Web Semntica?
Aps grande esforo de filtragem de uma avalanche de informaes,
nem sempre convergentes, sobre o que e como dever ser
implementada a Web Semntica, nesta breve introduo, apresento
uma sntese das tecnologias que implementam a Web Semntica.
Para isso, vou tomar, mais adiante e como referncia da
apresentao, o esquema clssico, conhecido como the Semantic
Web layer cake: a Web Semntica enquanto um bolo em camadas.
O esquema ilustra, em forma de camadas, as mais desenvolvidas e j
absolutamente implementadas na base, e as que ainda esto apenas
em fase de idealizao no topo, refletindo esse fato que os padres e
tecnologias da Web Semntica possuem diferentes graus de
amadurecimento e utilizao.

4
A Web Semntica configura-se como
mais uma extenso das tecnologias
associadas Internet.

De acordo com a Internet World Stats, 1,96 bilho de


pessoas tinham acesso Internet em junho de 2010, o que
representa 28,7% da populao mundial.
http://pt.wikipedia.org

5
Lembremos, de incio, que...

Em maro de 1989, Tim Berners-Lee escreveu uma proposta


de gerenciamento de informao, que referenciava o
ENQUIRE, um projeto usado para reconhecer e armazenar
associaes de informao, desenvolvido por ele no segundo
semestre de 1980, enquanto trabalhava no CERN (Conseil
Europen pour la Recherche Nuclaire) e descrevia um
sistema de informao mais elaborado. Com a ajuda de
Robert Cailliau, ele publicou uma proposta mais formal para a
World Wide Web no final de 1990.
Um computador NeXTcube foi usado por Berners-Lee como
primeiro servidor web e tambm para escrever o primeiro
navegador, o WorldWideWeb (WWW), em 1990. No final do
mesmo ano, Berners-Lee j havia construdo todas as
ferramentas necessrias para o sistema: o navegador, o
servidor e as primeiras pginas da web, que descreviam o
prprio projeto. Em 6 de agosto de 1991, ele postou um
resumo no grupo de notcias alt.hypertext. Essa data marca a
estreia da Web como um servio publicado na Internet.
http://pt.wikipedia.org
6
A partir deste comentrio de Berners-Lee sobre a
sua iniciativa de criar a WWW:

"I just had to take the hypertext idea and


connect it to the TCP (Transmission Control
Protocol Protocolo de Controle de
Transmisso) and DNS (Domain Name System
- Sistema de Nomes de Domnios) ideas and
ta-da!"

contextualizam-se a linguagem e o protocolo


presentes nos nossos navegadores: a linguagem
HTML (HyperText Markup Language - Linguagem
de Marcao de Hipertexto) e o protocolo HTTP
(Hypertext Transfer Protocol - Protocolo de
Transferncia de Hipertexto)!

7
O prximo passo decisivo para a criao da Web
Semntica foi a criao do World Wide Web
Consortium (o W3C): um consrcio internacional
com cerca de 300 membros, que agrega empresas,
rgos governamentais e organizaes
independentes, e que visa desenvolver padres
para a criao e a interpretao de contedos para
a Web.

O W3C foi fundado por Tim Berners-Lee em 1994 para levar


a Web ao seu potencial mximo, por meio do
desenvolvimento de protocolos comuns e fruns abertos que
promoveram a sua evoluo e asseguraram a sua
interoperabilidade. Sites da web desenvolvidos segundo esses
padres passaram a ser acessados e visualizados por
qualquer pessoa ou tecnologia, independente dos hardware
ou software utilizados, como celulares e PDAs, de maneira
rpida e compatvel com os novos padres e tecnologias que
possriam a surgir com a evoluo da internet.
http://pt.wikipedia.org 8
Foi atravs do W3C que os seus membros
passaram a incluir, nos documentos,
volumes considerveis de metadados
computacionalmente interpretveis, dando
origem inciativa da Web Semntica.

"The Semantic Web is not a separate


Web but an extension of the current
one, in which information is given well-
defined meaning, better enabling
computers and people to work in
cooperation."

Tim BERNERS-Lee, James HENDLER, Ora


LASSILA - Scientific American, May 2001.
9
10
Qualificando, ento, a extenso da WWW, tambm
denominada Web 2.0, para a Web Semntica, a Web 3.0:
trata-se de um acrscimo de novas tecnologias que
possibilitem que a grande massa de informao disseminada
nos documentos espalhados pela web seja, em certo sentido,
interpretvel pela mquina. A ideia incluir, na estrutura
sinttica dessa informao, que hoje permite a formatao
precisa e a troca eficiente de documentos dos mais variados
tipos atravs da rede, uma estrutura de contedo; ou seja,
a meta acoplar semntica a essa sintaxe, atravs de
tecnologias que se encadeiam e se complementam e que, de
modo sistemtico e integrado, possibilitam que mquina
extraia significado desses documentos e elabore inferncias
sobre os seus contedos. Trata-se portanto de passar de uma
web orientada a estruturao da forma dos documentos para
uma web orientada a estruturao dos contedos desses
documentos. Com isso, espera-se que agentes artificiais
passem a executar tarefas com a interveno mnima do
usurio.
11
Imaginem, agora, estas situaes...

Agentes artificiais (isto , programas de computador)


percorrendo a web e executando tarefas sofisticadas solicitadas
pelo usurio ou por ele desencadeadas. Essa situao muito
diferente daquela em que esse agente procura o contedo por
meio de palavras-chave e frequncias de ocorrncia. A primeira
situao supe a criao de agentes artificiais capazes de inferir
os contedos a partir dos metadados associados aos documentos
ou a partir de asseres j construdas sobre esses contedos.
Trata-se de agentes capazes de classificar e relacionar
informaes de modo automtico por meio de linguagens de
representao e de mecanismos de inferncia. Em termos
prticos: agentes capazes de fazer com que as informaes
disseminadas na web possam ser localizadas, integradas e
evocadas de modo mais dinmico e acessvel ao usurio.

12
Um pouco de fico: j se tem chamado a Web 3.0

de a web sombria (the "dark web"), porque se

concebem computadores usando a Web revelia

dos usurios!

13
The Semantic Web layer cake
A maior parte do contedo da web destinada para a leitura
e interpretao humanas. Sem a incorporao e
implementao de linguagens de representao mais
sofisticadas, os programas de computador no tm elementos
para desempenhar essas tarefas, ou seja, manipular o
contedo dos documentos e deles extrair contedos. Embora
a informao seja semi-estruturada, as estruturas
implementadas permitem apenas que o programa defina
como o contedo dos documentos deve ser reconstrudo no
navegador cliente. A linguagem HTML, embora essencial para
a formatao e portabilidade dos documentos, no codifica,
por exemplo, o tpico do documento e nem a natureza do
contedo!
Da a ideia de se criarem linguagens de representao que
possibilitem esse nvel de especificao da informao
veiculada nos documentos. Essa ideia natural, mas
extremamente complexa, como j h muito os estudos da
linguagem humana constataram, a essncia da proposio
de uma Web Semntica. 14
A boa notcia que os primeiros fios que tecem a Web
Semntica j foram produzidos: o padro Unicode, que
um padro que permite aos computadores representar e
manipular, de forma consistente, texto de qualquer sistema
de escrita existente; o identificador URI (Uniform Resource
Identifier - Identificador Uniforme de Recursos) e a
linguagem XML (Extensible Markup Language
Linguagem de Marcao Extensvel), subtipo da linguagem
SGML (Standard Generalized Markup Language
Linguagem de Marcao Genrica Padro), uma linguagem
atravs da qual se pode definir linguagens de marcao
para documentos. A SGML uma descendente da GML
(Generalized Markup Language Linguagem Geral de
Marcao) da IBM, desenvolvida na dcada de 60 por
Charles Goldfarg, Edward Mosher e Raymond Lorie (cujas
iniciais dos sobrenomes por acaso coincidem com GML).

15
O bolo em camadas

16
Nota-se que h diferentes verses do esquema, mas
todas convergem para a mesma noo de camadas.
Vou tomar este como referncia:

17
Importante: no esquema, a camada da ontologia
que mais nos diz respeito enquanto estudiosos
das Letras e Lingustica e, sobretudo, nesta oficina,
em que a principal meta discutirmos a noo do
ontolxico.
Entretanto, sem as bases inferiores, ela as
ontologias no teriam um alicerce firme e formal
para ser compreendida pela mquina. Mesmo
quem no vai implementar essas linguagens deve
saber, pelo menos, que elas esto l, subjacentes
Web Semntica.

18
Os alicerces da Web Semntica

URI/URL/IRI/UNICODE

O identificador URI (Uniform Resource Identifier


Identifcador-Padro de Recursos) uma cadeia compacta de
caracteres utilizada para identificar ou nomear um recurso na
web. O localizador URL (Uniform Resource Locator -
Localizador-Padro de Recursos) de sites na web (por
exemplo, http://ufsc.br/) um exemplo de identificador do
tipo URI. O identificador IRI (Internationalized Resource
Identifier - Identificador Internacionalizado de Recursos)
um tipo de URI que utiliza caracteres da tabela UNICODE
(cdico universal/nico) que extrapolam a tabela ASCII
(American Standard Code for Information Interchange
Cdigo-Padro Norte-Americano para o Intercmbio de
Informao), que uma codificao de caracteres de oito
bits que representa os caracteres relevantes para a escrita
em ingls.
19
XML

A linguagem XML padroniza o modo que a informao deve


ser composta para fins de compartilhamento na web.
semelhante linguagem HTML, mas, diferente desta, pois
permite que o usurio crie as suas prprias etiquetas (tags).

XML Namespaces

Os qualificadores (XML) namespaces (espaos de nomes)


so elementos e atributos nomeados contidos em um
documento escrito na linguagem XML. Os namespaces so
partes integrantes da linguagem XML e so a maneira de
qualificar as etiquetas e os atributos da linguagem XML com
URIs, que, por sua vez, tornam essas etiquetas e esses
atributos entidades nicas, e, portanto, universais, em toda a
extenso da web.

20
Esquema XML (XSD)

O Esquema XML descreve, com maior preciso que os DTDs


(Document Type Definition - Definio do Tipo de
Documento: um conjunto de declaraes de uma destas
linguagens de marcao, SGML, XML e HTM, que define o tipo
de documento por elas anotado) a estrutura XML dos
documentos. Um Esquema XML conhecido como Definio
de Esquema XML (XSD). Em termos prticos, trata-se de
uma funcionalidade que permite ao usurio definir sua
prpria estrutura para os seus documentos, j que o XSD lhe
fornece o modo de definir as regras de tal modo que outros
usurios e agentes artificiais possam compreend-la.

XML Query (XQuery)


A linguagem XML Query uma linguagem-padro de
consulta e integrao de bases de documentos, pginas da
web, entre outros elementos informativos. Est substitudo,
por exemplo, programas complexos escritos em Java ou C++,
com poucas linhas de cdigo.
21
Em suma, os alicerces da Web Semntica resumem-se
em Unicode, URI, and XML, com as seguintes
funcionalidades: o Unicode fornece um sistema universal para
codificar a informao em qualquer sistema de escrita; os
URIs viabilizam um modo- padro de identificao e
localizao de recursos na web; a linguagem XML permite
que o usurio modele a informao de modo nico, podendo
tambm compartilh-la e integr-la de modo consistente.
Portanto, essas trs tecnologias, j existentes na Web 2.0.,
nos auxiliam no processo de associao entre contedos e
servios da web.

22
A linguagem RDF (Resource Description Framework)

Dando continuidade explorao das camadas da Web


Semntica, vamos agora explorar a camada da linguagem
RDF. Trata-se de uma linguagem de programao de dados
genrica, a espinha dorsal do estgio atual de
desenvolvimento de tecnologias para a Web Senntica, que
usada para explicitar relaes entre os recursos contidos na
web. Podendo descrever contedo ou servios da web, ela
tambm pode descrever objetos do mundo real, como ns!
Tudo que possui identidade pode ser descrito na linguagem
RDF.

23
O semanticista pode aqui fazer uma analogia: tal qual a semntica formal
(lgica, de modelos ou de condies de verdade) a investigao (pragmtica)
da semntica associada Web Semntica visa estabelecer a relao entre as
expresses da linguagem RDF e as entidades do mundo a que essas
expresses se referem. De modo distinto da WWW atual, que , em geral,
constituda de colees de documentos interligados uns aos outros por
hiperlinks, a Web Semntica vislumbra estabelecer a conexo entre o
documento e as entidades do mundo por ele denotadas. Ou seja, na WWW
atual, num documento sobre Machado de Assis pode haver a especificao
da relao entre esse documento e outro sobre Dom Casmurro. Entretanto,
no h meios de como especificar a entidade que Machado de Assim ou
ligar essa entidade entidade que Dom Casmurro.

24
Uma nota sobre a noo de recursos: no jargo da Web
Semntica, considera-se recurso qualquer coisa sobre a qual
se quer falar. So recursos, Machado de Assis, Rio de Janeiro,
Dom Casmurro, o valor de x, todo mundo que mora em
Paris, o conceito ENGENHEIRO DE SOFTWARE etc; qualquer
coisa que possa ser identificada.

25
Com a linguagem RDF, torna-se possvel a descrio de conceitos de
modo consistente e preciso para os agentes artificiais serem capazes
de process-los de modo uniforme, proporcionado ao usurio a
abrangncia de descrever quaisquer conceitos e flexibilidade de
descrev-los do modo que julgar mais conveniente, posto que a tarefa
e construir asseres, em termos de trs elementos:

<Sujeito> <Predicado> <Objeto/Atributo>,


ou seja, descrevem-se as entidades em termos de propriedades
(predicados), objetos, atributos e valores de atributos, sendo que o
sujeito sempre um recurso e o objeto pode ser um recurso ou uma
expresso literal.

26
Por exemplo, estes enunciados do portugus

Bento conhece Alckmar.

O sobrenome de Bento Dias da Silva.

Alckmar conhece Heronides.

Heronides trabalha com Alckmar.

Roberta trabalha com Heronides.

veiculam informaes sobre essas pessoas por meio das


respectivas frases do portugus.

27
Na sintaxe da RDF, essas informao so mnemonicamente
representadas pelos seguintes ternos:

<Bento> <conhece> <Alckmar>.

<Bento> <tem_sobrenome> <Dias_da_Silva>.

<Alckmar> <conhece> <Heronides>.

<Heronides> <trabalha com> <Alckmar>.

<Roberta> <trabalha_com> <Heronides>.

28
A representao grfica abaixo esquematiza o mesmo tipo de
informao, em que os ns representam recursos :

trabalha_com
Heronides
Roberta

conhece
Alckmar
conhece

Bento

tem_sobrenome Dias da Silva

29
Usando IRIs, essa representao grfica passa a ser esta:

http://buscatextual.cnpq.br/buscatextual/f http://buscatextual.cn
oaf-extension#worksWith pq.br/buscatextual/vis
http://buscatextual.cnp ualizacv.jsp?id=K4785
q.br/buscatextual/visua 715T6
lizacv.jsp?id=K4782153
U9

http://xmlns.com/foaf/0.1/knows
http://xmlns.com/foaf/0.1/knows

http://buscatextual.cn
pq.br/buscatextual/vis
http://buscatextual ualizacv.jsp?id=K47871
.cnpq.br/buscatext 84H0
ual/visualizacv.jsp?i
d=P923347

Dias da Silva
http://xmlns.com/foaf/0.1/surname

Vocabulrios de espaos de nomes: RDF, Dublin Core, SKOS e FOAF.


30
Outro modo de se visualizar a representao em RDF considerar
cada terno um ponto no espao de nomes:

Sujeitos

Predicados

Objetos

31
A linearizao da informao do grafo...

Na notao RDF/XML:

<rdf:RDF

< --Comentrio: as declaraes dos espaos de nomes (ns)-->

xmlns:people=http://buscatextual.cnpq.br/buscatextual/vis
ualizacv.jsp?id=
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:rdf=http://www.w3.org/2000/01/rdf-schema#
xmlns:foaf=http://xmlns.com/foaf/0.1/
xmlns:ext=http://buscatextual.cnpq.br/buscatextual/foaf-
extension#

32
< --Comentrio: os ternos-->

<rdf:Description

rdf:about="http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=K4782153U9>
<ext:worksWith

rdf:resource=http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=K4785715T6/>
</rdf:Description>

33
<rdf:Description
rdf:about="http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=K4787184H0>
<foaf:knows

rdf:resource=http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=K4785715T6/>
</rdf:Description>

34
<rdf:Description
rdf:about="http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=P923347>
<foaf:surname>Dias-da_Silva</foaf:surname>
<foaf:knows
rdf:resource= http://buscatextual.cnpq.br/buscatextual/
visualizacv.jsp?id=K4787184H0/>
</rdf:Description>

<rdfs:Class
rdf:about=http://buscatextual.cnpq.br/books#Livro>
<rdfs:label>Livro</rdfs:label>
</rdfs:Class>

</rdf:RDF>

35
Na notao 3 (N3)...

@prefix people:http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=.
@prefix rdf:http://www.w3.org/1999/02/22-rdf-syntax-ns#.
@prefix foaf:http://xmlns.com/foaf/0.1/.
@prefix ext:http://buscatextual.cnpq.br/buscatextual/foaf-extension#.

<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=K4782153U9>
ext:worksWith
<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=K4785715T6>

<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=K4787184H0>
foaf:knows
<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=K4785715T6>

<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=P923347>
foaf:surname Dias-da_Silva;
foaf:knows
<http://buscatextual.cnpq.br/buscatextual/visualizacv.jsp?id=K4787184H0>

36
Na notao Turtle (concisa) (the Terse RDF Triple
Language):

visualizacv.jsp?id=K4782153U9
ext:worksWith
visualizacv.jsp?id=K4785715T6

visualizacv.jsp?id=K4787184H0
foaf:knows
visualizacv.jsp?id=K4785715T6

visualizacv.jsp?id=P923347
foaf:surname
Dias-da_Silva;
foaf:knows
visualizacv.jsp?id=K4787184H0

37
Os ternos RDF criam grafos...

Note que uma coleo de asseres (statements) em RDF


formam um grafo:

38
Os grafos RDF criam uma web de dados.

39
Implementando ontologias
Mencionando esta camada das tecnologias qyeintegram a
Web Semntica, ou seja, a de construo de ontologias,
encerro esta apresentao sobre a Web Semntica, posto que
nessa camada que, de fato, a Web Semntica comea a ser
uma realidade, no s com a utilizao da OWL (Web
Ontology Language Linguagem de Representao de
Ontologias), que pode ser editada no conhecido editor de
ontologias Protg, mas, sobretudo, com tecnologias de
Processamento Automtico de Lngua Natural (PLN),
que, conforme j apontaram Yorick Wilks e Christopher
Brewster (2009), lhe fornecero o aporte lingustico
necessrio para o processamento da informao
linguisticamente codificada nos milhares de milhes de
pginas da web. Tema da prxima discusso!

40
Para concluir, uma breve meno das demais camadas do
esquema, ou porque ainda esto em tmido desenvolvimento
ou porque no passam ainda de intenes: a camada da
linguagem SPARQL, para consulta de informaes
codificadas em RDF; a camada Lgica, que deve ser capaz
de conciliar as informaes codificadas nas camadas
inferiores (apenas esboada); as camadas Confirmao,
Confiana e Criptografia devem, respectivamente,
explicitar que inferncias e que regras conduziram o agente a
tomar determinado curso de ao, fornecer os meios de
avaliao relativa da qualidade dos recursos e prover a
encriptao da informao.

PLN

41
28 de abril

14:00 - 17:00

42
O Processamento Automtico
das Lnguas Naturais
(PLN)
PLN
O COMPUTADOR E O PLN
O COMPUTADOR
O PLN: TRANSFORMANDO CONHECIMENTOS
LINGUSTICOS EM TECNOLOGIAS

A PESQUISA EM PLN
EQUACIONAMENTO LINGUSTICO
EQUACIONAMENTO LINGUSTICO-COMPUTACIONAL
EQUACIONAMENTO COMPUTACIONAL
LINGS TICA FILOS OFIA

Teoria e Descrio Gramatical Anlise Conceitual


Lexicologia
Teoria da Referncia
Teoria do Discurso
LGICA
PS ICOLOGIA
Teoria do Texto Atos de Fala
Inferncias
Anlise Pragmtica
Lgica Proposicional Processos Cognitivos
Lgica de Predicados
Lgica Modal Organizao da Memria

Lgica Intensional
Compreenso e Interpretao da Fala
Lgica Difusa

MATEMTICA PALN INTELIGNCIA ARTIFICIAL

Relaes e Funes Representao do Conhecimento


Teoria dos Conjuntos Engenharia do Conhecimento

Teoria de Modelos Algoritmos Resoluo de Problemas


Teoria da
Teoria dos Grafos Autmatos Estratgias de Inferncia
Complexidade
lgebra Compiladores Redes Semnticas
Linguagens Formais
Redes de Transio
Algoritmos
Base de Dados
Analisadores Sintticos Linguagens de Programao
LINGS TICA CINCIA DA

COMPUTACIONAL COMPUTAO

45
RECURSOS APLICATIVOS
Ontologias
Expresses Regulares
Lxicos
Autmatos/Transdutores
Ontolxicos Etiquetadores Gramaticais
Gramticas Etiquetadores Semnticos
Thesaurus Analisadores Gramaticais (parsers)
Dicionrios/Glossrios Planejadores de Discurso
Enciclopdias
Desambiguizadores lexicogramaticais
Corpora textuais
APLICAES
Corretores ortogrficos
Corretores gramaticais
Sumarizadores automticos
Sistemas de traduo (semi)automtica
Sistemas de recuperao e extrao de textos/informaes
Geradores de textos/dilogos

46
PLN
O mtodo de equacionamento de um problema de PLN

EQUACIONAMENTO EQUACIONAMENTO Equacionamento


ETAPAS LINGUSTICO Computacional
LINGUSTICO-COMPUTACIONAL
PROBLEMA Como explicitar o
conhecimento e o uso
lingusticos?

RECURSOS Teorias da
Competncia e do
Desempenho
PLN
O mtodo de equacionamento de um problema de PLN

EQUACIONAMENTO EQUACIONAMENTO Equacionamento


ETAPAS LINGUSTICO LINGUSTICO-COMPUTACIONAL Computacional
PROBLEMA Como explicitar o Como represent-los,
conhecimento e o uso integr-los e process-los?
lingusticos?

RECURSOS Teorias da Linguagens Formais de de


Competncia e do Representao e Sistemas
Desempenho de PLN
PLN
O mtodo de equacionamento de um problema de PLN

EQUACIONAMENTO EQUACIONAMENTO EQUACIONAMENTO


ETAPAS LINGUSTICO LINGUSTICO-COMPUTACIONAL COMPUTACIONAL
PROBLEMA Como explicitar o Como represent-los, Como implementar
conhecimento e o uso integr-los e process-los? (codificar)
lingusticos? computacionalmente
as representaes e o
processamento?
RECURSOS Teorias da Linguagens Formais de Linguagens de
Competncia e do Representao e Sistemas Programao
Desempenho de PLN
ILUSTRAO DO MTODO
DESCRIO INFORMAL
FASE Uma frase pode ser composta pela concatenao de um sintagma nominal e de um
sintagma verbal. O sintagma nominal o sujeito da frase. O sintagma verbal o
LINGUSTICA predicado da frase. O sujeito e o verbo tm os mesmos traos de nmero e de pessoa.
O caso gramatical do sujeito nominativo e o verbo encontra-se na forma finita.
(QUIRK & GREENBAUM, 1973)

FORMALISMO LINGUSTICO

F SN SV
( SUJEITO)= =
(KAPLAN & BRESNAN, 1982)
REPRESENTAO COMPUTACIONAL
Regra Sinttica:
FASE
F SN SV
LINGUSTICO- Especificaes de traos:
COMPUTACIONAL < SN pessoa > = < SV pessoa >
< SN nmero > = < SV nmero >
< SN caso > = nominativo
< SV forma verbal > = finita
(SHIEBER, 1986)

FASE IMPLEMENTAO EM PROLOG


f(P0,P) :- sn(Pessoa,Nmero,Caso,P0,P1),
COMPUTACIONAL sv(Pessoa,Nmero,Caso,P1,P).
(CLOCKSIN & MELLISH, 1981)
PLN
PROBLEMA-EXEMPLO

Digitada a frase Paula acordou,

Integrante deste texto...


Um flash do dia de Pedro e Paula

O dia raiou. Pedro chamou Paula. Paula acordou. Pedro


fez caf. Paula escovou os dentes. Pedro saiu. Ele vende
peas.
Paula tomou o caf. Ela ama caf. Paula programa
computadores. Ela escreve programas. Ela escreveu
muitos programas. Todos funcionaram.
O dia terminou. A noite caiu. Pedro chegou. Paula viu
Pedro. Pedro comprara uma bicicleta. A bicicleta quebrou o
pedal. Paula ajudou Pedro. Ela amarrou o pedal. O
pedal caiu. Pedro estressou. Paula acalmou Pedro. Eles
entraram. A noite chegou...
PLN

Como fazer com que o computador construa,


de modo automtico, as estruturas sinttica
e semntica dessa frase?
PLN
EQUACIONAMENTO LINGUSTICO

EQUACIONAMENTO Equacionamento Equacionamento


ETAPAS LINGUSTICO Computacional
Lingustico-computacional
PROBLEMA Como descrever as
estruturas sinttica e
semntica da frase:
Paula acordou ?
RECURSOS - Gramtica Sintagmtica
- Semntica Formal
PLN
EQUACIONAMENTO LINGUSTICO-COMPUTACIONAL

EQUACIONAMENTO EQUACIONAMENTO Equacionamento


ETAPAS LINGUSTICO Computacional
LINGUSTICO-COMPUTACIONAL
PROBLEMA Como descrever as Como representar e gerar
estruturas sinttica e essas estruturas ?
semntica da frase:
Paula acordou ?
RECURSOS - Gramtica Sintagmtica - Parser Sinttico-Semntico: -
- Semntica Formal *Redes de Transio (Autmato)
*Lgica (Clculo Lambda)
PLN
EQUACIONAMENTO LINGUSTICO-COMPUTACIONAL

EQUACIONAMENTO EQUACIONAMENTO EQUACIONAMENTO


ETAPAS LINGUSTICO COMPUTACIONAL
LINGUSTICO-COMPUTACIONAL
PROBLEMA Como descrever as Como representar e gerar Como codificar as
estruturas sinttica e essas estruturas ? representaes?
semntica da frase:
Paula acordou ?
RECURSOS - Gramtica Sintagmtica - Parser Sinttico-Semntico: - Linguagem PROLOG
- Semntica Formal *Redes de Transio (Autmato)
*Lgica (Clculo Lambda)
O EQUACIONAMENTO
LINGUSTICO
Descrio da Estrutura Sinttica:
a Gramtica Sintagmtica
Regras da gramtica Formas do lxico

S SN SV NP paula [f,3,s]
SN NP VI acordou [ptpf.3.s]
SV VI

Descrio da Estrutura Semntica:


a Semntica Formal
Semntica da frase Semntica do lxico Clculo

S = SV(SN) NP = paula ( x.VI(x))(NP) = VI(NP)


SN = NP VI = acordou
SV = VI
O EQUACIONAMENTO
LINGUSTICO-COMPUTACIONAL
Paula acordou.
Paula acordou. Paula acordou
Paula acordou. Paula acordou
sn: SemSN, SN, Gen, Pess, Num sv: SemSV, SV, Pess, Num

S: 1 2 3

np: SemNP, NP, Gen, Pess, Num


SN: 4 5

vi: SemVI, VI, Pess, Num


SV:
6 7

paula: paula, np(paula), f, 3, s


NP: 8 9

acordou: X^acordou(X),vi(acordou), 3, s
VI: 10 11
Paula acordou. Paula acordou

(S(SN (NP(paula)))(SV(VI(acordou)))) acordar (paula)

SN SV
ACORDAR PAULA
NP VI (Estrutura conceitual)

paula acordou
O EQUACIONAMENTO
COMPUTACIONAL
IMPLEMENTAO DO PARSER EM PROLOG
% O Parser e a Rede de Transio (A Gramtica Sintagmtica)
s(ESem, s(SN,SV), P0, P) :- sn(SemSN, SN, Gen, Pess, Num, P0, P1), sv(SemSV, SV, Pess, Num, P1, P),
reduce(SemSV,SemSN,ESem).
sn(SemNP, sn(NP), Gen, Pess, Num, P0, P) :- np(SemNP, NP, Gen, Pess, Num, P0, P).
sv(SemVI, sv(VI), Pess, Num, P0, P) :- vi(SemVI, VI, Pess, Num, P0, P).

% o Clculo Lambda (A Semntica Formal)


reduce(Arg^Espr,Arg,Espr).

% O Lxico
np(paula, np(paula), f, 3, s, P0, P) :- liga(paula, P0, P).
vi(X^acordou(X),vi(acordou), 3, s, P0, P) :- liga(acordou, P0, P).

% A ligao entre dois pontos da Rede de Transio


liga(No1,[No1|No2],NO2).
29 de abril
9:00 - 12:00

14:00 - 17:00

67
Modelagem computacional de lxicos
Os computadores e a informao lexicogramatical
Informaes associadas s unidades lxicas
Recursos lexicogramaticais

O que uma rede WordNet


A WordNet de Princeton
As WordNets
A EuroWordNet

A rede WordNet.Br
WN(conhecimentos_do_e_sobre_o_lxico_do_portugus) = WordNet.Br

68
Os computadores e a informao lexicogramatical

Os computadores tm a capacidade de armazenar e processar, com


eficincia e rapidez, grande volume de informaes, caracterstica
que os tornam mquinas ideais para a modelagem do
conhecimento lexicogramatical, posto que esse constitudo por
um conjunto de informaes diversas e interligadas, exigindo da
mquina o processamento de uma estrutura de informaes de
naturezas diversas que se associam a cada unidade lxica que se
manifesta nos enunciados lingusticos...

69
Informaes associadas s unidades lxicas

Forma ortogrfica/fontica:
/o.ou/, olhou

Contexto de uso:
O presidente olhou o documento que ia assinar.

Categoria/subcategoria sinttica:
olhar.01 Vtr

70
Informaes associadas s unidades lxicas

Estrutura de argumentos
Restrio de seleo
Funo gramatical
Papel temtico
Relao funo gramaticalpapel temtico

peer-30.3
( PRED ) =
OLHAR1< ( SUJ: +anim.)Exp/PercAg ( OBJ:+conc.)Stim/Phen>

71
Informaes associadas s unidades lxicas

Categorias gramaticais
( SUJ PES) = sg

( SUJ NUM) = 3

( SUJ CASO) = nom

( TEMPO) = pas

( ASPECTO) = perf

(( SUJ PRED) = pro)

72
Informaes associadas s unidades lxicas
Tipo semntico
<verb.perception>

Relao lxico-frame semntico


Perception_active

Conceito lexicalizado
Relao de sentido
Relao lxico-ontolologia
[OLHAR1] = PERCEIVE WITH ATTENTION; DIRECT ONE'S GAZE
TOWARDS
_um_tipo_de [ENCARAR1] = LOOK AT WITH FIXED EYES
acarreta [VER1] = PERCEIVE BY SIGHT; HAVE THE POWER TO PERCEIVE BY SIGHT

73
Recursos lexicogramaticais

A modelagem do conhecimento lexicogramatical instancia-se em


bases ou recursos lexicais computacionalmente tratveis. Esse
acervo lexical, por sua vez, serve a dois propsitos
complementares:

integrar sistemas de processamento de lngua natural;

subsidiar o estudo do lxico e o desenvolvimento de obras


lexicogrficas.

74
Recursos lexicogramaticais
WordNet (FELLBAUM, 1998); EuroWordNet (VOSSEN, 1998)
http://wordnetweb.princeton.edu/perl/webwn?o2=&o0=1&o7=&o5=&o1=1&o6=&o4=&o3=&s=look&i=4&h=00000000000000#c
http://www.illc.uva.nl/EuroWordNet/

VerbNet (KIPPER, DANG e PALMER, 2000)


http://verbs.colorado.edu/verb-index/vn/peer-30.3.php#peer-30.3

FrameNet (BAKER, FILLMORE e LOWE, 1998)


http://framenet.icsi.berkeley.edu/fnReports/data/frameIndex.xml?frame=Perception_active
http://framenet.icsi.berkeley.edu/fnReports/data/lu/lu1302.xml?mode=annotation
http://framenet.icsi.berkeley.edu/fnReports/data/lu/lu1302.xml?mode=lexentry

PropBank (PALMER, GILDEA e KINGSBURY, 2005)


http://verbs.colorado.edu/propbank/framesets-english/look-v.html

SemLink (PALMER, 2009)


http://verbs.colorado.edu/semlink/
http://verbs.colorado.edu/html_groupings/look-v.html

75
A rede WordNet de Princeton (WN.Pr)
Nesse contexto, o empreendimento voltado para a modelagem das relaes de
sentido no computador a construo da rede WordNet de Princeton (WN.Pr),
ativa desde 1985.

A WN.Pr uma base de dados lexicais online que visa a representar e


organizar a informao lxico-conceitual do ingls norte-americano de modo
psicolinguisticamente realista em termos de uma rede semntica.

A hiptese central do empreendimento supor que o falante, quando usa a


lngua, tem domnio do acervo lexical e acesso imediato a esse acervo porque
conhecem as relaes e os padres sistemticos que se verificam entre os
sentidos dos itens lexicais da sua lngua.

76
As wordnets
rabe Hebreu Portugus Br
Basco Hindu Romeno
Espanhol Hngaro Russo
Catalo Islands Snscrito
Blgaro Italiano Srvio
Chins Coreano Esloveno
Tcheco Latvio Sueco
Dinamarqus Marati Tmil
Holands Moldavo Tailands
Ingls Britnico Noruegus Turco
Estnio Persa
Francs Japons
Alemo Portugus Eur
Grego

77
Em suma...

Uma rede WordNet uma base relacional de dados lexicais que


codifica, na forma de uma rede semntica particular, os itens
lexicais de uma lngua natural, nela registrando uma parte do
conhecimento que o falante demonstra ter sobre esses itens:
os sentidos dos itens lexicais;
as informaes lexicogramaticais a eles associadas;
as relaes semntico-conceituais que se verificam entre eles.

78
Entendendo a estrutura de uma wordnet...

Numa rede WordNet, os conhecimentos so codificados nos SYNSETS*,


que so construdos em termos da relao de sinonmia (relativa a um
contexto de uso) que se estabelece entre as unidades lexicais que os
constituem e das relaes de antonmia, hiponmia, troponmia,
meronmia, acarretamento e causa que se estabelecem entre eles.

Em termos configuracionais, os synsets so os NS da rede e as relaes


que se estabelecem entre eles so os ARCOS que interligam esses ns.

(*) Synset =def. conjunto de sinnimos [Do ingls: SYNonym (sinnimo) SET
(conjunto)]. Esse constructo representa um conceito lexicalizado.

79
Os arcos rotulados que formam a rede...

Substantivo {homem }/ {mulher}


Verbo {entrar }/ {sair}
Adjetivo {bonito} / {feio}
Substantivo {rosa} {flor}
{livro} {publicao}

Verbo {caminhar} {movimentar}


{correr} {movimentar}
Substantivo {nariz}, {orelha},... = {cabea}
{olho}, {boca}, ... = {face}

Verbo {roncar} {dormir}


{beber } {engolir}
Verbo {matar} {morrer}
{quebrar } {danificar}

80
THE ACTIVITY OF DESIGNING AND
CONSTRUCTING AND
PROGRAMMING COMPUTERS

hipernimo de

hipernimo de

81
A interface de consulta da WN.Pr...

Synset

Nmero de Identificao

Hipnimo Tipo Semntico Glosa

http://wordnetweb.princeton.edu/perl/webwn
Estatsticas da WN.Pr...
CATEGORIA ITENS LEXICAIS SYNSETS

Substantivo 117.798 82.115

Verbo 11.529 13.767

Adjetivo 21.479 18.156

Advrbio 4.481 3.621

TOTAL 155.287 117.659

83
Iniciativa europeia...

A rede EuroWordNet a iniciativa de construo de uma wordnet


multilngue que alinha wordnets de diferentes lnguas da Unio
Europeia. Esse alinhamento, construdo por meio de relaes de
(quase-)equivalncia semntico-conceitual entre synsets de
wordnets construdas (ou em construo) para diferentes lnguas,
instanciado por uma coleo de indexadores, denominandos Inter-
Lingual-Indices (ILIs), formada por todos os synsets da WN.Pr e
acrescida de synsets que so especficos de uma ou de outra
wordnet que integra essa rede multilngue.

(*) http://www.illc.uva.nl/EuroWordNet 84
ILI = {drive}

85
ILI = {drive}

{njden}
Holands

86
ILI = {drive}

{guidare} {njden}
Italiano Holands

87
{conduzir}
Espanhol

ILI = {drive}

{guidare} {njden}
Italiano Holands

88
{guiar}
Portugus
Europeu

{conduzir}
Espanhol

ILI = {drive}

{guidare} {njden}
Italiano Holands

89
{guiar}
Portugus
Europeu

{conduzir}
Espanhol {dirigir, guiar}
Portugus
Brasileiro
ILI = {drive}

{guidare} {njden}
Italiano Holands

90
O mtodo...

1. Domnio Lingustico
Seleo e sistematizao dos recursos (os dicionrios e o corpus), das
categorias sintticas (substantivo, verbo, adjetivo e advrbio), dos itens
lexicais e dos tipos de relaes lxico-conceituais (sinonmia, antonmia,
hiponmia, acarretamento e causa) e dos alinhamentos entre synsets.

2. Domnio Lingustico-Computacional
Representao do conhecimento sistematizado no domnio anterior (synset,
matriz lexical, estruturao da base e alinhamentos entre synsets).

3. Domnio Computacional
Implementao do aplicativo para a consolidao da rede (o editor da
WordNet.Br).
91
O mtodo...

1. Domnio Lingustico
Seleo e sistematizao dos recursos (os dicionrios e o corpus), das
categorias sintticas (substantivo, verbo, adjetivo e advrbio), dos itens
lexicais e dos tipos de relaes lxico-conceituais (sinonmia, antonmia,
hiponmia, acarretamento e causa) e dos alinhamentos entre synsets.

2. Domnio Lingustico-Computacional
Representao do conhecimento sistematizado no domnio anterior (synset,
matriz lexical, estruturao da base e alinhamentos entre synsets).

3. Domnio Computacional
Implementao do aplicativo para a consolidao da rede (o editor da
WordNet.Br).
92
O mtodo...

1. Domnio Lingustico
Seleo e sistematizao dos recursos (os dicionrios e o corpus), das
categorias sintticas (substantivo, verbo, adjetivo e advrbio), dos itens
lexicais e dos tipos de relaes lxico-conceituais (sinonmia, antonmia,
hiponmia, acarretamento e causa) e dos alinhamentos entre synsets.

2. Domnio Lingustico-Computacional
Representao do conhecimento sistematizado no domnio anterior (synset,
matriz lexical, estruturao da base e alinhamentos entre synsets).

3. Domnio Computacional
Implementao do aplicativo para a consolidao da rede (o editor da
WordNet.Br).
93
Itens Lexicais
Synsets

94
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

95
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{olhar} O presidente __________ o papel que ia assinar.

96
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{observar,
olhar, Voc j __________ os preos? Porque eu acho que o XEON deve ser o dobro do PHENON.
pesquisar}

97
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{examinar,
investigar, Charles Darwin __________ a consanguinidade das plantas.
pesquisar}

98
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{considerar,
observar, __________ a China a 100 anos atrs!
olhar}

99
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{pensar} Phil Collins s no se matou porque ______________ nos filhos.

100
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{pensar,
refletir} __________ e achou que a melhor soluo seria cortar o dedo indicador da mo direita.

101
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{cuidar, olhar} De que modo estamos __________ os doentes da nossa famlia?

}
102
SYNSETS
ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{ajudar,
O Brasil __________ os norte-americanos na libertao da Itlia.
auxiliar}
103
SYNSETS
Com os
Exemplos ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{olhar} O presidente __________ o papel que ia assinar.

{observar,
olhar, Voc j __________ os preos? Porque eu acho que o XEON deve ser o dobro do PHENON.
pesquisar}

{examinar,
investigar, Charles Darwin __________ a consanguinidade das plantas.
pesquisar}

{considerar,
observar, olhar} __________ a China a 100 anos atrs!

{pensar} Phil Collins s no se matou porque ______________ nos filhos.

{pensar,
refletir} __________ e achou que a melhor soluo seria cortar o dedo indicador da mo direita.

{cuidar, olhar} De que modo estamos __________ os doentes da nossa famlia?

{ajudar,
O Brasil __________ os norte-americanos na libertao da Itlia
auxiliar}
104
SYNSETS
Com as
Glosas ajudar auxiliar considerar cuidar examinar investigar observar olhar pensar pesquisar refletir

{olhar} PERCEIVE WITH ATTENTION; DIRECT ONE'S GAZE TOWARDS

{observar,
olhar, EXAMINE SO AS TO DETERMINE ACCURACY, QUALITY, OR CONDITION
pesquisar}

{examinar,
investigar, CONSIDER IN DETAIL AND SUBJECT TO AN ANALYSIS TO DISCOVER ESSENTIAL FEATURES
pesquisar}

{considerar,
observar, olhar} TAKE INTO CONSIDERATION FOR EXEMPLIFYING PURPOSES

{pensar} HAVE ON ONE'S MIND, THINK ABOUT ACTIVELY

{pensar,
refletir} EXERCISE THE MIND TO MAKE INFERENCES OR ARRIVE AT A SOLUTION OR JUDGMENTS

{cuidar, olhar} PROVIDE CARE FOR

{ajudar,
GIVE HELP OR ASSISTANCE; BE OF SERVICE
auxiliar}
105
Estatsticas da WordNet.Br...

Categorias Unidades Lexicais Synsets

Substantivos 17.388 8.527

Verbos 11.078 4.130

Adjectivos 15.073 6.649

Advrbios 1.139 567


TOTAL 44.678 19.872

106
O alinhamento...

WordNet.Br

OLHAR,
CONSIDERAR,
OBSERVAR

PENSAR,
REFLETIR

PENSAR

107
O alinhamento...

WordNet.Br Alinhamentos WordNet de


Princeton

108
O alinhamento...

WordNet.Br Alinhamentos WordNet de


Princeton

00608615 {00608615}
PENSAR, THINK,
REFLETIR COGITATE,
CELEBRATE

109
O alinhamento...

WordNet.Br Alinhamentos WordNet de


Princeton

00608615 {00608615}
PENSAR, THINK,
REFLETIR COGITATE,
CELEBRATE

00710166 {00710166}
PENSAR THINK ABOUT

110
O alinhamento...

WordNet.Br Alinhamentos WordNet de


Princeton

00608615 {00608615}
PENSAR, THINK,
REFLETIR COGITATE,
CELEBRATE

00710166 {00710166}
PENSAR THINK ABOUT

00709872 {00709872}
OLHAR, CONSIDER,
CONSIDERAR, TAKE, DEAL,
OBSERVAR LOOK AT

111
O alinhamento...

WordNet.Br Alinhamentos WordNet de


Princeton

00608615 {00608615}
PENSAR, THINK,
REFLETIR COGITATE,
CELEBRATE
Herana da
Hiponmia hipnimo de

00710166 {00710166}
PENSAR THINK ABOUT

Herana da hipnimo de
Hiponmia
00709872 {00709872}
OLHAR, CONSIDER,
CONSIDERAR, TAKE, DEAL,
OBSERVAR LOOK AT

112
Estrutura computacional da base...

Duas estruturas de lista formam a estrutura bsica da


base de dados lexicais da WordNet.Br:

Lista de Entradas (todos os itens lexicais da base


ordenados alfabeticamente);

Lista de Synsets (todos os conjuntos de unidades


lexicais que compartilham um mesmo conceito).

113
Estrutura computacional da base...

Cada unidade lexical do synset especificada por


um Vetor de Descrio de Sentidos (VDS)

Cada VDS constitudo de trs ponteiros


(pointers):
O ponteiro de sinonmia: identifica o synset na
LS;
O ponteiro de antonmia: identifica o synset
antnimo na LS;
O ponteiro de sentido: identifica o sentido da
unidade lexical no VDS.

114
Entradas VDS: Vetor de Descrio de Sentidos do IL = Synsets
... associados ao IL
E16
abreviado
Ac1E16 C10 C58 Ac2E16 C33 C0
...
E188 ampliado Ac1E188 C58 C10
...
E232 cifrado Ac1E232 C33 C0
...
E278 encurtado Ac1E278 C10 C58
...
E393 extenso Ac1E393 C58 C10 Estrutura
...
Computacional da
E459 resumido Ac1E459 C10 C58
... Base da
E601 sucinto Ac1E601 C10 C58 WordNet.Br
...

Synsets
C0 synset vazio

...
E16 E278 E459 E601
C10
Ac1E16 Ac1E188 Ac1E278 Ac1E393 Ac1E459 Ac1E601
...
E16 E232
C33
Ac2E16 Ac1E232
...
E188 E393
C58
Ac1E16 Ac1E188 Ac1E278 Ac1E393 Ac1E459 Ac1E601
115
...
116
Frase-exemplo: Joana D' Arc disse
Frase-exemplo: Muitos juzes
ter recebido um aviso dos cus para
so incrivelmente preguiosos,
liderar os exrcitos franceses e
encarando sua posio como
[libertar a Frana do domnio ingls.
uma espcie de tranquila
aposentadoria que os [livrou Frase-exemplo: So mais
das dificuldades da advocacia. do que ridculos os mtodos
que propem nossos
livrar retricos para [salvar a
libertar humanidade dessa queda
ILI: 02475841 <verb.social> fatal e iminente.
rescue#1, deliver1#4 -- (free from harm or evil)
salvar
--------------------------------
Chave: RESGATAR ILI: 02475565 <verb.social>
Glosa: libertar do dano ou mal salvage#1, salve#1, relieve#5, save1#1 -- (save from ruin,
destruction, or harm)
--------------------------
Chave: LIVRAR
hipnimo de Glosa: livrar da desgraa, destruio ou dano

Frase-exemplo: Mecnicos e
retirar bombeiros comearam a
resgatar extinguir o fogo e [retirar o
tirar piloto do carro.

Frase-exemplo: Ele Frase-exemplo: Para [tirar os meninos das


conseguiu [resgatar dos minas, o ministro Reinhold Stephanes anuncia
escombros duas crianas, amanh, na cidade, que o governo oferecer
Joo Pedro e Messias de trs mil bolsas de R$ 50 para crianas que
Freitas. deixarem o trabalho.

117
Equipe de P&D
Bento Carlos Dias-da-Silva
Maria das Graas Volpe Nunes
Sandra Maria Aluisio
Ricardo Hasegawa
Marco Antonio Esteves da Rocha

IC-Cnpq/Fapesp Mestrado Doutorado


Alexandre Pompeo - CNPq Levi Henrique Merenciano - CNPq
Aline Camila Lenharo - CNPq Lilian de Oliveira Abi Rached - CNPq
Ana Eliza Barbosa de Oliveira - CNPq/FAPESP/CAPES Luciana de Vilhena Margoni - CNPq
Ariani Di Felippo - CAPES/CNPq Luciana Palmeira Goulart - CNPq
Carolina Evaristo Scarton - FAPESP Maria Carolina vila - FAPESP
Dbora Domiciano Garcia - CNPq Maria Lucia Bertazzo Silveira Viana - CNPq
Erasmo Roberto Marcellino - CNPq Mariana Grava de Moraes - CNPq
Fabiana Abi Rached de Almeida - CNPq Mariangela Godoy Cruciani - CNPq
Filipe de Freitas Araujo - CNPq Marina do Vale Pereira Ramos - CNPq
Helio Roberto de Moraes - CNPq Mirna Fernanda de Oliveira - CAPES
Janaina Olsen Rodrigues - CNPq Pablo Teixeira Sostena - CNPq
Klauber Jos Marcelli - CNPq Priscila Berti Domingos - CNPq
Leonardo de Lima Gomes - CNPq Rafael Luis Beraldo - CNPq
118
Talita Devs Faleiros - CNPq
BAKER, C. F., FILLMORE, C. J., LOWE, J. The Berkeley FrameNet project. In Proceedings of the COLING-
ACL, Montreal, Canada, 1998.
CROFT W., CRUSE D. A. Cognitive linguistics. Cambridge: Cambridge University Press, 2004.
Di FELIPO, A. DIAS-DA-SILVA, B. C. O desenvolvimento de uma base de dados lxico-conceitual bilngue
(ingls norte-americano/portugus brasileiro). Alfa, v.52, n.57, 2009.
DIAS-DA-SILVA, B. C. A face tecnolgica dos estudos da linguagem: o processamento automtico das
lnguas naturais. Araraquara, 1996. 272p. Tese (Doutorado em Letras) - Faculdade de Cincias e Letras,
Universidade Estadual Paulista. 1996
DIAS-DA-SILVA, B. C. O estudo lingstico-computacional da linguagem. Letras de Hoje, Porto Alegre, v.41,
p.103-138, 2006.
DIAS-DA-SILVA, B. C.Brazilian Portuguese WordNet: A Computational Linguistic Exercise of Encoding
Bilingual Relational Lexicons. International Journal of Computational Linguistics and Applications,
India, v.1, n.1, p.137-150, 2010.
FELLBAUM, C. (ed.) WordNet. Cambridge, MASS: The MIT Press, 1998.
HANDKE, J. The structure of the lexicon. Berlin: Walter de Gruyter, 1995.
IDE, N.; GREENSTEIN, D.; VOSSEN, P. Special Issue on EuroWordNet. Computers and the Humanities,
v.32, n.2-3, 1998.
JURAFSKY, D., MARTIN, J. H. Speech and language processing. Upper Saddle River, NJ: Prentice Hall,
2008.
KIPPER, K., DANG, H.T., PALMER, M. Class Based Construction of a Verb Lexicon. AAAI-2000 Seventeenth
National Conference on Artificial Intelligence. 8 pg. July 30 - August 3, 2000, Austin TX: 2000
PALMER, M. Semlink: Linking PropBank, VerbNet and FrameNet. Proceedings of the Generative Lexicon
Conference. Sept. 2009, Pisa, Italy: GenLex-09, 2009.
PALMER, M., GILDEA, D., KINGSBURY, P. The Proposition Bank: A Corpus Annotated with Semantic Roles.
Computational Linguistics Journal, 31:1. 2005. pp. 71-105.
VOSSEN, P. (ed.) Introduction to EuroWordNet. Computers and the Humanities, Dordrecht, v. 32, n. 2-3,
p. 73-89, 1998. 119

Vous aimerez peut-être aussi