Académique Documents
Professionnel Documents
Culture Documents
Por
Em especial
Sumrio
Lista de Smbolos
IA
SN
SA
SP
PLN
IBM
NQL
KBNL
4GL
G
S
SNC
SV
ATN
LISP
PROLOG
Inteligncia Artificial
Sintagma Nominal
Sintagma Adverbial
Sintagma preposicional
Processamento da Linguagem Natural
International Business Machine
Natural Language Query
Knowledge Base Natural Language
Linguagem de Quarta Gerao
Gramtica
Sentena
Sintagma Nominal Complementar
Sintagma Verbal
Augmented Transition Networks
Linguagem de programao baseada no
processamento de listas
Linguagem de programao simblica
baseada no clculo dos predicados
Lista de Figuras
Resumo
Explorar
as
possibilidades
oferecidas
pelos
recursos
nveis lingsticos e
modelos de gerao de
Abstract
computational
resources to the processing of the human language has been one of the
great challenges in our days. The natural language is processed primarily by
people, so that, to project machines that understand it, we should count with
the progress of the cognitive sciences and with the development of
appropriate techniques. Several attempts exist of presenting an unified
model, even so this is still besides the reach of the research. Thus, in that
work, we tried to transpose the real world of the natural language for the
computational way, presenting recognition techniques according to linguistic
levels and models of generation of grammars.
problems and difficulties with the processing of the language that are not
solved. Before the exposed, our objective is, in spite of the incognito that it is
the recognition process and processing of the language, to produce an
interface through the natural language that search bases of data, using tools
of fourth generation, maintaining a relationship of reasonable understanding
with the user.
Objetivos
Objetivos Gerais:
Desenvolver e implementar um sistema que possibilite ao usurio
final interagir com uma base de dados (que suporta o padro SQL) de forma
que a entrada para consultas seja feita atravs da linguagem natural.
Objetivos Especficos:
10
1 Introduo
a implementao de
profissionais liberais e
11
procedeu-se
uma
reviso
bibliogrfica,
literatura
12
Query
Language)
consequentemente
execut-la.
Na
acesso para
os
usurios no
13
por
certas
disciplinas:
gramtica, filosofia
lingistica.
Ao
dizermos
que
uma
linguagem
natural,
estamos
linguagem
natural
difere
das
linguagens
formais,
expresso, basicamente, em
14
2.1 IA
Uma das reas de grande relevncia da Informtica, a
Inteligncia
- Sistemas Especialistas;
- Sistemas Inteligentes e autodidatas;
- Reconhecimento de Modelos;
15
prprias para a
atual
encontramos
programas
deste
gnero
16
17
rea de
Inteligncia Artificial .
18
2.3.1 Ambigidade
19
a)
SN
SN
SA
A cortina de seda
antiga
b)
SN
SN
A cortina
SP
de seda antiga
20
Onde:
SN sintagma nominal
SA sintagma adverbial
SP sintagma preposicional
21
2.4 Contribuies
Vrias reas tm contribudo para solues no estudo da
linguagem. A neurologia, a filosofia, a metafsica, a psicologia e a lingstica
so algumas que merecem destaques. Mas quando as pesquisas deslocam-
22
anlise
referente
ao
sentido,
significado, levando em
conta
23
24
de
linguagem
natural
cujo
conhecimento
especfico
est
25
26
27
28
4 Gramticas e Analisadores
29
30
base de conhecimento, a ambigidade lxica maior do que denota no diaa-dia. Como no exemplo j visto: o p est mido . Se todas as formas de
interpretao for considerada, pode se tornar muito dispendioso e caro.
Muitos sistema tratam de uma nica interpretao plausvel e se rejeitada
faz-se uma nova tentativa, resultando um sistema prtico e satisfatrio.
31
32
permitam recuperar as
disponveis
33
anlise
sinttica
menos
dispendiosa
em
termos
34
35
36
chamada reescrita,
que permite
37
38
G = (N,,P,So), onde
N - conjunto dos no terminais
- conjunto dos terminais
P - regras gramaticais ou de produo
So - um no-terminal que serve como smbolo inicial
Por exemplo:
39
Gramticas
reconhecidas,
porm
regulares
tem
so
um
bastante
poder
de
simples
expresso
facilmente
limitado,
40
Onde:
GN = grupo nominal
N = grupo nominal sem determinante
SGN = seqncia do grupo nominal
d = determinante
n = nome
prep = preposio
cc = conjuno coordenativa
41
GN N SGN GN
N SGN N
prep
prep
os
alunos
de
(a)
cidade
de
Frederico
n SGN
SGN prep GN
cc GN
| prep N
42
43
aX1bc
abX1c
abX2bcc
aX2bbcc
aaX1bbcc
aabX1bcc
aabbX1cc
aabbX2bccc
aaX2bbbccc
aaabbbccc
44
45
46
}
So = S
Artigo = {o,a,os,as}
Conjuno = { com, e}
47
SV
Verbo
SNC
SN
art
subst
SP
prep
Mostre
os
Clientes
de
Frederico Westphalen
48
SV
Verbo
art
SNC
SN
subst
art
SN
subst
SP
prep
art
SN
subst
SP
prep
Liste o
nome o
telefone
de os
clientes
de Seberi
49
50
51
52
cozinhou por trs horas. A estrutura sinttica das duas frases so quase
idnticas. O que muda somente o sujeito, "mame" e "o feijo".
importante notar que essa informao semntica na verdade interfere na
sintaxe da lngua. Embora seja permitido juntar duas frases paralelas, ou
seja, podemos unir, como por exemplo, "o feijo e o arroz cozinharam", mas
nunca " A mame e o feijo cozinharam".
53
54
imediatamente,
processamento
do
sem
que
seria
estgio
necessrio
adicional
caso
do
uma
55
de
conseguirem
captar
importantes
generalizaes
lingsticas.[RIC 94]
Considere o texto:
Meu carro foi assaltado ontem.
Eles levaram o aparelho de som e os CDs.
56
57
58
para
outras
redes
que
reconhecem
os
foi impresso.
59
60
61
62
da palavra, ou seja, as
63
Erros de Ortografia
No existe um processo de que seja infalvel para tratar esse tipo
de erro, mas pode-se utilizar alguns mtodos para recuperar esta forma de
erro. Uma palavra composta de letras a priori imutveis. Ento, quando
uma palavra mal escrita, ela comparada com as diferentes formas
armazenadas no lxico, no intuito de encontrar a mais adequada, ou seja, a
mais semelhante da solicitada.
Falta de Informaes
Um erro difcil
64
65
5.2 Prospector
PROSPECTOR foi desenvolvido nos fins da dcada de 70 no
Stanford Research Institute, por um grupo que inclua Peter Hart, Richard
Duda, R. Reboh, K. Konolige, P. Barret e M. Einandi. O desenvolvimento do
PROSPECTOR foi financiado pelo U. S. Geological Survey e pela National
Science Foundation.
66
67
idia
do
INTELLECT
parece
ser
prefervel
ao
do
Todos os programas
acima citados
so somente de leitura,
68
6 Ambientes e Instrumentos
empregados para
69
6.1 Linguagens
Para definir qual a melhor
70
71
restritivas quanto
72
73
7 Modelo do Prottipo
Nas fases de
processamentos da
linguagem encontramos
geralmente :
analisador morfolgico e lexical
um problema resolvido, com tempo de processamento
dependente do tamanho do dicionrio utilizado. A deciso de
qual o tipo de dicionrio utilizar depende dos objetivos do
sistema e do espao disponvel.
analisador sinttico e semntico
uma mesma frase pode ter mais de uma estrutura derivvel,
denotando interpretaes diferentes. A resoluo desta
ambigidade no possvel a nvel sinttico , devendo este
nvel gerar as interpretaes necessrias e serem tratadas a
nvel semntico.
Analisador pragmtico
Um aspecto que merece um estudo bem mais aprofundado
realizar o processamento a nvel pragmtico. Em certas frases
o
efeito
pretendido
claramente
declarativo,
esta
74
gramticas puramente
sintticas.
um analisador lxico,
e para facilitar a
75
operao do sistema.
76
Analisador SQL:
Recebe a
frase do analisador
sinttico e
Dicionrio:
Armazena
Determinante (artigo)
determinante (o,a)
77
determinante (os,as)
determinante (um, uma)
determinante (uns, umas)
Pronomes
interrogativo (quantos)
relativo (todos)
Preposio
preposio ( a )
preposio (com)
preposio (de)
preposio (de+a)
preposio (em)
Conjuno
conjuno (e)
conjuno (que)
Advrbio
Lugar (onde)
Modo (como)
Intensidade (mais, menos)
Verbo
Verbo (liste, mostre, relacione)
Verbo (listar, mostrar, relacionar)
Substantivo
comum (cliente)
comum (clientes)
78
exemplo:
- Nome
- Endereo
- Bairro
- Cidade
- Cnjuge (esposo, esposa)
- Salrio (renda)
- Sexo
Liste
Select
Relacione
Select
Onde
Where
Com
Where
Todos
Igual
Maior
>
Categoria
cliente
coluna
dicionrio
funcaosql
gramtica
79
Campo
cacodcategoria
cadescricao
Tabela
categoria
categoria
Campo
clcodcli
clnome
clendereco
clbairro
clcep
clcidade
cldatanascimento
clfone
clsexo
clestadocivil
clconjuge
clsalario
Campo
codescricao
cotipo
Tipo
Tamanho
char
5
varchar
20
Indexado
unique
unique
Tabela
cliente
cliente
cliente
cliente
cliente
cliente
cliente
cliente
cliente
cliente
cliente
cliente
Tipo
int
varchar
varchar
varchar
char
varchar
date
char
char
char
varchar
vastint
Tamanho
Tabela
coluna
coluna
Tipo
varchar
char
Tamanho Indexado
20 unique
10 yes
Tipo
varchar
char
char
Tamanho Indexado
20 unique
5
yes
2
yes
Campo
dipalavra
dicodcategoria
dicodfuncaosql
Tabela
dicionrio
dicionrio
dicionrio
Campo
fucodfuncaosql
fudescricao
Tabela
funcaosql
funcaosql
Campo
grcodgra
grcodcategoria
grproximo
Tabela
gramtica
gramtica
gramtica
Tipo
char
varchar
Tipo
char
char
char
4
30
30
20
8
30
8
11
1
10
30
11
ndexado
unique
yes
no
yes
no
yes
yes
no
yes
yes
no
yes
Tamanho Indexado
2 unique
20 unique
Tamanho Indexado
5
yes
5
yes
5
yes
80
analisador
sinttico
dever
provar
regras,
tanto
Ex:
B substantivo
B substantivo C
Leia-se: um B um substantivo ou um substantivo
seguido de C.
81
provar (b) novamente ter consultado o lxico realizando uma tarefa j feita
e falha. Tentar provar (c) novamente consulta o lxico agora para ver se a
palavra um cdigo, o que resulta em sucesso. Poder se tornar um
processo lento e caro a medida que a gramtica aumenta, isto , adaptando
casos de indeterminismos.
Exemplo 1
Relacione todos clientes
Verbo pronome substantivo
Exemplo 2
Relacione todos clientes da cidade de Seberi
Verbo pronome substantivo preposio campo
preposiovalor
S
V
A
B
B
C
D
E
X
V
verbo A
pronome B
substantivo
substantivo C
preposio D
campo E
preposio X
valor
82
S um verbo seguido de A
A um pronome seguido de B
B um substantivo
S um verbo seguido de A
A um pronome seguido de B
B um substantivo seguido de C
C uma preposio seguido de D
D um valor de campo da base de dados seguido de E
E uma preposio seguida de X
X um valor de registro na base de dados
7.2.2 Gramtica
Gramtica:
ver A
art B
pronr B
pronr C
AP
pr I
AV
ver2 AP
subc
99 D
83
subc K
subc E
99 A
subc R
art B
pr B
adv F
adv O
con F
99 G
adv H
adv I
ver2 I
art I
valor
valor J
valor AV
con F
pr L
99 M
pr I
art F
ver A
pron T
99 M
subc2 F
subc2 D
verax A
99 FS
FS
subc G
Onde:
99
84
liste
verbo (ver)
todos
pronome (pronr)
os
artigo (art)
clientes
substantivo (subsc)
ver A
85
art B
pron B
pron C
verax A
subsc
99 D
subc E
subc K
99 A
subc R
subc D
86
5) Estando no estado B
B
subsc
99 D
subc E
subc K
99 A
subc R
subc D
a) Sentenas vlidas:
87
b) Sentenas invlidas:
88
8 Concluso
Este trabalho apresentou uma viso geral das etapas que
envolvem o reconhecimento e processamento da linguagem natural na
computao.
Descrevemos
os
conceitos
envolvidos
no
tratamento
de
89
realizada em domnio
90
Bibliografia
[DAT 89]
91