Vous êtes sur la page 1sur 13

Python e Processamento da Linguagem Natural file:///Library/WebServer/Documents/index02.

html

Unix, Python, Lingüística de


Corpus e Lingüística
Computacional
O sítio http://www.leonel.profusehost.net/ tem como foco as
atividades de pesquisa e ensino de Leonel F. de Alencar, Dr.
phil., professor de língua alemã no Departamento de Letras
Estrangeiras da Universidade Federal do Ceará em Fortaleza,
Brasil, e de lingüística teórica e lingüística computacional no
Programa de Pós-Graduação em Lingüística dessa mesma
instituição, e coordenador do Grupo de Pesquisa Computação e
Linguagem Natural (CompLin).
Enquanto área de interseção entre o estudo das línguas humanas,
a informática e a ciência da computação, a lingüística
computacional tem uma dimensão tanto teórica quanto aplicada.
No primeiro caso, utiliza-se o computador para verificar a
consistência interna e a adequação empírica de teorias da
linguagem natural. Sob a segunda perspectiva, a disciplina faz
interface com a engenharia de softwares, uma vez que está
voltada para a construção de programas capazes de simular o
desempenho lingüístico de falantes de uma língua natural em um
ou mais de um dos diferentes níveis de análise. Sintetizadores de
voz, corretores ortográficos e gramaticais, conjugadores verbais,
analisadores morfológicos, analisadores morfossintáticos e
tradutores automáticos são apenas algumas das muitas aplicações
da lingüística computacional no cotidiano. Outra aplicação
importante da lingüística computacional é o ensino de línguas
mediado por computador (área conhecida pela sigla CALL, do
inglês Computer Assisted Language Learning).
Na Universidade Federal do Ceará, a disciplina HBP727
Lingüística Computacional é oferecida no âmbito do Programa
de Pós-Graduação em Lingüística, em nível de mestrado e
doutorado.

1 of 4 11/27/09 5:04 PM
Python e Processamento da Linguagem Natural file:///Library/WebServer/Documents/index02.html

Tradicionalmente, as ferramentas de análise automática de textos


do sistema operacional Unix, como grep, wc e uniq, têm sido
empregadas com grande proveito, há algumas décadas, na
exploração de corpora lingüísticos. Mais recentemente, no
âmbito da lingüística de corpus, Python tem assumido um papel
cada vez mais importante, em substituição à linguagem Perl, que
praticamente dominou o cenário na década de 1990 e no início
do presente século. No campo da lingüística computacional
stricto sensu, Python se destaca como uma das linguagens de
programação mais importantes na modelação dos diferentes
componentes das gramáticas das línguas naturais. De fato, não é
apenas suficientemente poderosa para implementar os complexos
algoritmos necessários para o processamento da linguagem
natural, mas é também especialmente fácil de aprender por
pessoas sem uma formação em ciência da computação, como é o
caso da maioria dos estudantes de lingüística em nossa
universidade. Uma evidência disso é a sua utilização no Natural
Language Toolkit (NLTK), uma caixa de ferramentas
implementadas como uma biblioteca em Python, destinada à
análise automática de textos e ao processamento computacional
em nível sintático e semântico das línguas naturais.
O tópico principal do sítio é o uso das ferramentas de análise
automática do Unix na lingüística de corpus bem como a
aplicação da linguagem de programação Python em vários
campos relacionados à investigação lingüística e ao ensino e
aprendizagem de línguas. Um objetivo secundário é mostrar as
vantagens da utilização de softwares "livres", gratuitos e de
código-aberto por estudantes e pesquisadores nas áreas de Letras
e Lingüística. Isso é exemplificado por meio de diversos
programas que revelam o potencial desses recursos nas seguintes
áreas:
na modelação de algoritmos matemáticos simples (como
estratégia didático-pedagógica para o desenvolvimento da
habilidade de programar, utilizando, para tanto, sobretudo
Python)
na construção de comandos de busca utilizando expressões
regulares para o levantamento de dados lingüísticos, no
âmbito da lingüística de corpus

2 of 4 11/27/09 5:04 PM
Python e Processamento da Linguagem Natural file:///Library/WebServer/Documents/index02.html

na compilação e anotação automática de corpora


em exercícios interativos sobre temas da lingüística
computacional, lingüística de corpus e lingüística aplicada
O sítio, que ainda se encontra em construção, apresentará tanto
scripts na linguagem do interpretador de comandos bash do
Unix quanto scripts de CGI em Python por meio dos quais os
estudantes podem experimentar interativamente com os
programas elaborados nessa linguagem a serem aqui explicados.
Um primeiro exemplo de script de CGI em Python permite
calcular o máximo divisor comum (MDC) de uma seqüência de
números inteiros. Este script, de minha autoria, implementa
algoritmo simples, desenvolvido por mim mesmo, que, embora
talvez não tão elegante, calcula de forma correta o MDC de dois
ou mais números.
Pelo que sabemos, trata-se do único programa livremente
disponível em língua portuguesa na WWW capaz de calcular o
MDC de mais de dois números. O programa do Professor
Cardy, por exemplo, opera com dois números apenas.
Outros exemplos de scripts de CGI em Python:
Controle de acesso a um endereço de e-mail e formulário de
envio de mensagem
Exercícios do tipo "verdadeiro ou falso" sobre lingüística
aplicada ao alemão
ensino do vocabulário
morfossintaxe do alemão
Exercícios interativos de múltipla escolha sobre sintaxe
alemã
Exercícios interativos sobre lingüística de corpus
e lingüística computacional
Exercícios interativos de língua alemã (em construção)

© 2009 Leonel F. de Alencar [Curriculum Vitae na Plataforma


Lattes] [O Constructor – ferramenta amigável para a lingüística
de corpus] [Grupo de Estudos sobre Lingüística de Corpus e
Lingüística Computacional] [Programa da disciplina HBP727

3 of 4 11/27/09 5:04 PM
Python e Processamento da Linguagem Natural file:///Library/WebServer/Documents/index02.html

Lingüística Computacional]
E-Mail

4 of 4 11/27/09 5:04 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/complin.htm

CompLin – Computação e Linguagem


Natural

Grupo de pesquisa sobre lingüística computacional e


lingüística de corpus na Universidade Federal do Ceará

Vinculação institucional
Sediado no Centro de Humanidades da Universidade Federal do Ceará, o grupo CompLin –
Computação e Linguagem Natural está vinculado estreitamente ao Curso de Letras, ao Departamento
de Letras Estrangeiras e ao Programa de Pós-Graduação em Lingüística, todos integrantes dessa
unidade acadêmica, mas congrega também pesquisadores de outras instituições.

Objetivos
O grupo CompLin – Computação e Linguagem Natural foca a investigação, em nível teórico, dos
aspectos computacionais das gramáticas das línguas naturais bem como a aplicação prática desses
estudos no desenvolvimento de programas de processamento automático da linguagem humana nos
níveis fonológico, morfológico, sintático, semântico e textual, inserindo-se, portanto, na confluência
entre a lingüística teórica e descritiva, a lingüística de corpus e a lingüística computacional.

Fundamentação teórica
Lingüística Teórica
A lingüística teórica, no âmbito do paradigma gerativo chomskyano, tem como objeto de estudo a
Faculdade da Linguagem, que é parte de nosso patrimônio genético enquanto humanos e
responsável, por um lado, pela capacidade inata para adquirir uma língua natural e, por outro, pelas
características comuns a todas as línguas, constituindo o arcabouço da Gramática Universal. Sob
essa perspectiva, a teoria lingüística é um modelo de parte da cognição humana. As estruturas
lingüísticas, que consistem em representações que conjugam uma Forma Lógica (LF, do inglês
Logical Form) e uma Forma Fonética (PF, do inglês Phonetic Form), são geradas pela interação de
dois módulos da mente: o sistema computacional e o léxico, o primeiro operando sobre itens
extraídos do segundo. Nessa teoria, as sentenças consistem de emparelhamentos de LF–PF, os quais
constituem, por sua vez, o input para os sistemas articulatório-perceptual e conceptual-intencional,
responsáveis, respectivamente, por um lado, pela pronúncia e recepção auditiva, por outro, pela
interpretação das sentenças.

Lingüística de Corpus
A lingüística de corpus tem como objetivo a compilação, a anotação e a exploração de corpora,
compreendidos como acervos de textos autênticos em linguagem natural disponibilizados de forma

1 of 3 11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/complin.htm

eletrônica, utilizando, em todas essas etapas, ferramentas computacionais para o processamento


automático de textos.

Lingüística Computacional
A lingüística computacional constitui área de interseção entre os estudos da linguagem natural e a
ciência da computação. Esse enfoque interdisciplinar permite aos lingüistas não apenas direcionar
suas pesquisas para aplicações tecnológicas, mas também verificar a consistência e a plausibilidade
de análises descritivas de línguas particulares e de modelos teóricos da linguagem humana.

Aspectos metodológicos
As pesquisas realizadas nas áreas de lingüística computacional e lingüística de corpus no âmbito do
grupo se valem de uma variada gama de métodos e técnicas. Em primeiro lugar, são utilizadas
linguagens de programação de propósito geral, tanto interpretadas quanto compiladas, com
representantes dos mais diferentes paradigmas de programação, como o declarativo (leia-se Prolog),
procedural (com destaque para a linguagem C), funcional (por exemplo LISP), orientada a objetos
(sobretudo C++) ou multiparadigma (com forte ênfase em Python).

Devido tanto às suas qualidades didático-pedagógicas quanto à enorme quantidade de bibliotecas


disponíveis, Python se sobressai como a linguagem mais utilizada no grupo. De fato, nenhuma outra
linguagem de programação dispõe de uma biblioteca tão rica voltada para o processamento
automático de textos nos diferentes níveis de análise lingüística quanto o Natural Language Toolkit
(NLTK), implementado em Python. Outra vantagem de Python é permitir, de modo relativamente
fácil, elaborar programas para a chamada "computação nas nuvens" (cloud computing), utilizando,
por exemplo, o Google App Engine, talvez a mais importante plataforma de desenvolvimento de
aplicativos para a Web dentro desse novo paradigma.

Na análise automática de textos no âmbito da lingüística de corpus, merecem destaque as ferramentas


de linha de comandos do sistema operacional Unix, como o grep, wc, tr, sort, uniq etc., com
as quais se podem realizar tarefas básicas como extração de concordâncias, toquenizacão e contagem
de palavras de forma extremamente ágil.

A par das linguagens de programação de propósito geral, assumem uma grande importância na
modelação de componentes específicos da gramática, por um lado, modelos lingüísticos
computacionais(ou formalismos lingüísticos) como a LFG, a HPSG, a Morfologia de Dois Níveis
etc., por outro, sistemas de programação lingüística como GFU Lab, LKB , FSA Utilities e xfst (a
respeito da distinção entre formalismos lingüísticos e sistemas de programação lingüística,
consulte-se Guinovart (2000)). Enquanto os dois primeiros estão mais voltados para a construção de
analisadores sintáticos, os dois últimos constituem sistemas para compilação (a partir de expressões
regulares) e manipulação de autômatos e transdutores de estados finitos, por meio dos quais
fenômenos morfológicos e morfofonológicos, a anotação morfossintática de corpora bem como o
mapeamento entre grafemas e fonemaspodem ser modelados computacionalmente de forma
extremamente eficiente.

Relevância sócio-econômica
As pesquisas desenvolvidas pelos membros do grupo, em nível de iniciação científica, mestrado e
doutorado, visam a preencher lacunas tanto na formação de recursos humanos no Ceará, uma vez
que não há, nesse Estado, outros grupos na área de gramática gerativa ou processamento automático
da linguagem natural, quanto no âmbito da indústria de softwares brasileira como um todo, na qual
as tecnologias da linguagem natural, não obstante o papel cada vez mais importante que
desempenham nos países mais desenvolvidos, ainda não têm sido suficientemente exploradas.

2 of 3 11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/complin.htm

Equipe
Coordenador

Prof. Dr. Leonel F. de Alencar (Departamento de Letras Estrangeiras e Programa de Pós-Graduação


em Lingüística da UFC)

Pesquisadores

Nome Nível Financiamento Área Instituição


Aluno do Programa de
Tiago Martins doutorando CAPES tradução automática Pós-Graduação em
da Cunha Lingüística
processamento
computacional da Ex-aluna do Programa de
Andréa Feitosa mestre CAPES sintaxe em gramáticas Pós-Graduação em
dos Santos baseadas em estruturas Lingüística
de traços
análise morfológica Aluno do Programa de
Ednardo Luiz computacional no
mestrando CAPES Pós-Graduação em
da Costa paradigma de estados Lingüística
finitos
Raimundo lingüística de corpus
Cleodimar de iniciação Aluno do Curso de
CNPq (anotação automática de
Oliveira Júnior científica Letras – Português
corpora)
agentes
conversacionais
Mauro Sérgio iniciação Aluno do Curso de
(chatterbots) com
Pereira científica Letras – Alemão
tecnologia text to
speech
Professor do
Bacharelado em
análise
Davis Macêdo mestre Engenharia de
lógico-semântica
Vasconcelos Telecomunicações
automática – Instituto Federal do
Ceará

Homepage
<---
© 2009 Leonel F. de Alencar
E-Mail
Página do CompLin – Lingüística Computacional e Lingüística de Corpus no Diretório dos
Grupos de Pesquisa no Brasil

3 of 3 11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

Lingüística Computacional e Lingüística de


Corpus na Universidade Federal do Ceará

Programa da disciplina HBP727: Lingüística Computacional


do Programa de Pós-Graduação em Lingüística da
Universidade Federal do Ceará
Palavras-chave: Unix, Prolog, Python, NLTK, Natural Language Toolkit, sintaxe, semântica,
morfologia, linguistica computacional, linguistica de corpus, lingüística computacional, lingüística de
corpus, autômatos de estados finitos, transdutores de estados finitos, processamento computacional
da linguagem natural, engenharia da gramática, corpora digitais, corpora eletrônicos

Ministério da Educação
Universidade Federal do Ceará
Pró-Reitoria de Pesquisa e Pós-Graduação

PROGRAMA DE DISCIPLINA

1. Identificação do Curso:
1.1 Curso:
Lingüística

2. Modalidades:
Mestrado ( X )
Doutorado ( X )

3. Turno(s)
Diurno ( X )
Noturno ( )

1 of 6 11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

4. Departamentos participantes
Letras Vernáculas

Letras Estrangeiras

5. Identificação da Disciplina:
Nome:
Lingüística Computacional

Código:
HBP727

Carga Horária:
64

Créditos:
4

Optativa:
Sim ( X ) Não ( )

Obrigatória:
Sim ( ) Não ( X )

6. Pré-Requisitos:

7. Professor Responsável:
Leonel Figueiredo de Alencar Araripe

8. JUSTIFICATIVA

2 of 6 11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

A lingüística computacional constitui área de interseção entre os estudos da linguagem natural e a


ciência da computação. Esse enfoque interdisciplinar permite aos lingüistas não apenas direcionar
suas pesquisas para aplicações tecnológicas, mas também verificar a consistência e a plausibilidade
de análises descritivas de línguas particulares e de modelos teóricos da linguagem humana. A
presente disciplina, que contempla subárea da Linha de Pesquisa Lingüística Aplicada do Programa
de Pós-Graduação em Lingüística, oferece uma introdução ao processamento computacional das
línguas naturais tanto no nível da gramática quanto do texto, voltada especialmente para estudantes
de pós-graduação em lingüística sem embasamento em matemática, lógica e computação. A
graduados dessas áreas, contudo, esta disciplina também poderá ser de proveito, na medida em que o
processamento automático da linguagem natural pressupõe teorias, abordagens e ferramentas
específicas que normalmente não integram a grade curricular desses cursos (pelo menos no Ceará).

9. OBJETIVOS

i. Familiarizar com conceitos-chave da matemática e da lógica pressupostos pela lingüística formal e


pela programação nos paradigmas procedural, lógico e de estados finitos.
ii. Desenvolver a capacidade de realizar análises gramaticais formais.
iii. Familiarizar com os elementos básicos da interface de linha de comandos bash do sistema
operacional Unix, das linguagens de programação Prolog e Python, com ênfase na biblioteca NLTK
(Natural Language Toolkit), e da programação de estados finitos nos sistemas FSA Utilities e xfst.
iv. Familiarizar com a metalinguagem das expressões regulares no sistema operacional Unix e na
linguagem Python e desenvolver a habilidade de construir comandos com expressões regulares para
extração de padrões em textos.
v. Desenvolver a habilidade de manipular corpora lingüísticos utilizando as ferramentas da biblioteca
em Python do NLTK.
vi. Desenvolver a habilidade de implementar computacionalmente análises gramaticais nos
formalismos do NLTK.
vii. Familiarizar com aplicações exemplares do processamento computacional da gramática.

10. EMENTA

Estudo de formalismos para a modelação computacional da gramática das línguas naturais, de sua
aplicação no desenvolvimento de ferramentas para o processamento automático da linguagem natural
bem como de técnicas computacionais para a análise automática de textos no âmbito da lingüística de
corpus.

11. PROGRAMA DA DISCIPLINA

Fundamentos lógico-matemáticos: lógica proposicional; teoria dos conjuntos; relações e


funções; lógica de predicados; línguas formais.
A organização da gramática: divisão de trabalho entre léxico, morfologia e sintaxe; regras de
reescrita categoriais; propriedades morfossintáticas dos itens lexicais; teoria X-barra; interface
semântica-sintaxe.
Elementos da linguagem de programação lógica PROLOG: predicados e cláusulas; fatos e
regras; átomos, variáveis e listas; diretivas; unificação; operações sobre listas; mecanismo de
resolução.

3 of 6 11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

Emprego de PROLOG no processamento automático da morfologia e sintaxe: flexão e


formação de palavras como concatenação de átomos; estruturação sintagmática como
concatenação de listas; a Gramática de Cláusulas Definidas (Definite Clause Grammar -
DCG).
Morfologia de estados finitos: processos morfológicos concatenativos e não-concatenativos;
regras de formação de palavras; regras morfofonológicas; ferramentas de estados finitos dos
pacotes FSA Utilities e xfst.
Lingüística de corpus: compilação e anotação de corpora; expressões regulares; ferramentas do
Unix para extração de dados de corpora; processamento de textos em Python utilizando o
NLTK.
Processamento automático da sintaxe no NLTK: Gramática livre de contexto; gramática
baseada em estrutura de traços; métodos e estratégias de parsing.
Aplicações da análise morfológica e sintática computacionais: corretores gramaticais, sistemas
de tradução automática e de diálogo homem-máquina etc.

12. FORMA DE AVALIAÇÃO

Participação nas aulas. Desempenho na resolução de exercícios teóricos e práticos, na apresentação


de seminários e em provas escritas. Construção de um fragmento de gramática computacional de
uma língua natural e elaboração da respectiva documentação. Desenvolvimento, apresentação e
documentação de um miniprojeto na lingüística de corpus.

13. BIBLIOGRAFIA BÁSICA


ABEILLE, Anne. Les nouvelles syntaxes. Paris: Armand Colin, 2003.
ALENCAR, Leonel Figueiredo de. Linguagem e inteligência artificial. In: MATTES, Marlene
Gonçalves (Org.). Linguagens: as expressões do múltiplo. Fortaleza: Premius, 2006. p. 11-53.
ARARIBÓIA, G. Inteligência artificial: um curso prático. Rio de Janeiro: Livros Técnicos e
Científicos, 1988.
BAILLY, Yves. Initiation à la programmation avec Python et C++. Paris: Pearson Education
France, 2008.
BEESLEY, Kenneth R.; KARTTUNEN, Lauri. Finite state morphology. Stanford: CSLI
Publications, 2003.
BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the
Natural Language Toolkit. Sebastopol, CA, O'Reilly, 2009.
BLACKBURN, Patrick; BOS, Johan; STRIEGNITZ, Kristina. Learn Prolog now! Saarbrücken:
Universität des Saarlandes, 2001. Disponível em:<
http://www.coli.uni-saarland.de/~kris/learn-prolog-now/html/prolog-notes.pdf> Acesso em:
29.04.2005.
BUTT, Miriam et al. A grammar writer's cookbook. Stanford: CSLI Publications, 1999.
CARNIE, Andrew. Syntax: a generative introduction. Oxford: Blackwell, 2002.
CLOCKSIN, William F.; MELLISH, Christopher S. Programming in Prolog: using the ISO
standard. 5. ed. Berlin: Springer, 2003.
DEVLIN, Keith. O gene da matemática. Tradução de Sérgio Moraes Rego. Rio de Janeiro: Record,
2004.
FALK, Yehuda N. Lexical-Functional Grammar: an introduction to parallel constraint-based syntax.
Stanford: CSLI Publications, 2001.
JURAFSKY, Daniel; MARTIN, James H. Speech and language processing: an introduction to
natural language processing, computational linguistics, and speech recognition. Upper Saddle River,
NJ: Prentice Hall, 2008.
KLABUNDE, Ralf et al. (Orgs.). Computerlinguistik und Sprachtechnologie: eine Einführung.

4 of 6 11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

Heidelberg: Spektrum Akademischer Verlag, 2004.


KLENK, Ursula. Generative Syntax. Tübingen: Narr, 2003.
LANGENDOEN, D. Terence. Linguistic theory. In: BECHTEL, William; GRAHAM, George
(Orgs.). A companion to cognitive science. Oxford: Blackwell, 1999. p.235-244.
LEMNITZER, Lothar; ZINSMEISTER, Heike. Korpuslinguistik: eine Einführung. Tübingen: Narr,
2006.
MIOTO, Carlos; FIGUEIREDO, Maria Cristina; LOPES, Ruth. Novo Manual de Sintaxe.
Florianópolis: Insular, 2005.
MITKOV, Ruslan. The Oxford handbook of computational linguistics. Oxford: Oxford University
Press, 2005.
MENUZZI, Sérgio de Moura; OTHERO, Gabriel de Ávila. Lingüística Computacional: teoria &
prática. São Paulo: Parábola, 2005.
OTHERO, Gabriel de Ávila. Teoria X-barra: descrição do português e aplicação computacional. São
Paulo: Contexto, 2006.
PAGANI, Luiz Arthur. Analisador gramatical em Prolog para gramáticas de estrutura sintagmática.
Revista Virtual de Estudos em Linguagem - ReVEL. Ano 2, n.3, ag. 2004. [www.revelhp.cjb.net].
PARTEE, Barbara; TER MEULEN, Alice; WALL, Robert. Mathematical methods in linguistics.
Kluwer, Dordrecht, 1990.
RANCHHOD, Elisabete Marques (Org.). Tratamento das línguas por computador: uma introdução
à linguística computacional e suas aplicações. Lisboa: Caminho, 2001.
RAPOSO, Eduardo Paiva. Teoria da gramática: a faculdade da linguagem. 2. ed. Lisboa: Caminho,
1998.
REPPEN, Randi. Review of MonoConc Pro and WordSmith Tools. Language Learning &
Technology, Vol. 5, No. 3, May 2001, pp. 32-36. Disponível em:
<http://llt.msu.edu/vol5num3/review4/default.html> Acesso em: 03.09.2008
SAG, Ivan A.; WASOW, Thomas; BENDER, Emily. Syntactic theory: a formal introduction. 2. ed.
Stanford: CSLI Publications, 2003.
SARDINHA, Tony Berber. Usando WordSmith Tools na investigação da linguagem. Direct Papers
40, LAEL, PUCSP, 1999. Disponível em:<www2.lael.pucsp.br/direct/DirectPapers40.pdf > Acesso
em: 03.09.2008.
______. Preparação de material didático para Aprendizagem Baseada em Tarefas com WordSmith
Tools e corpora. Calidoscópio, São Leopoldo, v. 4, n. 3, p. 148-155, 2006.
SOBELL, Mark G.; SEEBACH, Peter. A practical guide to UNIX for Mac OS X users. Upper
Saddle River, NJ: Prentice Hall, 2006.
SOCHER, Guido. Regular expressions. LinuxFocus, July 1998. Disponível em:
<http://www.linuxfocus.org/English/July1998/article53.html> Acesso em: 30.8.2008.
VIEIRA, Renata ; STRUBE DE LIMA, V. L. . Lingüística Computacional: princípios e aplicações.
In: Ana Teresa Martins; Díbio leandro Borges. (Org.). SBC - Jornadas de Atualização em
Inteligência Artificial (JAIA). Fortaleza - CE: , 2001, v. 3, p. 47-86. Disponível em:
<http://www.di.ubi.pt/~pln/jaia12-vf.pdf>. Acesso em: 6 set. 2005.
ZELLE, John. Python programming: an introduction to computer science. Wilsonville, Oregon:
Franklin, Beedle & Associates, 2004.

14. BIBLIOGRAFIA COMPLEMENTAR


ABEILLE, Anne. Une grammaire électronique du français. Paris: CNRS Editions, 2002.
ALENCAR, Leonel Figueiredo de. Complementos verbais oracionais: uma análise léxico-funcional.
Lingua(gem), Santa Maria, v. 1, n. 1, p. 173-218, jan./jun. 2004.
BAADER, Franz. Logic-based knowledge representation. In: WOOLDRIDGE, Michael
J.;VELOSO, Manuela (Orgs.). Artificial intelligence today: recent trends and developments. Berlin:
Springer, 1999. p.13-41.
BERMAN, Judith;FRANK, Anette. Deutsche und französische Syntax im Formalismus der LFG.
Tübingen: Niemeyer, 1996.
BLACKBURN, Patrick; BOS, Johan. Representation and inference for natural language: a first
course in computational semantics. Stanford: CSLI Publications, 2005.
BRESNAN, Joan. Lexical-functional syntax. Oxford: Blackwell, 2001.
CHUN, Wesley J. Core Python programming. 2. ed. Upper Saddle River, NJ: Prentice Hall, 2008.

5 of 6 11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus file:///Library/WebServer/Documents/lingc.html

FORST, Martin. La traduction automatique dans le cadre formel de la LFG - Un système de


traduction entre l'allemand standard et le zurichois. Cahiers du Centre de Traduction Littéraire de
l'Université de Lausanne, Lausanne, n. 41, 2002.
GOMEZ, Xavier Guinovart. Lingüística computacional. In: RAMALLO, Fernando; REI-DOVAL,
Gabriel; RODRIGUEZ, Xoán Paulo (Orgs.). Manual de ciencias da linguaxe. Vigo: Xerais, 2000.
p. 221-268.
HAUSSER, Roland. Foundations of computational linguistics: human-computer communication in
natural language. 2. ed. Berlin: Springer, 2001.
HORNSTEIN, Norbert; NUNES, Jairo; GROHMANN, Kleanthes K. Understanding Minimalism.
Cambridge: Cambridge University Press, 2005.
KRIEBEL, Wolfgang; ROSE, Andreas; SCHMITT, Dietmar. Zur Geschichte der
Programmiersprache PROLOG. Disponível em:< http://www.dietmar-schmitt.de /essays/
SGI/Prolog_geschichte_1.html> Acesso em: 24.05.2005.
LOBIN, Henning; LEMNITZER, Lothar (Orgs.). Texttechnologie: Perspektiven und
Anwendungen. Tübingen: Stauffenburg, 2004.
MEHLER, Alexander; LOBIN, Henning (Orgs.). Automatische Textanalyse: Systeme und
Methoden zur Annotation und Analyse natürlichsprachlicher Texte. Wiesbaden: Verlag für
Sozialwissenschaften, 2004.
MERTZ, David. Text processing in Python. Upper Saddle River, NJ: Addison-Wesley, 2003.
NEGNEVITSKY, Michael. Artificial intelligence: a guide to intelligent systems. New York:
Addison-Wesley, 2002.
RADFORD, Andrew. Minimalist Syntax : exploring the Structure of English. 2. ed. Cambridge:
Cambridge University Press, 2004.
RAPOSO, Eduardo Paiva. Da Teoria dos Princípios e Parâmetros ao Programa Minimalista:
algumas idéias-chave. In: CHOMSKY, Noam. O Programa Minimalista. Tradução de Eduardo
Paiva Raposo. Lisboa: Caminho, 1999. p.15-37.
REISCHER, Jürgen. Linguistische und philosophische Aspekte der natürlichen und maschinellen
Sprachverarbeitung: über Denken, Sprache, Bedeutung und Handeln bei Mensch und Maschine.
Idstein: Schulz-Kirchner, 2000.
RIBEIRO, Catarina Santiago. Relatório de estágio realizado no âmbito do projecto INQUER -
Interacção Pessoa-Máquina em Linguagem Natural: módulo I - análise sintáctico-semântica. Lisboa:
Departamento de Informática e Centro de Lingüística da Universidade de Lisboa. Disponível em:
<http:// www. clul.ul. pt/clg/ inquer/ relatorio_Ribeiro03.pdf> Acesso em: 06.02.2006.
SCHWARTZ, Randal L.; PHOENIX, Tom. Learning Perl. 3. ed. Sebastopol, CA: O'Reilly, 2001.
SCHWARZE, Christoph. Lexikalisch-funktionale Grammatik: eine Einführung in 10 Lektionen mit
französischen Beispielen. Fachgruppe Sprachwissenschaft der Universität Konstanz, Arbeitspapier
Nr. 76, 1998.
______. Introduction à la sémantique lexicale. Tübingen: Narr, 2001.
WIELEMAKER, Jan. SWI-Prolog 5.4 Reference Manual. Amsterdam: University of Amsterdam,
Department of Social Science Informatics (SWI), 2004. Disponível em:<
http://gollem.science.uva.nl/cgi-bin/nph-download/SWI-Prolog/refman/refman.pdf> Acesso em:
29.04.2005.
ZELLER, Frauke. Mensch-Roboter Interaktion: eine sprachwissenschaftliche Perspektive. Kassel:
Kassel University Press, 2005.

© 2009 Leonel F. de Alencar Homepage <---

E-Mail

6 of 6 11/27/09 4:55 PM

Vous aimerez peut-être aussi