Vous êtes sur la page 1sur 10

PROPOSTA DE UM AUTMATO FINITO DETERMINSTICO PARA A GLOSA PORTUGUS LIBRAS

Manoelisa Goebel Andre Zanki Cordenonsi (manoelisa@hotmail.com) (andrezc@unifra.br) Centro Universitrio Franciscano (UNIFRA) +55 (55) 220-1200 RESUMO: Grande parte dos surdos utiliza a Lngua Brasileira de Sinais (LIBRAS) para a sua comunicao. No entanto, alguns encontram dificuldade para compreender totalmente um texto, pois o portugus no a sua lnguame, e possui uma ordem diferente da definida pela LIBRAS. Para minimizar este problema, foi desenvolvido um Autmato Finito Determinstico para a transformao de textos eletrnicos em portugus para textos no formato compreensvel por este grupo, o que denominado Glosa PortugusLIBRAS. PALAVRASCHAVES: Informtica na Educao Especial, Aspectos Sociais de Informtica na Educao, Lngua Brasileira de Sinais, glosa, Autmato Finito Determinstico. 1 Introduo A linguagem utilizada para comunicao depende do grupo em que se est inserido, ou seja, depende das especificidades individuais de cada indivduo. Para os ouvintes, pode-se estabelecer em termos orais-auditivo. No entanto, para os no ouvintes (surdos), pode-se estabelecer em termos gestuais-visuais, onde gestual significa o conjunto de elementos lingsticos manuais, corporais e faciais necessrios para a articulao do sinal.
Grande parte do grupo dos surdos e deficientes auditivos utilizam a lngua de sinais, a qual representa uma modalidade onde o canal de comunicao o gestual-visual. Desta forma, seus pensamentos se baseiam na sua lngua-me que, no Brasil, denominada de LIBRAS, Lngua Brasileira de Sinais. Pelo fato dos usurios da lngua de sinais se comunicarem atravs desta, a estruturao das frases na Lngua Portuguesa, ou melhor, a sintaxe da Lngua Portuguesa (a qual se torna sua segunda lngua) difere da sintaxe da lngua de sinais brasileira escrita, dificultando sua compreenso completa de textos.

Devido ao fato de no possurem um acesso to rpido as informaes como os ouvintes, os surdos necessitam de um meio escrito ou gestual-visual para receberem qualquer tipo de informao. Quando este meio est na forma escrita, muitas vezes a informao no compreendida de uma forma geral, pois est na forma escrita da Lngua Portuguesa, o que impossibilita sua compreenso total. Em Quadros [1], citado que, nas lnguas de sinais, enquanto o emissor constri uma sentena a partir dos elementos manuais, corporais e faciais, o receptor utiliza os olhos ao invs dos ouvidos para entender o que est sendo comunicado. Desta forma, como a informao lingstica recebida pelos olhos, os sinais so construdos de acordo com as possibilidades perceptuais do sistema visual humano. Logo, as relaes espaciais nas lnguas de sinais so muito complexas. Na LIBRAS, as relaes gramaticais so especificadas atravs da manipulao dos sinais no espao. As relaes ocorrem dentro de um espao definido, na frente do corpo, em uma rea limitada pelo topo da cabea e que se estende at os quadris, sendo que o final de uma sentena na LIBRAS indicado por uma pausa. O mesmo processo acontece com a American Signal Language (Lngua de Sinais Americana), a qual utiliza mecanismos espaciais que fazem com que a informao gramatical se apresente simultaneamente com o sinal.

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

262

Estes mecanismos envolvem quatro aspectos: localizao, nmero, pessoa e o uso de sinais no-manuais, como os movimentos do corpo e expresses faciais. Estes mecanismos tambm so verificados na LIBRAS. As lnguas de sinais, assim como as orais, possuem uma gramtica prpria com regras especficas em todos os nveis lingsticos: morfolgico, fonolgico, sinttico e semntico. Os fonemas no portugus se estruturam seqencialmente ou linearmente no tempo, enquanto que os fonemas da LIBRAS so estruturados simultaneamente no espao. Desta forma, as unidades mnimas se organizam conforme os seguintes parmetros: (a) Configurao de mos; (b) Ponto de articulao; (c) Movimentao Orientao; e (d) Expresso corporal. No que diz respeito ordem das palavras ou constituintes, Brito [2] afirma que h diferenas, pois o portugus uma lngua de base SujeitoPredicado, enquanto a LIBRAS uma lngua do tipo TpicoComentrio. Esta topicalizao freqente na fala coloquial dos ouvintes. No entanto, na LIBRAS, pode-se dizer que regra geral, onde a ordem TpicoComentrio a preferida quando no h restries que impeam certos constituintes de se deslocarem. Mesmo assim, h um grande nmero de sentenas utilizando a ordem SujeitoVerbo Objeto (SVO). Conforme o exposto acima, os usurios de lngua de sinais no esto capacitados a produzirem textos em suas lnguas naturais, pois estas possuem uma estrutura paralela, com a utilizao de gestos complexos que envolvem simultaneamente diversas partes do corpo do sinalizador. Desta forma, a aquisio da Lngua Portuguesa pelos surdos um processo de aquisio de uma segunda lngua, a qual chamada por Quadros [1] de L2, o que acaba por dificultar a compreenso de textos escritos na estrutura da Lngua Portuguesa. Ser demonstrada aqui a modelagem de uma ferramenta capaz de traduzir textos em portugus para a LIBRAS, de uma forma geral e completa. Como a estrutura desta lngua mais simples do que as gramticas das linguagens orais, ser utilizada uma abordagem atravs do estudo das Linguagens Formais. A partir desta teoria, modelouse um autmato finito determinstico que possa realizar a traduo seguindo a forma supostamente mais correta que respeite a cultura surda. A modelagem proposta pretende possibilitar que uma dada entrada (estado inicial) formada por um texto em estrutura gramatical seguindo a estrutura da Lngua Portuguesa, tenha como sada (estado final) um texto com uma estrutura semelhante utiilzada pela Lngua Brasileira de Sinais, sendo que esta traduo, ou passagem de um estado para outro, comumente denominada de glosa. Estudo da Gramtica e Sintaxe da LIBRAS Foi desenvolvido um estudo da cultura e identidades surdas atravs de uma pesquisa realizada com alunos da Escola de Ensino Mdio Concrdia para Surdos de Santa Rosa-RS, onde analisaram-se textos redigidos por estes. 2
Verificou-se a estruturao das frases em seus textos, o que possibilitou a anlise do grau de dificuldade em termos de estruturao gramatical e as diversas diferenas entre a lngua portuguesa e a LIBRAS, em relao lingstica e estrutura sinttica das mesmas. Foram localizados pontos crticos que impedem a total compreenso de uma informao escrita na estrutura da Lngua Portuguesa pelos surdos como, por exemplo, uso dos tempos verbais. Na figura 1, so apresentados quatro grficos que exemplificam o estudo realizado, demonstrando os resultados para as classes adjetivo e verbos. Foram analisados textos de trinta e dois alunos no total, sendo quinze do primeiro grau e dezessete do segundo grau.

A principal dificuldade nesta fase foi determinar a ordem gramatical utilizada pela maioria do grupo pesquisado, pois a LIBRAS utiliza outros padres como, por exemplo, o uso do espao e movimentos das mos no lugar de modulaes do trato vocal. Este

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

263

fato referenciado em Brito [2], onde o autor afirma que os surdos preferem, muitas vezes, utilizar a topicalizao para estruturar suas frases, ao contrrio do grupo de ouvintes, onde a maioria das frases construda seguindo a ordem SujeitoVerbo Objeto. Ou seja, a ordem das frases da grande maioria dos surdos parte do genrico para o especfico, seguindo a ordem que utilizam ao se comunicarem por sinais. Desta forma, seguindo os testes aplicados, pode-se modelar a ferramenta proposta atravs de dois processos. O primeiro ser definido sobre as classes gramaticais encontradas no texto. Algumas podero sofrer mudanas e outras, muitas vezes, no sero encontradas na fase final. O segundo processo ser responsvel pela passagem do texto eletrnico para a estrutura utilizada pela grande parte da comunidade surda, ou seja, seguir uma nova ordem sinttica estabelecida atravs dos testes. Esta nova ordem sinttica ainda encontra-se em fase de estruturao.
Uso da Classe Gram atical Adjetivo pelos Alunos do 1 Grau Uso da Classe Gram atical Adjetivo por Alunos do 2 Grau

24% 27%

73%

76%

Usam

No Usam

Usam

No Usam

Uso de Verbos no Infinitivo por Alunos do 1 Grau

Uso de Verbos no Infinitivo por Alunos do 2 Grau

27% 41% 59% 73%

Usam

No Usam

Usam

No Usam

Figura 1- Percentual de utilizao das classes gramaticais Adjetivo e Verbo

Definio de um Autmato Finito Determinstico Seguindo um estudo comparativo da estruturao gramatical e sinttica conhecida da Lngua Portuguesa, baseado-se em Cegalla [3], e da estruturao apresentada pelos surdos ao desenvolverem os textos escritos, procurou-se encontrar a forma mais comumente utilizada por estes. Percebeu-se que, para este fim, poderia ser utilizado o estudo das Linguagens Regulares para uma definio e representao em um formalismo.
Conforme Vicencio [4], uma linguagem pode ser considerada como um conjunto cujos elementos so precisamente definidos atravs de regras e, para descrev-la, h a necessidade de um sistema formal que defina os elementos deste conjunto. Deve-se definir os elementos do conjunto e, para cada um deles, associar uma estrutura, sendo que tais sistemas formais so denominados gramticas. Assim, pode-se ter associada gramtica uma ou mais estruturas, onde cada uma possui um significado prprio, como no caso de Lucchesi [5]. Caso existam vrias estruturas relacionadas a uma mesma sentena, ocorre o que se

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

264

denomina de ambigidade, e funo da gramtica fazer previses corretas sobre este tipo de ambigidade estrutural.

Pesquisas desenvolvidas utilizando-se autmatos j foram desenvolvidas. Dentre estas, pode-se destacar a de Lucchesi [5], a qual procurava modelar ferramentas que fossem capazes de fornecer, atravs da construo parcial de um autmato finito determinstico, uma representao de um vocabulrio a partir de uma linguagem natural. Para o desenvolvimento desta proposta, houve a necessidade de se encontrar um reconhecedor para a linguagem. Como o sistema a ser desenvolvido toma por entrada uma cadeia x e responde sim, se x for uma sentena da linguagem e no, em caso contrrio, construiu-se um diagrama de transies generalizado chamado de Autmato Finito Determinstico (AFD), conforme Menezes [6].
Um AFD possui, no mximo, uma transio a partir de cada estado para qualquer smbolo de entrada. Logo, para cada entrada na tabela de transies existe um nico estado final. Conseqentemente, mais fcil determinar se um Autmato Finito Determinstico aceita uma cadeia de entrada, dado que existe no mximo um nico percurso, rotulado por aquela cadeia, a partir do estado inicial.

Para que o texto eletrnico em portugus seja traduzido para a estrutura desejada, a qual chamada de glosa, necessitou-se de uma transio, ou seja, de uma passagem que seguisse certos parmetros para que o estado final fosse definido. O novo estado do texto eletrnico desejado ser aquele capaz de passar a mesma idia que havia no texto em portugus, mas seguindo a estrutura definida para o estado final como sendo a mais utilizada pelos surdos. 3.1 Definio de um Autmato Finito Determinstico para as Classes Gramaticais

Houve a necessidade de um estudo atravs da verificao e comparao das classes gramaticais da Lngua Portuguesa e as usadas e compreendidas pelos surdos ao se comunicarem ou ao redigirem algum texto, afim de que fosse fornecido ao autmato o estado inicial de cada um de seus smbolos de entrada e, conforme a LIBRAS, permitisse a transio b que determinasse o estado final das classes gramaticais e das frases. Para as classes, em geral, tem-se a seguinte transio, representada na figura 2(a).

F: ( CP ) , onde Cs..

Figura 2- (a) Autmato Classe Gramatical (b) Funo Transio

Desta forma, a formalizao da modelagem proposta pode seguir a seguinte estrutura: Cp : conjunto das classes gramaticais da Lngua Portuguesa; Cs : conjunto das classes gramaticais compreensveis e utilizadas pelos surdos; : funo parcial; T: texto eletrnico inicial em portugus; A funo transio (), para Menezes [6], uma funo parcial, pois uma relao onde cada elemento do domnio est relacionado com, no mximo, um elemento do contradomnio, ou seja, para cada estado inicial de cada classe gramatical existir somente um estado final que ser aquele que usado e compreendido pelos surdos. Assim, para cada palavra de entrada, o processamento do autmato efetua uma aplicao sucessiva da funo programa sobre cada smbolo desta, at uma condio de parada aparecer. Existir, portanto, uma linguagem aceita pelo autmato, a qual ser o conjunto de todas as palavras pertencentes ao alfabeto, inclusive as vazias, que forem

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

265

aceitas pela gramtica. No caso, a linguagem formada pelas classes gramaticais usadas, assim como suas variaes, conforme a utilizao dos surdos. Alm disso, tambm existiro casos em que palavras no sero aceitas por esta gramtica, sendo formado pelas classes gramaticais e suas varincias no utilizadas e, assim, sero rejeitadas, formando um conjunto de palavras rejeitadas. A funo de transio tem a forma genrica apresentada na figura 2(b). Como uma ou mais funes podero gerar resultados em estes, obrigatoriamente, devero pertencer ao conjunto Cs., isto , os resultados gerados a partir desta funo devero pertencer ao conjunto formado pelas classes gramaticais usadas e compreendidas pelos usurios da LIBRAS, o que acarretar na modificao de algumas classes gramaticais, afim de que o texto final seja aquele definido como compreensvel pelos surdos. Por isso, para cada classe CP, poder haver uma ou mais subfunes. 3.1.1 Artigos Verificou-se o uso e compreenso desta classe gramatical pelos surdos, desde que antecedendo o substantivo. Logo, nos textos em que houver a ocorrncia de artigo antes de outras classes gramaticais que no o substantivo, estes sero ignorados. A definio do autmato pode ser observada na figura 3(a) e 3(b). Adjetivo
Por exercerem importante papel na transmisso do sentido das frases, esta classe continuar a ser utilizada no texto final aps o processamento do autmato, pois funciona da mesma forma que na Lngua Portuguesa. A definio do autmato pode ser observada na figura 3(c).

3.1.2

3.1.3

Numeral Classe gramatical necessria pois, expressa ordem numrica, seguindo tambm a estrutura da Lngua Portuguesa. A definio do autmato pode ser observada na figura 3(d). 3.1.4

Pronome Ao analisar os textos escritos pelo grupo pesquisado, muitos destes, mostraram que pronomes do tipo pessoal oblquo, como lhe(s), vos, te , e ti e os pronomes oblquos reflexivos como me e mim, no so usados to freqentemente. Assim, definiu-se um subconjunto de pronomes que permaneceram na traduo. Estes, foram denominados de PronomesGlosa e so: eu, ns, ele (a), voc(s), comigo, e contigo; os demonstrativos como esse (a), isso, este (a), isto, aquilo, aquele (a) e aquilo; os possessivos mais usados como meu, minha, teu, tua, seu e sua; os interrogativos, como quem, qual, quais e os quais, quando usados no incio das frases e na terceira pessoa do discurso como na Lngua Portuguesa. A definio do autmato pode ser observada na figura 5(a) 3.1.5 Advrbios Percebeu-se o uso somente de advrbios mais simples, tais como: sim, talvez, certo, errado, muito, bastante, meio, todo, nada, demais, que, quando, quanto, bem, mal, quase, como, aqui, ali, a, alm, dentro, atrs, perto, longe, atravs, no, agora, hoje, depois, ontem, cedo e tarde. Assim, para que o sentido das frases e textos no final da transio possuam valor, o autmato seguiu a modelagem apresentada na figura 5(b).

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

266

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

267

Figura 3- (a) Autmato Ocorrncia Artigo (b) Autmato Artigo (c) Autmato Adjetivo (d) Autmato Numeral

3.1.6

Preposio

Nesta classe, percebeu-se que ocorre o uso incorreto da preposio ou a omisso desta pelos surdos. Alm disto, muitas vezes h a colocao de preposio desnecessria em seus textos. No entanto, h a necessidade do texto final possuir algumas das preposies mais usadas pelos surdos ao se comunicarem pela lngua de sinais, como de e para e ainda as flexes da(s), do(s). Logo, estas iro constituir o grupo denominado PreposiesGlosa, conforme visto na figura 5(c).

Conjuno Nesta classe gramatical, percebeu-se que as mais utilizadas so mas, e, pois, tambm, ou, antes, que, porque, como e se, que formam o grupo de ConjunesGlosa. A definio do autmato pode ser observada na figura 5(d). 3.1.8 Interjeio
Conforme o estudo realizado nos textos redigidos pelo grupo de surdos pesquisados, esta classe gramatical no utilizada to freqentemente, ou seja, mnimo. Portanto, ocorrer a eliminao da mesma, conforme o autmato visualizado na figura 4(a).

3.1.7

3.1.9

Verbos Verbos so um assunto delicado e, para melhor defini-los, esto sendo realizados mais alguns testes com os alunos da Escola de Ensino Mdio Concrdia para Surdos de Santa Rosa, afim de que se possa encontrar a forma mais correta e que no prejudique a compreenso do texto nem se diferencie de sua cultura, a qual deve ser respeitada. Desta forma, foi modelado um autmato bsico para os verbos, onde todos os tempos verbais dos textos sero passados para o infinitivo, conforme visto na figura 4(b), onde a funo definida por:
(verbo) funo que transforma verbos dos textos em portugus para forma verbal no infinitivo.

Figura 4 - (a) Autmato Interjeio (b) Autmato VerbosGlosa

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

268

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

269

Figura 5 - (a) Autmato PronomesGlosa (b) Autmato AdvrbiosGlosa (c) Autmato PreposiesGlosa (d) Autmato ConjunesGlosa

3.2

Definio de um Autmato Finito Determinstico para o Texto Em relao ordenao das frases para os surdos, ainda esto sendo realizados testes que sero avaliados a fim de se encontrar a forma mais prxima da utilizada por eles. Afim de que o propsito desta modelagem seja concretizado, necessrio que a estrutura final dos textos seja compreensvel e que no proporcione dvidas, como acontece na maioria dos casos quando os surdos necessitam ler algum texto em portugus. Deve-se procurar uma forma em que as frases se estruturem sem ocorrer o risco de perder o verdadeiro sentido do texto, alm de respeitar a lnguame destes. Assim, pode-se demonstrar a modelagem inicial para o autmato texto, que atravs dos testes que esto em andamento, nos proporcionaro organiz-lo conforme a sintaxe mais utilizada e compreendida pelos surdos ao se comunicarem. 4

Concluses Este trabalho procurou encontrar, atravs do estudo das Linguagens Formais, uma forma de solucionar o problema da no total compreenso de textos pelos surdos. Tal fato ocorre devido ao a lngua de sinais ser uma lngua baseada no uso de espao e movimentos das mos, no lugar de modulaes do trato vocal. Desta forma, o sistema gramatical mais complexo, fazendo uso de padres e contrastes espaciais.
Em relao sintaxe, conforme Pereira [7], na lngua de sinais americana o uso do espao parece ter papel importante, pois dentro do espao sinalizado (a rea em que os sinais so feitos) os sinais podem ser movidos de uma localizao para outra, indicando diferenas no sujeito e no objeto. Isto significa que pode-se estabelecer localizaes no espao para dois personagens. Por exemplo, mover a mo relacionada a um destes personagens para o outro, indicando algo, ou seja, uma relao de receptor e transmissor da mensagem. No entanto, este fato pode ficar subtendido em textos escritos em portugus. Como a LIBRAS tambm um lngua como a Lngua Portuguesa, a estruturao de frases, quando realizada manualmente, utiliza outros padres. O mais significativo o uso da topicalizao, no qual os surdos partem de uma idia genrica para a especfica, fazendo com que os textos em portugus lidos por estes no sejam suficientemente claros, gerando incompreenso das informaes.

A grande dificuldade encontrada foi a de determinar a ordem gramatical utilizada pela maioria dos surdos. Em relao sintaxe, como citado em Pereira [7], esta tem tido ateno de estudiosos. No entanto, isto ocorre somente em relao lngua americana de sinais. Em relao lnguas de sinais usadas no Brasil, vrios trabalhos esto sendo realizados nesta rea da lingstica. Devido a pouca compreenso de textos pelos surdos, ocasionada pela estrutura sinttica das frases em portugus, foi procurado encontrar, atravs da modelagem de autmatos, os estados finais de cada classe gramatical encontrada nos textos eletrnicos para que fosse modelado o estado final do mesmo, tornando-o compreensvel pela comunidade surda. Tal fato, no entanto, necessita ser complementado futuramente, devido falta de um embasamento mais concreto em relao estrutura sinttica da glosa. Assim, pesquisas mais aprofundadas e testes esto sendo realizados, alm dos j realizados anteriormente. Pretende-se, baseando-se nestes estudos, definir a estrutura frasal, de modo que posse ser realizada uma modelagem sinttica dos textos e, conseqentemente, sua implementao. Devido as mudanas que esto sendo provocadas na sociedade com o avano tecnolgico, principalmente a popularizao da internet e, conseqentemente, a grande difuso de textos em formato eletrnico, o computador torna-se ferramenta essencial na popularizao deste conhecimento. Desta forma, a definio desta ferramenta pode proporcionar comunidade surda um recebimento maior das informaes, fator bsico

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

270

necessrio para um crescente desenvolvimento social. importante salientar que a lngua de sinais brasileira muito rica, com uma grande variedade de recursos. Portanto, abre-se a possibilidade de desenvolver futuras investigaes, a fim de gerar e aperfeioar novas ferramentas, proporcionando a esta comunidade o acompanhamento deste avano. 5 Bibliografia
[1] QUADROS, Ronice Mller . 1997. Educao de Surdos- A aquisio da Linguagem. 1 Edio. Porto Alegre: Artes Mdicas. [2] BRITO, Lucinda Ferreira. 1995. Por uma Gramtica de Sinais. Rio de Janeiro: Tempo Brasileiro. [3] CEGALLA, Domingos Paschoal . 1996. Novssima Gramtica da Lngua Portuguesa. 39 Edio. So Paulo: Editora Nacional.

[4] VICENCIO, Aline Villa. 1994. Uma Abordagem Anlise Sinttica para Linguagem Natural. Porto Alegre. Trabalho Individual de Ps-Graduao em Cincia da Computao da Universidade Federal do Rio Grande do Sul.

[5] LUCCHESI, Cludio L.; KOWALTOWSKI, Tomasz. Applications of Finite Automata Representing Large Vocabularies. 1992, Relatrio Tcnico DCC-01/92. Departamento de Cincia da Computao, Universidade Estadual de Campinas SP. [6] MENEZES, Paulo Fernando Blauth. 2000. Linguagens Formais e Autmatos. 3 Edio. Porto Alegre: Editora Sagra - Luzzatto. [7] PEREIRA, Maria Cristina da Cunha. Aspectos Sintticos da Lngua Brasileira de Sinais.1990.

XII Simpsio em Brasileiro de Informtica na Educao - SBIE - UFES -2001 Workshop Informtica na Educao (sbie) 2001

271

Vous aimerez peut-être aussi