Vous êtes sur la page 1sur 130

Pede-se permuta

On demande lechange

We ask for exchange

Se pide intercambio

Contato:
Instituto internacional da Lngua Portuguesa (IILP)
Av Andrade Corvo, n 8
Plateau, Cidade da Praia - Cabo Verde
Telefone: (238) 261 95 04
www.iilp.org.cv
www.riilp.org
e-mail: revistariilp@gmail.com

Colquio Internacional de Guaramiranga:


A Lngua Portuguesa na Internet e no Mundo Digital

Volume 2

Nmero 3

2013

Gilvan Mller de Oliveira


(organizador)

Editores
Gilvan Mller de Oliveira
Rosngela Morello
Secretaria Executiva
Denise Fonseca
Comit editorial
Ana Isabel Soares (Instituto Cames, Portugal)
Antnio Branco (Universidade de Lisboa, Potugal)
Clmence Jout-Pastr (Universidade de Havard, Estados Unidos da Amrica)
Emir Jos Suaiden (Instituto Brasileiro de Informao em Cincia e Tecnologia/IBICT, Brasil)
Gregrio Firmino (Universidade Eduardo Mondlane, Moambique)
Guadelupe Teresinha Bertussi (Universidade Pedaggica do Mxico, Mxico)
Manuel Monteiro da Veiga (Universidade de Cabo Verde, Cabo Verde)
Maria Jos Grosso (Universidade de Macau, Macau)
Equipe Tcnica
Alberto Gonalves: revisor tcnico
Ana Paula Seiffert: divulgao
Felipe de Almeida: design grfico
Vanessa de Luca Bortolato: design grfico
Ficha catalogrfica (em tramitao)
Revista do Instituto Internacional da Lngua Portuguesa (RIILP) - Instituto
Internacional da Lngua Portuguesa (IILP) - V.2, N.3 (2013), Cidade da Praia,
Cabo Verde: Editora do IILP, 2012
Semestral
ISSN: 2311-6625 on line
Arte da capa: Felipe Almeida e Vanessa de Luca
1. Lngua Portuguesa - Peridicos. 1. Instituto Internacional da Lngua Portuguesa
Todos os direitos autorais esto reservados a RIILP/IILP

NDICE

04

APRESENTAO: A LNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL


Gilvan Mller de Oliveira

06

O ESPAO DAS LNGUAS NA INTERNET: PANORAMA E TENDNCIAS COM NFASE


NO PORTUGUS
Daniel Pimienta

28

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

38

O USO DE CORPORA PARA A CONSTITUIO DE RECURSOS LEXICOGRFICOS


DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia

56

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

68

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

80

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Sousa / Concha Rousia

96

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO PORTUGUS NUMA


B@BEL DIGITAL?
Cludio Menezes

106

PLAT

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO

V. 2. N.3

2013

Rui Vaz

114

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA


DIGITAL
Afonso Joo Miguel

124

CARTA DE GUARAMIRANGA

PLAT

V. 2. N.3

2013

APRESENTAO
A LNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL

Gilvan Mller de Oliveira


Que desafios e perspectivas marcam a gesto da lngua portuguesa na nova economia
ou na assim chamada economia do conhecimento? Qual a situao das lnguas face internet
e quais aes e inovaes tm sido implementadas?
Constituindo um dos quatro eixos de discusso propostos ao Instituto Internacional da
Lngua Portuguesa pelo Plano de Ao de Braslia para a Promoo, Difuso e Projeo da
Lngua Portuguesa (PAB2010), estas e outras questes foram abordadas no III Colquio A
Lngua Portuguesa na Internet e no Mundo Digital realizado em Guaramiranga, Cear, Brasil,
entre os dias 24 e 26 de abril de 2012.
Especialistas e gestores de vrias partes do mundo trouxeram ao debate as mltiplas
faces da gesto das lnguas nesse novo paradigma comunicacional das redes digitais. Este
nmero rene alguns dos tpicos debatidos no evento.
Nos dois primeiros textos, ganha centralidade a anlise da entrada das lnguas na rede
digital. Pimienta traz um breve histrico sobre a emergncia da internet, discute a situao da
lngua portuguesa nesse ambiente e aponta a necessidade de ampliar no s o acesso dos
falantes s tecnologias como, e principalmente, de gerar e disponibilizar contedos nas
diferentes lnguas. Na sequncia, Branco descreve o choque tecnolgico, dando destaque s
aes necessrias para assegurar ao portugus sua posio de lngua de comunicao
internacional com projeo global.
No segundo bloco temos a apresentao de dois importantes projetos para a gesto da
lingua portuguesa. O primeiro deles o Vocabulrio Ortogrfico Comum da Lngua Portuguesa
VOC, concebido e realizado multilateralmente sob a coordenao geral do IILP. Os autores
Ferreira, Almeida e Correia analisam os diferentes tipos de dados usados na construo de
obras lexicogrficas e descrevem a metodologia adotada no desenvolvimento do VOC,
procurando mostrar o papel instrumental dos corpora para a definio de primeiras
nomenclaturas de variedades em processo de estandardizao, para a validao de dados
obtidos da tradio e para a aferio da frequncia e especificidade do mbito de uso de cada
entrada. Ribeiro, por sua vez, tematiza as iniciativas da Adobe Systems, analisando a
constituio das comunidades de tradutores na internet, em especial no mbito da lusofonia. A
autora descreve os processos de criao, implementao e avaliao de alguns projetos da
Adobe Systems destinados a potencializar o rpido acesso informao e menciona os desafios
e planos futuros.

04

PLAT

V. 2. N.3

2013

APRESENTAO: A LNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL


Gilvan Mller de Oliveira

um panorama sobre a implantao e usos da internet em Moambique que nos


apresenta o texto Machungo e Firmino. De acordo com os autores, assiste-se no pas a uma
significativa implantao e uso de tecnologias de informao e comunicao e ao recurso
internet. No entanto, consideram que h constrangimentos que impedem um mais amplo
acesso dos cidados rede digital relacionados situao socioeconmica e lingustica do pas
caracterizada entre outros aspectos, pela diversidade lingustica e um elevado ndice de
analfabetismo.
Um terceiro conjunto de textos tematiza o desenvolvimento de iniciativas no mbito de
instituies de ensino ou promoo da lngua portuguesa. Rousia e Vazquez Souza trazem uma
sntese dos projetos digitais da Academia Galega da Lngua Portuguesa colocando em destaque
trs deles: i) o Portulano de Recursos: escritrio virtual e agrupador de recursos digitais sobre
a lngua portuguesa desenhado com o software livre Netvibes; ii) o Arquivo Digital: repositrio
de objetos digitais orientado preservao e divulgao que funciona sobre um motor DSpace
e gerencia metadados no standard Dublin Core; e iii) o projeto do Dicionrio Eletrnico
e-Estraviz em parceria com a AGAL (Associaom Galega da Lngua). Menezes faz uma breve
descrio da situao estatstica das lnguas no mundo, discute metodologias e tecnologias
para a incluso e revitalizao das lnguas no mundo digital e conclui com uma apresentao
de projetos e sugestes destinados a uma maior presena da lngua portuguesa no
ciberespao. Rui Vaz coloca o foco sobre o Centro Virtual Cames e suas principais linhas de
atuao o ensino e aprendizagem do portugus e formao dos agentes da educao, bem
como para a divulgao da lngua e cultura portuguesa.
Por fim, Afonso Miguel lana um olhar abrangente sobre a histria da lngua portuguesa,
mencionando sua potencialidade face internet e os condicionamentos socioeconmicos,
cientficos e tecnolgicos existentes em cada pas. Entre os desafios enfrentados, o autor cita
o reconhecimento das especificidades sociolingusticas de cada pas membro da CPLP, que
requer, por exemplo, a insero de terminologias cientficas e tcnicas locais no portugus
comum a usar na internet e noutros meios digitais.
Para fechar o nmero, A Carta de Guaramiranga sintetiza as principais demandas
formuladas pelos participantes do III Colquio, e nos impulsiona na busca por concretizar aes
que garantam cada vez mais o pleno exerccio do direito ao conhecimento sedimentado no
democrtico uso e consistente circulao das lnguas na internet e no mundo digital, e muito
especialmente do portugus.

PLAT

V. 2. N.3

2013

05

O ESPAO DAS LNGUAS NA


INTERNET: PANORAMA E TENDNCIAS
COM NFASE NO PORTUGUS1
Daniel Pimienta
Sobre o autor
Presidente do FUNREDES2, Membro do comit executivo da MAAYA3.
Contato: pimienta@funredes.org

Resumo
Iniciando por uma breve introduo questo das lnguas na internet, apresentamos
uma anlise dos ndices que mapeiam a sua presena trazendo dados especficos sobre o
portugus. Desde uma perspectiva histrica, buscamos delinear tendncias para o futuro das
lnguas mostrando a necessidade de ampliar no s o acesso dos falantes s tecnologias como,
e principalmente, de gerar e disponibilizar contedos nas diferentes lnguas.

Palavras-chave
Lnguas na Internet. Portugus. Mapeamentos. Multilinguismo.
Este artigo em portugus inspirado em uma subseo de verso anterior publicada em ingls do captulo
Content and Language do livro Accelerating Development Using the Web: Empowering Poor and Marginalized
Populations, G. Sadowsky Editor, W3C, 2012. A respectiva apresentao pode ser consultada na pgina:
http://funredes.org/presentation/IILP-Fortaleza%20Portugues.ppt Traduzido para o portugus por Isis Ribeiro
Berger.
2
Networks & Fundao para o Desenvolvimento (FUNREDES, sigla para o nome em espanhol
http://funredes.org) uma organizao no governamental com sedes na Republica Dominicana, Frana,
Venezuela, Espanha e Guiana Francesa que tem sido pioneira (desde 1988) no campo do uso de Tecnologias da
Informao e Comunicao para o Desenvolvimento (ICT4D) e tem trabalhado, desde sua fundao, na importncia
transversal da diversidade lingustica por meio de diversos projetos que lidam com a excluso digital, com o impacto
social da Internet e tambm com o letramento digital.
3
MAAYA (Rede Mundial pela Diversidade Lingustica), uma organizao de sociedade civil, uma rede de agentes
interessados na diversidade lingustica. Embora sua misso no enfoque somente no ciberespao, uma grande parte
das atividades da MAAYA relacionada ao mundo digital. MAAYA um sub-produto do processo WSIS e foi lanada
em 2002 pela Academia Africana de Lnguas (http://wwww.acalan.org). A MAAYA organizou trs Simpsios
Internacionais
sobre
Multilinguismo
e
Ciberespao,
um
em
2009
em
Barcelona
(http://www.maaya.org/spip.php?article105) e outro em 2011 em Braslia (http://www.let.unb.br/simc/) e o
terceiro em Paris, em 2012. A MAAYA, que est prestes a publicar um antologia sobre os riscos e desafios do
multilinguismo no ciberespao, tem assumido a iniciativa do projeto DILINET para resolver os problemas dos
indicadores da diversidade lingustica no ciberespao. A MAAYA rene alguns 25 agentes da rea entre seus
membros, incluindo organizaes internacionais como a UNESCO, ITU e OIF (http://www.francophonie.org). MAAYA
vem dedicando grande parte de sua energia na organizao da Reunio Mundial de Cpula sobre a Diversidade
Lingustica prevista para 2015.
1

06

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

1 - Introduo s lnguas na internet


O quo importante foi, e ser o fator lingustico na evoluo da Internet? Quais
repercusses poderia ter a internet na vida das lnguas? Como os contedos da internet e as
lnguas se inter-relacionam? Qual a situao especfica do portugus? Estas so questes
difceis de serem respondidas, em parte devido escassez de dados mais slidos.
Os pioneiros da Internet (uma grande porcentagem de fato, se abarcarmos nessa ampla
definio todos que contribuem e experts desde a dcada de 1980 at o incio da dcada de
1990) criaram uma grande gama de neologismos e expresses originais que tentavam capturar
as dimenses e originalidade da mudana de paradigma que estava ocorrendo concomitante ao
desenvolvimento de redes de infraestrutura.
Para citar apenas trs exemplos:
1) A capacidade obtida para adequar o nvel local ao nvel global fez surgir o termo
glocal com a conotao de algo que compartilha ambas as caractersticas.
2) Anonimidade no ciberespao alguns leitores devem se lembrar da famosa tirinha do
nova-iorquino Peter Steiner em 1993 dizendo Na internet, ningum sabe que voc um
co4.
3) Sempre foi lugar comum afirmar que a internet no tem fronteiras.
Algum deve se perguntar se esses recentes conceitos, que foram criados em contextos
do ingls falado, so ainda pertinentes em um contexto multilngue. No que se refere ao
glocal, o termo definitivamente no to relevante: para a grande maioria de falantes de
lnguas indgenas que no possuem o ingls como segunda lngua no fcil relacionar seu
ambiente local e a cultura holstica ao espao global do ingls falado com sua cultura mais
regimentada e analtica. J no que tange anonimidade do co que est usando a internet,
aqueles dias no mais existem, especialmente se tratamos de um co socialmente conectado.
Nesse caso, muitas pessoas no esto cientes de que se trata de um co, nem mesmo de que
raa ou do que teve para o caf da manh, a no ser que, obviamente, no se trate de um co
falante de ingls. J no que se refere fronteira, esse o caso mais interessante dos trs.
luz da situao atual, o conceito de fronteira deve merecer ser desconstrudo e reconstrudo
como uma nova expresso: por internet, as nicas fronteiras so as lnguas5 e h centenas
delas6, mais do que pases existentes no mapa mndi. Somente pessoas multilngues podem
ousar cruzar algumas dessas fronteiras e as ferramentas vem sendo desenvolvidas para lidar
com o desafio lingustico. O uso de tradutores automticos est comeando a oferecer uma
certa iluso equivocada para aqueles que buscam cruzar territrios estrangeiros.
A territorialidade lingustica da internet e como ela est relacionada aos contedos tem
sido constantemente subestimada nas anlises, porque as pessoas naturalmente tendem a
pensar a partir de suas prprias fronteiras lingusticas. Assim, importante descobrir e ento
analisar a dimenso oculta da capacidade da internet de incluir a fim de lidar com os desafios
futuros do mais recente estgio de evoluo e especialmente com a to mencionada excluso
http://en.wikipedia.org/wiki/On_the_Internet,_nobody_knows_you%27re_a_dog
Ver, por exemplo, http://googleresearch.blogspot.com/2011/07/languages-of-world-wide-web.html para ter
ideia de quanto os territrios lingusticos tendem a ser rgidos.
6
Os ndices para os nmeros de lnguas situadas (lnguas que possuem uma existncia digital) considerado
abaixo de 500 a contar de hoje.
4

PLAT

V. 2. N.3

2013

07

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

digital
As lnguas so importantes, talvez mais do que nunca, em fazer com que o mundo se
torne menor. A internet aumenta a probabilidade de encontros entre pessoas de diferentes
lnguas e a pergunta real : que uso relevante algum pode fazer de seu acesso internet se
sua lngua materna no reconhecida ou se no h contedo em sua lngua? Tais
problemticas no eram bvias nos estgios iniciais do desenvolvimento da rede, quando a
maioria dos usurios eram profissionais de Tecnologia da Informao, pesquisadores e
acadmicos ou, algumas vezes, ativistas internacionais de tecnologia. Tratava-se de pessoas
altamente educadas, pelas quais o ingls era provavelmente compreendido no mnimo como
segunda ou terceira lngua por uma porcentagem significativa. No entanto, a rede se difundiu
amplamente e as questes de ordem lingustica se tornaram primordiais uma vez que seu
objetivo prover acesso a qualquer um no planeta. Dentre os sete milhes de seres humanos,
menos de 20%7 so capazes de usar o ingls e provavelmente menos de 15% de forma
eficiente. Somente essa estatstica um poderoso indicativo de que a crena de que o ingls
ser mantido como lngua franca da rede tem seus dias contados.
No sculo 21, a vantagem estratgica no mundo virtual aponta para o multilinguismo.
Governos tm gradualmente se tornado conscientes dessa realidade e tentado encorajar uma
mudana que abarque outras lnguas. O Conselho Britnico, por exemplo, alertou jovens
cidados ingleses sobre o risco que esto correndo na nova economia da Unio Europeia se
permanecerem monolngues [Graddol-2006]. Dessa forma, a questo da escolha lingustica e
diversidade na internet uma das chaves para abrir portas para a incluso digital de forma
mais direta e abrangente, especialmente levando em considerao a ligao complexa e
indissolvel entre as lnguas, o substrato de conhecimento e o contedo, uma das duas facetas
chaves para que a malha da rede8 seja melhor compreendida.

2 - Alguns ndices sobre as lnguas na internet


Que dados podem ser coletados neste estgio considerando a variedade e a presena
proporcional das lnguas na internet?
Antes de responder essa pergunta, ser til retomar alguns fatos sobre as lnguas e
situar o estgio em que nos encontramos atualmente. H uma estimativa de 30.000 lnguas
existentes no mundo desde que os serem humanos tornaram-se capazes de produzir discurso.
A partir de ento, muitas lnguas tornaram-se extintas e, em tempos modernos, h uma
estimativa de que algo em torno de 6000 a 9000 permanecem em uso. Levando em
considerao os requisitos para que todas as lnguas tenham uma existncia na rede9,
7
Comumente, em demolingustica, no h ndices consensuais para a populao total do mundo com capacidade
de compreender ingls como segunda lngua. A populao usuria de ingls como primeira lngua estimada em
menos de 375 milhes (menos de 6% da populao mundial). O ndice para o ingls como segunda lngua possui
grandes variaes, dependendo em particular da definio do nvel de letramento: de 470 milhes para um bilho
(que perfaz um total de falantes de ingls no mundo na casa dos 10%-20%). Graddol (2006) apresenta um ndice
de 508 milhes de falantes de ingls como segunda lngua (citando uma referncia de Nicholas Ostler, 2005,
publicada em Empires of the Word: a language history of the world. London, Harper Collins) - mas ele previa que
esse nmero poderia ser maior que 1 bilho. No livro O futuro do ingls (The future of English, British Council,
2000) Graddol apresenta estimativa (em milhes) para as trs seguintes categorias: ingls como primeira lngua
(375), ingls como segunda lngua (375) e ingls como lngua estrangeira (750). A questo permanece no nvel em
que se qualificam as pessoas da ltima categora: nvel de falantes eficientes.
8
A outra sendo a comunicao que tambm mantida por meio das lnguas.
9
Ter uma existncia digital comea pela localizao da lngua. Esse conceito se refere a codificao de seu alfabeto
e isso acarreta em uma srie de outros requisitos desde a existncia de softwares relacionados a essa lngua (a
exemplo dos corretores gramaticais e dicionrios) existencia de contedos significativos. Vide Diki Kidiri [2008].

08

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

consideremos os fatos a seguir em torno das lnguas (Lewis, 2009; Crystal, 2006):

- 6 lnguas (ingls, rabe, espanhol, portugus e russo) so as lnguas oficiais em 60%


dos pases.
- 1.3% das lnguas (85) so faladas por mais de 10 milhes de pessoas cada e juntas
representam 78% da populao mundial.
- 50% de todas as lnguas so faladas por menos de 10.000 pessoas.
- 25%
- Uma lngua desaparece em mdia a cada dois meses.
- Menos de 10% das lnguas possuem sua forma escrita 10.
A questo da presena das lnguas na internet pode ser verificada pelo cruzamento de
dados do Ethnologue sobre as lnguas11 com os dados do ITU referentes aos acessos
internet12 . Parece que h uma correlao estatstica entre pases com grande diversidade
lingustica e pases com baixa penetrao na internet13.
Ento, o que sabemos exatamente sobre a presena das lnguas na internet? A situao
atual de certa forma paradoxal e frustrante! Por muitos anos a temtica alcanou somente
um interesse marginal e poucos pioneiros produziram indicativos experimentais
(Pimienta2009-2). Agora o tema da diversidade lingustica vem ganhando mais ateno e,
enquanto alguns dos esforos passados perderam vigor, h grande estmulo para avaliar
profundas mudanas que ocorreram no universo do contedo. Ao buscar dados sobre o nmero
de usurios da internet por lnguas, o Globalstats14 apresentou ndices alguns anos atrs e era
claro quanto metodologia usada para colet-los. Desde 2007, o Internet world stats15 o
substituiu assumindo a liderana, no entanto os dados agora so limitados s dez mais
lnguas. Seguem os dados relativos ao ano de 2011:

http://www15.gencat.cat/pres_casa_llengues/AppJava/frontend/sabiesque_detall.jsp?id=18&idioma=5
http://www.ethnologue.com/web.asp
12
http://www.itu.int/ITU-D/ict/statistics/
13
Outras duas correlaes que tm levantado questionamento so entre a grande biodiversidade e a alta
diversidade linguistica e outra entre quaisquer uma das duas e a questo da pobreza. Em outras palavras, a parte
rica do planeta rica em informao mas linguisticamente pobre.
14
A fonte URL (http://global-reach.biz/globstats/index.php3) desapareceu mas o motor Wayback do archive.org
permite que acessemos as ltimas memrias para armazenar as mais recentes informaes memorizadas de 2008
e que mostra os dados produzidos em 2004:
http://web.archive.org/web/20041019013615/www.global-reach.biz/globstats/index.php3
11
http://www.internetworldstats.com/
10
11

1PLAT

V. 2. N.3

2013

09

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Tabela 1: Nmero de usurios da internet por lngua, 31 de maio de 2011

As 10 lnguas mais usadas na rede ( Nmero de usurios da internet por lngua )


As dez maiores
lnguas na internet

ingls
chins
espanhol
japons
portugus
alemo
rabe
francs
russo
coreano
As 10 maiores
lnguas
Outras lnguas
Total mundial

Usurios da
internet por
lngua

565,004,126
509,965,013
164,968,742
99,182,000
82,586,600
75,422,674
65,365,400
59,779,525
59,700,000
39,440,000
1,615,957,33
3
350,557,483
2,099,926,96
5

Penetrao na
internet por
lngua

Crescimento na
internet
(2000 - 2011)

Usurios da
Internet
% do total

Populao mundial
para tal lngua
Estimativa de 2011)

43.4 %
37.2 %
39.0 %
78.4 %
32.5 %
79.5 %
18.8 %
17.2 %
42.8 %
55.2 %

301.4 %
1,478.7 %
807.4 %
110.7 %
990.1 %
174.1 %
2,501.2 %
398.2 %
1,825.8 %
107.1 %

26.8 %
24.2 %
7.8 %
4.7 %
3.9 %
3.6 %
3.3 %
3.0 %
3.0 %
2.0 %

1,302,275,670
1,372,226,042
423,085,806
126,475,664
253,947,594
94,842,656
347,002,991
347,932,305
139,390,205
71,393,343

36.4 %

421.2 %

82.2 %

4,442,056,069

14.6 %

588.5 %

17.8 %

2,403,553,891

30.3 %

481.7 %

100.0 %

6,930,055,154

Fonte : http://www.internetworldstats.com/stats7.htm
No que tange estrutura do universo de contedos, em termos de lnguas, a regra foi a
existncia de ndices conflitantes entre os anos de 1997 e 2007 (Pimienta-2009-2). Algumas
fontes de dados indicaram uma estvel (e exagerada) presena do ingls (cerca de 80% ao
longo da dcada). Outras fontes de dados, com mais amostras, apontaram para um declnio
constante de 80% para 45% no mesmo perodo. Nos ltimos anos, a situao tem sido
extremamente complexa principalmente devido s mudanas estruturais e quantitativas da
rede. Enquanto motores de busca foram capazes de indexar16 uma parte significante da rede
no perodo de 1996 a 2007 (cerca de 80%), desde 2007 vem apresentando declnio de,
provavelmente, no mnimo 10% e est se tornando pior a cada dia. Enquanto muitas fontes
tentaram quantificar o tamanho da rede at aproximadamente o ano de 2008 (vide PIMIENTA,
2008), desde ento ningum parece ousar prover mais informaes, ainda que seja uma
aproximao para dados qualitativos, embora dados quantitativos existam sob a forma de
usurios da internet, nomes de domnios registrados, hosts e endereos de IP.

Uma pgina indexada uma pgina cujo contedo foi analisado e a informao foi armazenada para posterior
acesso pelos motores de busca.
16

10

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Tabela 2: O tamanho da Internet

INTERNET ELEMENT FIGURE

2008

2011

Usurios da Internet - (Fonte: Internet world stats)

1.4 bilhes

2.1 bilhes

Domnios ativos registrados


(Fonte:
http://news.netcraft.com/archives/web_server_survey.html )
Domnios
registrados
(Fonte:
:
http://news.netcraft.com/archives/web_server_survey.html )
Internet hosts (Fonte : http://www.domaintools.com/internetstatistics/country-ip-counts.html)
Pginas da rede17

70 milhes

160 milhes

Pginas indexadas da rede

2040
bilhes

140 milhes 463 milhes


500 milhes 3500 milhes
140 bilhes18 ?????
Provavelmente
o mesmo que
em 200819

Alm da confirmao do crescimento exponencial da internet, o que pode se


depreendido dessa tabela que o tamanho dos indexos vinha alcanando uma assntota at
2007 e a proporo de pginas indexadas passa por um declnio constante desde ento (de
80% a provavelmente, menos de 10%).
Por que esses dados relativos s ferramentas de busca so to relevantes para a
temtica da diversidade lingustica na Internet? Eles tm impacto direto no estudo da
diversidade lingustica porque alguns dos mtodos para avaliar a presena das lnguas na rede
consistem nos motores de busca, que eram capazes de contar ocorrncias de vocbulos. Eles
tambm tm um impacto indireto porque os outros mtodos de busca consistem em rastrear
a rede20 e aplicar um algoritmo de reconhecimento de lnguas para cada pgina. Se as
poderosas companhias desenvolvendo motores de busca desistem de navegar por todo o
universo da internet, de que forma uma seo de busca de alguma outra organizao ir
investir em alguma tarefa lucrativa? Finalmente, indexar tambm relevante para a temtica
devido a uma dialtica negativa. A ausncia de uma pgina nos ndices dos motores de busca
praticamente a garantia da sua invisibilidade. Alm disso, com a decrescente porcentagem de
indexao, que no aplicada de forma igualitria entre as lnguas, existe uma
tendenciosidade nos dados que possui implicaes crticas para as lnguas que no so
consideradas globalmente relevantes21. Em sntese: a rede se tornou praticamente infinita
Se algo considerado rede invisvel (pginas dinmicas principalmente) espera-se que seja de 100 a 500
vezes maior de acordo com Bergman, M. The Deep Web: Surfacing Hidden Value http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104, e ento o
ndice poder alcanar um trilho
18
Em 2008 um novo motor de busca foi lanado com o nome de CUIL (http://en.wikipedia.org/wiki/Cuil) o qual
supe ter um indexo de tamanho prximo ao do tamanho da rede, oferecendo o ndice de 120 bilhes de pginas.
19
http://www.worldwidewebsize.com/ apresenta ndices entre 20-50 bilhes de pginas indexadas em 2011. O
Google, por sua vez, no tem fornecido ndices pblicos (http://www.google.com/help/indexsize.html).
http://dejanseo.com.au/measuring-size-of-googles-index/ apresenta dados de 25 bilhes.
20
Crawling the web (Rastreamento da rede) se refere ao mecanismo usado, por exemplo, pelos motores de
busca para criar suas bases de dados indexados para sistematicamente ler cada pgina de cada stio visando
analisar seus contedos. O tamanho da rede to grande que alguns truques so usados para evitar a leitura de
cada uma das pginas (por exemplo, limitando a profundidade da insero na rvore de relaes [links] de um
mesmo stio).
21
Perceba que seria benfico ser capaz de medir a inclinao lingustica dos motores de busca e tambm se essa
situao pudesse abrir caminhos para a criao de motores de busca dedicados s lnguas ou famlias de lnguas.
17

PLAT

V. 2. N.3

2013

11

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

e novos mtodos so necessrios para que se possa compreender a sua natureza, a estrutura
de seu contedo e particularmente em termos de lnguas. No entanto, no se trata somente de
tamanho: a natureza da rede por si s mudou consideravelmente medida que o conceito de
pginas da internet evoluiu de esttico (como era no incio) para dinmico22 (o que se tornou a
regra). Abordagens totalmente novas so necessrias para vasculhar em sua complexa
estrutura e para desenvolver indicadores significativos e acurados da diversidade lingustica. A
pesquisa dessas ferramentas e metodologias no somente forneceria um caminho para
caracterizar a vasta substncia da rede e melhor compreender o universo do contedo da
Internet; tambm abriria novos caminhos para novos modelos de motores de busca (Search
2.0) capazes de melhor lidar com a info-diversidade do universo de contedos. Isso tudo
tanto mais importante porque o universo peculiar de contedos est agora ameaado por
muitos fatores, incluindo o spam, cpias e ausncia de uma cobertura adequada de lnguas.
Nesse contexto, caracterizado pela falta de produo de indicadores estveis, confiveis
e sustentveis para a diversidade lingustica, e at que projetos como o DILINE23 produza
indicadores necessrios, a nica opo confiar nos ndices fornecidos pelas trs mais
importantes fontes: Internet World Stats, para ndices de usurios por lngua; o Projeto
Observatrio das Lnguas (Language Observatory Project)24 e FUNREDES/Union Latina25, para
dado relativos pginas da rede por lngua.
No que se refere ao primeiro perodo, de 1997-2007, os estudos de referncia (Pimienta,
2009-2) mostraram alguns fatos que sero descritos adiante. Em termos de prevalncia de
lnguas, o ingls no foi to crucial quanto indicado; a porcentagem de pginas em ingls
decresceu de forma regular, de 80% em 1998 para 40% no ano de 2007. Essa tendncia
acompanhou, com certo grau de paralelismo, a porcentagem de usurios da internet falantes
de ingls (fonte: InternetWorldStats); estimado para estar acima de 60% em 1998 e
decrescendo para 32% em 2008, sendo o ndice atual de 26,8% (dezembro de 2011)26.
Os dados mostraram uma primeira etapa (1998-2003) quando a razo entre contedos
e usurios teve pequena variao em torno das lnguas. Esse quadro ofereceu as bases para
argumentos em favor do fomento de polticas pblicas para o provimento de acesso a usurios
como uma forma natural para a gerao de contedos de forma linguisticamente proporcional.
Em uma segunda etapa (2004-2008), essa razo entre os contedos e usurios sofreu
decrscimo mostrando que a ltima leva de usurios da internet era mais frequentemente de
consumidores de contedos do que de produtores dos mesmos. Isso pode ser explicado pelo
fato de que os primeiros usurios da internet possuam alto grau de letramento digital. Naquele
22
Uma pgina esttica tem a propriedade de aparecer sempre idntica quando acessada por um browser (um
programa como o Internet Explorer ou Mozilla) atravs da indicao da URL (Unified Resource Locator Localizador
de
Fontes
Unificado)
no
campo
para
os
endereos
das
pginas,
(uma
expresso
como
http://www.w3.org/Addressing/URL/url-spec.txt). Uma pgina dinmica tem seu contedo em evoluo ao longo do
tempo e dependendo do contexto (a exemplo dos acessos a base de dados).
23
Sob a liderana da MAAYA, respeitados Centros de Pesquisa esto unindo esforos com a Unesco, ITU, OIF,
Unio Latina e Funredes para abrir o campo para projetos de pesquisa avanada que buscariam sistematizar a
criao de indicadores da diversidade lingustica no mundo digital. O consrcio est atualmente em fase de definio
para conseguir fundos da European Union Reserch funds (7th Programa Modelo) em posio preferencial devido ao
tamanho do investimento solicitado e as inovaes em pesquisa implicadas. Muitos dos parceiros, especialmente
organizaes internacionais e civis, iro manter a presso at que os oramentos sejam feitos, j que polticas
pblicas, assim como a economia digital, ir se beneficiar com o desenvolvimento e manuteno de tais indicadores
com vistas ao progresso. Vide http://dilinet.org.
24
O Projeto Observatrio de Lnguas : http://www.language-observatory.org/
25
Observatrio de Lnguas e Culturas na Internet da Funredes:
http://funredes.org/lc ou Unio Latina http://dtil.unilat.org/LI/2007/index_fr.htm
25
With Chinese very close at 24.2%.

12

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

momento, os mais recentes eram conduzidos virtualmente para a chamada netiquette27 e para
o comportamento digital. Na era atual, h um argumento vlido em prol de polticas de
desenvolvimento do letramento digital de novos usurios da Internet e estmulo para que esses
usurios sejam produtores assim como consumidores do que est disponvel na rede.
Uma mensagem muito importante tem sido estabelecida pelos primeiros estudos (da
Funredes/Unio Latina assim como os da LOP) sobre a excluso digital no hemisfrio sul. Ela
evidenciou que a lacuna de contedo foi bem maior que a lacuna de acesso para lnguas
internacionais e vrias ordens de magnitude para lnguas locais, conforme demostrado nos
seguintes ndices:
- 4% dos acessos globais so derivados da frica (Fonte: Internet world stats 2007 )
- 0.6 % dos sites em francs possuem base na frica (Fonte: Funredes/Unio Latina 2007)
- 0.6% dos sites em ingls possuem base na frica (Fonte: Funredes/Unio Latina 2007)
- A porcentagem de pginas em lnguas locais africanas varia de 0.06% a 0.0006%
dependendo da lngua (Fonte: LOP 2007)
A excluso digital deve ento ser muito mais uma questo de contedos e de lnguas do
que de acessos propriamente ditos. Esse ponto um argumento extremamente importante em
favor de polticas de incluso digital que no se restringem questo do acesso, mas que
tambm enfoquem em contedos locais (e indiretamente na educao para fomentar novos
produtores de contedos, um processo que se inicia pelo estmulo ao letramento digital)29.
No que concerne ao segundo perodo mencionado anteriormente, h diversas
descobertas que apontam para diversas tendncias possveis, apesar da ausncia de
indicadores de produo estveis:
- A evoluo recente da Rede mostra um nmero considervel de usurios chineses da
internet se sobrepondo ao nmero total de usurios americanos em julho de 200830.
- Aps o movimento revolucionrio no norte da frica e Oriente Mdio, o espao da
lngua rabe no Facebook est crescendo rapidamente e, se a tendncia persistir, ir logo
sobrepor-se ao ingls31 nessas regies.
- A Wikipedia o espao da internet com maior diversidade lingustica abrangendo
aproximadamente 271 lnguas diferentes que nela contribuem com artigos32.
- O ndice mximo de 271 para a Wikipedia comparado aos ndices das 70 lnguas que
o Mozilla suporta, das 67 do Facebook, das 63 do Internet Explorer, 51 do Google
Tradutor, 50 do Blogger, 19 do YouTube, 6 do Flickr e 4 do LinkedIn33.
Netiquette um neologismo que se refere comportamentos aceitveis na rede. Mais detalhes podem ser
encontrados em http://www.albion.com/netiquette/.
28
Esse dado felizmente aumentou para 11.4% em 2011 mas h grande probabilidade de que a excluso de
contedos no mude muito.
29
O que est em questo o conceito de pertena da tecnologia que no deve ser confundida com a questo do
acesso. Vide (Pimienta, -2009-1) para desenvolvimento mais detalhado do conceito.
30
http://www.nytimes.com/2008/07/26/business/worldbusiness/26internet.html
31
http://www.slateafrique.com/17731/sur-facebook-arabe-depasse-anglais
32
Alm disso, a Wikipedia manteve uma maravilhosa compilao de dados estatsticos sobre as lnguas:
http://en.wikipedia.org/wiki/Wikipedia:Multilingual_statistics. Aparentemente, outro indicativo de tempos de
mudana, esta pgina no vem sendo atualizada desde outubro de 2008 em algumas partes e desde dezembro de
2009 para dados diretos em cada uma das lnguas. No entanto, a Wikipedia est oferecendo agora uma pgina nova
e muito interessante para dados estatsticos, (http://stats.wikimedia.org/) que inclui alguns dados sobre as lnguas
(http://stats.wikimedia.org/#fragment-12).
33
Todas essas fontes correspondem ao ano de 2010 e se referem interface (no ao contedo).
27

PLAT

V. 2. N.3

2013

13

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

- Um estudo produzido pela Unio Latina em 201034 desenvolveu uma perspectiva da


evoluo da proporo das lnguas em vrias reas da Internet, a partir da coleta de
grande nmero de fontes virtuais demogrficas e estatsticas35. No entanto, havia uma
lacuna no que se refere a uma unidade metodolgica que desse conta das fontes e dados
em nveis variados de confiabilidade. Por isso, os resultados s podem ser visualizados
como indicativos das possveis tendncias.

Este estudo no foi publicado ainda e alguns dos excertos apresentados adiante possuem a permisso de Daniel
Prado.
35
Segue seleo de algumas fontes relevantes usadas para tal estudo:
http://socialmediastatistics.wikidot.com/
http://www.w3schools.com/browsers/browsers_firefox.asp
http://www.readwriteweb.com/archives/international_blogosphere.php
http://technorati.com/state-of-the-blogosphere/
http://www.mathaba.net/news/?x=408348
http://blogalize.typepad.com/micro/statistics/
http://www.sysomos.com/insidetwitter/
http://en.wordpress.com/stats/
http://www.p2pon.com/2010/02/19/10-million-downloads-of-pirated-games-in-december-alone-says-esa/
http://journal.webscience.org/209/2/websci09_submission_115.pdf
http://www.email-marketing-reports.com/metrics/email-statistics.htm
http://www.sifry.com/alerts/archives/000433.html and http://www.sifry.com/alerts/archives/000436.html
http://mashable.com/2010/02/24/half-messages-twitter-english/
http://www.vincegolangco.com/2010/very-interesting-social-media-statistics-facebooktwitter-flickr-linkedin-etc/
34

14

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

O espao da Internet

Ingls %

Live Journal (Blog)

55%

WordPress (Blog)

66%

Facebook
(Rede
Social)
Tweeter (Rede Social)

35%

Technorati (blog)

25%

LinkedIn (Rede social)

50%

Second Life (Rede


social)
Yandex (Motor de
busca) Trfego
Baidu
(Motor
de
busca) Trfego
Yahoo (Motor de
busca) Trfego
SAPO

39%

Bing (Motor de busca)


Trfego
Google (Motor de
busca) Trfego
Google (Motor de
busca) Contedo
MSN (Motor de busca)
Trfego
MSN (Motor de busca)
Contedo
Exalead (Ferramenta
de busca) Trfego
Exalead (Motor de
busca) Contedo

40%

MegaUpload (P2P)

13%

50%
2

Outras lnguas
Espanhol 6% - Russo 18% - Portugus
1%
Espanhol 9% - Portugues7%
Espanhol 10% - francs 10% Portugus 6%
Japons14% - portugus 9% - Espanhol
4% - malaio 6%
japons 25% - chins 31% - portugus
3%
hndi 15% - espanhol 6% -

1%

francs 17% - alemo 10% espanhol


7% - holands 7%
Russo 95%

1%

Chins 96%

36%

hndi 9% - espanhol 7% - rabe 5% portugus 2%


O portugus uma das poucas lnguas
com um motor de busca especfico
espanhol 10% - chins 7% - francs 6%
- hndi 5% - portugus 2%
hndi 9% - espanhol 6% - rabe 5% chins 4% - Portuguese 3%
alemo 7% - espanhol 6% - francs 6%
- italiano 4% - portugus 3%
espanhol 18% - portugus 7% - japons
6% - francs 6% - rabe 6%
alemo 6% - francs 5% - espanhol 5% italiano 3%
hndi19% - francs17 % -alemo 11% espanhol 7% - chins 6%
francs 7 % - alemo 4% - espanhol 4%
- italiano 3%

38%
39%
25%
50%
13%
48%

espanhol 22% - portugus 11% -

Uma referncia mais atualizada indica o ingls com 52% e apresenta as 10 lnguas mais usadas no Facebook,
surpreendendo pela posio do turco e indonsio aps o espanhol e o francs. Fonte:
http://www.insidefacebook.com/2010/05/24/facebooks-top-ten-languages-and-who-is-using-them/).
37
Um estudo mais recente indica o ingls abaixo de 50% e apresenta, na sequncia, o japons, portugus,
o malaio e o espanhol.
(Vide: http://semiocast.com/static/downloads/Semiocast_Half_of_messages_on_Twitter_are_not_in_English_
20100224_fr.pdf)
36

PLAT

V. 2. N.3

2013

15

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Google (Motor de
busca) Trfego
Google (Motor de
busca) Contedo
MSN (Motor de busca)
Trfego
MSN (Motor de busca)
Contedo
Exalead (Ferramenta
de busca) Trfego
Exalead (Motor de
busca) Contedo

38%

MegaUpload (P2P)

13%

RapidShare (P2P)

11%

DepositFiles (P2P)

10%

FileFactory (P2P)

11%

HotFile (P2P)

13%

Skype

9%

Firefox Download

23%

Wikipedia (artigos)

23%

YouTube

27%

39%
25%
50%
13%
48%

hndi 9% - espanhol 6% - rabe 5% chins 4% - Portuguese 3%


alemo 7% - espanhol 6% - francs 6%
- italiano 4% - portugus 3%
espanhol 18% - portugus 7% - japons
6% - francs 6% - rabe 6%
alemo 6% - francs 5% - espanhol 5% italiano 3%
hndi19% - francs17 % -alemo 11% espanhol 7% - chins 6%
francs 7 % - alemo 4% - espanhol 4%
- italiano 3%
espanhol 22% - portugus 11% francs 11% - japons8% - italiano 5%
espanhol14% - rabe 14% - hndi 8%
russo 26% - espanhol 16% - rabe 8% portugus 6%
rabe 16% - espanhol 11% - portugus
8% - hndi 7% - japons 7%
rabe 11% - japons 11% - espanhol 8%
- hndi 7%
portugus 10% - chins 8% - francs
5% - alemo 5%
alemo 11% - espanhol 8% - hndi 7% francs 7 %
alemo7% - francs 6% - polons 5% japons 5% - espanhol 3.8% portugus 3.6 %
espanhol 12% francs 6% hndi5% alemo 5% - portugus 4%

- A maioria dos dados so baseados no fluxo de dados por pas usando o


http://webboar.com e no diretamente sobre lnguas e contedos.
- As ferramentas de busca em que se indica contedo so derivadas da Funredes em
2007 e no foram publicadas porque no foram consideradas confiveis o suficiente; no
entanto so confiveis o suficiente para uma aproximao da porcentagem de pginas
em dada lngua nos ndice da ferramenta de busca em dada lngua. (somente o catalo,
ingls, francs, alemo, italiano, portugus e romeno foram computados).
- Algumas vezes os ndices relativos ao russo incluem outros pases como a Ucrnia e a
Bielorrssia.
Esses ndices confirmam uma forte tendncia da internacionalizao da internet e um
relativo declnio do ingls o qual foi percebido no perodo precedente. A existncia bem
sucedida de novas ferramentas de busca direcionadas para lnguas especficas (chins ou
russo) poderia iniciar uma nova tendncia no contexto dos motores de busca genricos que so
levados a pender seus ndices em direo ao ingls como consequncia da crescente limitao
do rastreamento do universo virtual inteiro.

16

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

3 - Mais dados referentes ao portugus no mundo digital


Tabela 3. Falantes de primeira e segunda lngua da maioria das lnguas faladas

Primeira lngua (falantes em Primeira


e
milhes, nmero de pases)
segunda lngua
Fonte: Ethnologue 4/2012

Fonte:
Unio
Latina 2008

chins (1213, 31)

Chins

> 1000

espanhol (329, 44)

Ingles

> 500

ingls (328, 112)

Hindi

> 500

rabe (221, 57)

Espanhol

> 200

hndi (182, 20)

Russo

> 200

bengali (bengals) (181, 10)

rabe

>200

portugus (178, 37)

bengali

portugus

O portugus pode ser considerado a quinta lngua do mundo em termos de falantes de


lngua materna, ao lado do hndi e do bengali j que as diferenas so perifricas. No entanto,
se considerarmos falantes de primeira e segunda lngua a posio da lngua segue em oitavo
lugar.
Tabela 4. As dez lnguas mais comuns de usurios da Internet

PLAT

V. 2. N.3

2013

17

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

O portugus a quinta lngua mais usada em termos de usurios da internet com


penetrao modesta - menos de um tero - o que indica a possibilidade para mais crescimento.
Tabela 5. Portuguese speaking Internet countries Fonte: Internet World Stats

A excluso digital claramente visvel nesta tabela onde alguns dos pases de lngua
official portuguesa tem ndices de penetrao na rede inferiores a 10%.

Tabela 6. Sites em lnguas Latinas

18

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Comparado a outras lnguas latinas, o portugus sofre uma reduo da porcentagem de


contedos no perodo de medio. Mais que uma questo de acesso, a lacuna a ser preenchida
deve ser percebida em termos de contedos.

Tabela 7. Produo de pginas em portugus (produtividade)

2007

2005

Brasil

71% (0.90)

71 % ( 0.95)

Portugal

15 % (0.98)

17 % (1.0)

EUA

4 % (5.0)

8 % (5.4)

Espanha

3.8 % (3.7)

2.3 % (1.2)
Fonte: Funredes/Unio Latina

interessante notar que os ndices altos e produtividade dos EUA e Espanha. ndices
mais detalhados por pas mostram a profundidade da excluso de contedos j que a Frana,
sozinha, est produzindo em 11/2007 mais pginas em portugus (0.21 % do total) que a
Angola, Cabo Verde, Guin Bissau, Moambique, So Tom e Prncipe e Timor Leste juntos
(0,16%)!

PLAT

V. 2. N.3

2013

19

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Tabela 8. Tabela de Indicadores da Internet 2008

RUM
CAT
Ingls Espanhol Francs Italiano Portugus. ? Alemo .
TOT.
Falantes
670 400
(milhes)
Falantes
(% populao
10.1% 6.1%
mundial
Internautas
366 102
(milhes)
Internautas
54.6% 25.4%
(%)
Internautas %
da populao
5.5% 1.5%
mundial
%
Internautas
32% 9%
por lngua
%
Pginas
45.0% 3.8%
por lngua.
Produtividade
1.42 0.43
por lngua
Pginas por
4.44 0.63
internauta

130

60

205

30

120

2.0%

0.9%

3.1%

0.5% 1.8%

0.1% 130%

58

31

47

59

6600

1154

44.9% 52.3% 23.1%

16.5% 49.1% 23.1% 17.5%

0.9%

0.5%

0.7%

0.1% 0.9%

0.0% 17.5%

5%

3%

4%

0%

0.2% 130%

4.4%

2.7%

1.4%

0.3% 5.9%

0.1% 100%

0.87

0.98

0.34

0.66 1.16

0.74 1

2.24

2.93

0.45

0.62 3.25

0.96

5%

Fonte: GlobaReach e Funredes/Unio Latina


H uma clara indicao da debilidade do portugus em termos de contedos disponveis
na rede em comparao com outras lnguas estudadas.
Tabela 9. Artigos e trfego da Wikipedia 4/2012

1
2
3
4
5
6
7
8
9
10

20

Lnguas

# ARTIGOS
Milhes

ingls
francs
italiano
alemo
russo
japons
portugus
holands
espanhol
polons

4
1.2
0.9
0.9
0,9
0.8
0,7
0,7
0,6
0.6

# USO
Milhes
Acessos por
hora
10.5
1
0.7
1.4
1.1
1.5
0.5
0.2
1.5
0.5
PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Fonte: Wikipedia38
O espanhol se sobrepunha ao portugus h trs anos atrs. Esse um indicativo
promissor de crescimento de contedos em portugus nos ltimos anos.
Tabela 10. Twitter Os 5 maiores mercados globais por busca

Pas
Indonsia
Brasil
Venezuela
Pases baixos
Japo

Dados estatsticos Porcentagem


Junho 2010

20.8%

Dezembro 2010

19.0%

Junho 2010

20.5%

Dezembro 2010

21.8%

Junho 2010

19.0%

Dezembro 2010

21.1%

Junho 2010

17.7%

Dezembro 2010

22.3%

Junho 2010

16.8%

Dezembro 2010

20.0%

Fonte: http://www.billhartzer.com/pages/comscore-twitter-latin-america-usage/
Tabela 11. As dez maiores lnguas do Facebook

38

Vide http://stats.wikimedia.org/EN/TablesCurrentStatusVerbose.htm

PLAT

V. 2. N.3

2013

21

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Os dois maiores xitos do portugus esto mais relacionados ao uso do que na


produo de contedo.

4 - Perspectiva histrica e tendncia sobre as lnguas na


internet
A tabela a seguir sintetiza uma perspectiva histrica da evoluo das redes em relao
diversidade lingustica.
Tabela 12: sntese

Era
da Enquad Usurios
caractersticas
Internet
re
tempora
l
Pr-histria 1970 - At
dois - BITNET, UUCP e
1990
milhes
outras redes
- Usurios de companhias
de
Tecnologia
da
Informao,
pesquisadores,
acadmicos e ativistas.
- De dbeis terminais de
acesso ao acesso ao
mainframe
(computadores de grande
porte) at o nascimento
do
PC
(Personal
Computer Computador
Pessoal)
O
1990 - At
15 O
ndice
de
nascimento 1995
milhes
profissionais de internet
da Rede
perpassa pesquisadores e
acadmicos.
Difuso
do
PC
(Computador pessoal)
Rede 1.0
1995 - At 1 bilho - A internet se torna
2005
mdia de massa
- Poderosos motores de
busca
Multiplicao
de
pequenas empresas

LANGUAGE WISE

- Comunidade global de
profissionais com grande
domnio de ingls.
- ASCII no estendido
significa
nenhum
diacrtico como em ingls.

- MIME
- Nascimento do Unicode
- ingls acima de 80%

- o ingls declina para


50%
- Aumento de lnguas
ocidentais
buscando
39
equilbrio com o ingls

Equilibrado em proporo relativa de seus falantes com a variao dependendo das lnguas; francs, alemo e
italiano sendo representados acima da mdia, em oposio ao portugus e espanhol.
39

22

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Rede 2.0

2005
2010

A prxima 2010
era
2015

A internet 2015
no futuro
2030

- At
dois - Aumento de monoplios
bilhes
- Reduo do tamanho
dos indexos dos motores
de busca
- Aumento dos vdeos
- Aumento da internet
mvel
- At
3 - Aumento de motores e
bilhes
busca
para
lnguas
especficas.
- Aumento de bibliotecas
digitais para lnguas
especficas.
- Aumento de contedos
no textuais
- Aumento de interfaces
de voz.
- Internet de objetos
- 75%
da - Telas em toda parte
populao
- teclados dando lugar a
mundial
interfaces de voz.
conectada
Disseminao
de
softwares de traduo.
- Motores de busca de
nova gerao
- Bibliotecas virtuais de
nova gerao

- ingls em torno de 33%


- Aumento de lnguas
asiticas
- Aumento do rabe
- Aumento de localizao
- IDN40 generalizado
- Assntota do ingls at
25%
- Aumento do rabe
- Aumento de lnguas
indgenas com grande
nmero de falantes41
- Aumento do uso de
softwares de traduo.
- Localizao de centenas
de lnguas
- aumento de polticas
lingusticas voltadas para
a internet
- contedos equilibrados
em
diversas
lnguassaberes.
- Equilibradas ferramentas
lingusticas.
- Localizao de milhares
de lnguas.
- Ferramentas pblicas de
suporte aprendizagem de
lnguas e multilinguismo.

Internationalized domain name (IDN) nome de um domnio da internet que usa um diferente script do latim
sem traos diacrticos (o mesmo usado pelo ingls), assim permite escrever URLs em, por exemplo, rabe, chins
ou francs com traos diacrticos (exemplos: aetl.fr ou bao.es).
40
A exemplo do quechua, aymara ou guarani na America Latina; o crioulo no Caribe; o suale ou hause na frica.
40

PLAT

V. 2. N.3

2013

23

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

5 - Concluso
Garantir a presena total de uma lngua no mundo digital um complexo processo que
demanda uma perspectiva holstica desde sua codificao, produo de teclados,
desenvolvimento de softwares nessas lnguas (processadores de textos e corretores
gramaticais, por exemplo) at o letramento digital e produo de contedos (Diki Kidiri, 2008).
Alm desses elementos, a existncia de livrarias virtuais para a literatura nas lnguas e a oferta
de recursos online para a aprendizagem e processamento da lngua (como os dicionrios,
orientaes gramaticais, glossrios) so tambm extremamente importantes. Aps uma lngua
ser identificada, a maior questo e talvez a mais difcil de lidar como prover contedos nessa
lngua.
A que uso dar acesso se no h contedos na lngua dos usurios; ao conceder acesso
livre a quaisquer contedos em qualquer lugar no estamos ns somente aumentando os
riscos da aculturao pela internet?
No muitas lnguas tm sido objeto de polticas pblicas visando garantir sua
revitalizao no mundo real (catalo e hebraico so duas histrias bem sucedidas). No entanto,
o objetivo nesse contexto desenvolver polticas pblicas que deem suporte para lnguas
especificamente para o mundo digital. Este um novo campo de atividade com pouca
experincia documentada42. A maioria das lnguas apresenta alguma interseo com polticas
pblicas digitais; o que est em pauta, ento, no simplesmente a presena de novas lnguas
no mundo digital, mas tambm a promoo de lnguas existentes na internet uma vez que uma
forte presena dessas lnguas no cyber espao gera implicaes econmicas, sociais e culturais.
Alguns especialistas advogam pela emergncia de polticas lingusticas com enfoque na
internet e oferecem um algortimo para medir o peso das lnguas43 que abarca alguns
indicadores relacionados internet . Tais medidas podem servir de base para a criao e
avaliao de polticas para as lnguas na internet44.
(vide http://www.portalingua.info/fr/poids-des-langues/, em francs). Uma tarefa relacionada
implicaria em sensibilizar responsveis pelas lnguas para a importncia de tais medidas;
chegado o tempo para as lnguas que esto em eminncia de extino45.
Ao longo de sua evoluo, a internet est adentrando uma nova era em que as questes
de lnguas e culturas esto sendo cruciais. Se as fronteiras da internet so as lnguas, ento a
construo de uma internet sem fronteiras est se iniciando com grandes desafios que podem
gerar novos tempos e fomentar a colaborao sem a qual nenhum progresso tangvel pode ser
facilmente alcanado.
Nessa nova era o portugus possui claramente um melhor papel e deve tentar obter um
lugar no mnimo coerente com sua importncia no mundo real e at mesmo batalhar pela
referida importncia social, econmica e cultural de sua representao no mundo digital.
42
Por exemplo, no h evidncia no incio de que a criao de um domnio lingustico dedicado ao catalo (em
2006, o primeiro e nico desse tipo) tenha desencadeado a criao de contedos em tal lngua. Seria interessante
verificar se o caso de que alguns anos aps tenha gerado outros domnios lingusticos e culturais (Vide
http://en.wikipedia.org/wiki/Proposed_top-level_domain).
42
Esse aumento no momento no favorvel ao portugus que aparece em mdia na 15 posio (atrs do
italiano) mesmo que seu peso relativo mude com diferentes parmetros com vistas a melhores resultados.
42
CALVET, 2009.
42
Ver Tabela: Categorizao de lnguas para requisitos de polticas no cyber espao em Pimienta, 2009-2.

24

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

Referncias
Suzuki I., Mikami Y., et al.2002. A Language and Character Set Determination Method Based
on N-gram Statistics, In ACM Transactions on Asian Language Information Processing, Vol.1,
No.3, September 2002, pp.270-279.
Paolillo J., Pimienta D., Prado D., et al.2005. Measuring linguistic diversity on the Internet,
UNESCO, 12/2005
http://portal.unesco.org/ci/en/ev.phpURL_ID=20882&URL_DO=DO_TOPIC&URL_SECTION=201.html
Crystal D.2006. Language and the Internet., Second Edition, Cambridge University Press,
9/2006, (ISBN-13: 9780521868594 | ISBN-10: 0521868599)
Graddol D.2006. English Next, British Council
http://www.britishcouncil.org/learning-research-english-next.pdf
Ess, C. 2006. From Computer-Mediated Colonization to Culturally-Aware ICT Usage and
Design, In P. Zaphiris and S. Kurniawan (eds.), Human Computer Interaction Research in Web
Design and Evaluation. Hershey, PA: Idea Publishing.
Diki-Kidiri, M.2007. Securing a place for language in cyberspace, Unesco CI.2007/WS/1. 2007
http://unesdoc.unesco.org/ images/0014/001497/149786E.pdf
Nandasara S.T. et al.2008. Analysis of the Asian Languages on the Web Based on N-gram
Language Identification. In The International Journal on Advances in ICT for Emerging Regions
(ICTer), Volume 1, Issue 1, 2008
Pimienta D.2008. Accessing Contents, Chapter of Global Information Society Watch, APC,
HIVOS, ITEM, 2008
http://www.giswatch.org/gisw2008/thematic/AccessingContent.html
Lewis, M.2009. Ethnologue: Languages of the World, Sixteenth edition., Dallas, Tex.: SIL
International.
http://www.ethnologue.com/
Pimienta D.2009-1. Digital divide, social divide, paradigmatic divide, in International Journal
of Information Communication Technologies and Human Development, V1, N1, January-March
2009
Older version accessible at:
http://funredes.org/mistica/english/cyberlibrary/thematic/Paradigmatic_Divide.pdf
Pimienta D., Prado D., Blanco 2009-2. Twelve years of measuring linguistic diversity in the
Internet: balance and perspectives, Unesco,
http://unesdoc.unesco.org/images/0018/001870/187016e.pdf
Prado D., Pimienta D. , Lemoulinier A.2010. Diversit linguistique et cyberespace : tat de l'art,
enjeux et opportunits, Cosmopolis
http://agora.qc.ca/cosmopolis.nsf/Articles/no2010_1_Diversite_linguistique_et_cyberespace_
__etat_de_l?OpenDocument
PLAT

V. 2. N.3

2013

25

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

ITU.2010. World Telecommunication/ICT Development Report 2010 Monitoring the WSIS


Targets. A mid-term review, Target 9, pp175-192
http://www.itu.int/pub/D-IND-WTDR-2010
Partnership on Measuring ICT for Development's Task Group on Measuring the WSIS Targets,
Measuring the WSIS Targets - A statistical framework, Target 9, pp91-96, ITU, 2011
http://www.itu.int/ITU-D/ict/partnership/wsistargets/index.html
NET.LANG: Towards a multilingual cyberspace, C&F Editor, coordinated by MAAYA., 2012, ISBN
978-2-9158255-08-4
http://net-lang.net/

26

PLAT

V. 2. N.3

2013

O ESPAO DAS LNGUAS NA INTERNET:


PANORAMA E TENDNCIAS COM NFASE NO PORTUGUS
Daniel Pimienta

PLAT

V. 2. N.3

2013

27

A LNGUA PORTUGUESA FACE AO


CHOQUE TECNOLGICO DIGITAL
Antnio Branco
Sobre o autor
Universidade de Lisboa
Contato: Antonio.Branco@di.fc.ul.pt

Resumo
No presente artigo, apresento uma breve anlise da situao da lngua portuguesa face
ao choque tecnolgico digital, os riscos e as oportunidades que neste contexto se colocam, e
indico as aes imediatas que surgem como necessrias para se recuperar atrasos e assegurar
para o portugus a sua posio de lngua internacional de comunicao com projeo global.

Palavras-chave
Choque tecnolgico digital. Tecnologia da linguagem. Lngua portuguesa.

28

PLAT

V. 2. N.3

2013

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

1 - Introduo
Tal como qualquer outro dos cerca de 6 000 idiomas existentes no planeta, a lngua
portuguesa uma janela para o mundo que nos rodeia. atravs da linguagem, e do seu uso
em todas as situaes do quotidiano, que comunicamos, aprendemos, nos entreajudamos,
planeamos o futuro, e fabulamos ou nos comprazemos com uma histria ou um poema.
Por paradoxal que primeira vista parea, sendo uma janela para o mundo que nos
rodeia, a linguagem humana tambm e cada vez mais um dos ltimos obstculos
comunicacionais com que nos deparamos na era digital e num mundo globalizado.
As novas tecnologias da informao e da comunicao colocam ao nosso alcance
pessoas de todo o mundo com quem ser fcil interagir, assim como um acervo infindvel de
informao a que ser possvel aceder. Contudo, mesmo quando se encontram asseguradas
exaustivamente as mais avanadas condies tcnicas de acesso, este novo e ilimitado
universo de possibilidades continua na sua esmagadora maioria inacessvel, encerrado que est
dentro das barreiras invisveis das lnguas que o dividem.
De igual modo, as novas tecnologias digitais colocam ao nosso alcance novos e cada vez
mais poderosos dispositivos, desde eletrodomsticos at robs pessoais, que alargaro as
capacidades de cada um de ns para limites ainda por explorar. Porm, a utilizao
generalizada destes dispositivos continua em grande medida condicionada por interfaces
idiossincrticas que restringem a sua utilizao e limitam de forma drstica a concretizao do
seu potencial.
No presente artigo, apresento uma breve anlise da situao da lngua portuguesa face
ao choque tecnolgico digital, tendo como enfoque os riscos e as oportunidades que neste
contexto se colocam.
No presente artigo, apresento uma breve anlise da situao da lngua portuguesa face
ao choque tecnolgico digital, tendo como enfoque os riscos e as oportunidades que neste
contexto se colocam.
Uma discusso mais alongada e devidamente circunstanciada e referenciada do assunto
abordado neste artigo pode ser encontrada em Branco et al., 20122

2 - Linguagem e tecnologia
Tal como em outras reas da existncia humana, a evoluo cientfica e tecnolgica tem
alterado as condies de utilizao, e da prpria existncia, das lnguas naturais ao longo da
histria. Em alguns casos, estas novas condies de utilizao das linguagens resultaram
daquilo a que se pode chamar de choques tecnolgicos, que estiveram na origem de profundas
revolues civilizacionais.
1
Por convenincia da leitura, a referncia completa a esta publicao repetida aqui: BRANCO, Antnio, Amlia
MENDES, Slvia PEREIRA, Paulo HENRIQUES, Thomas PELLEGRINI, Hugo MEINEDO, Isabel TRANCOSO, Paulo
QUARESMA, Vera Lcia Strube de LIMA & Fernanda BACELAR, 2012, A Lngua Portuguesa na Era Digital / The
Portuguese Language in the Digital Age, Coleo Livros Brancos, Berlim, Springer. Este o volume dedicado lngua
portuguesa, de uma Coleo de Livros Brancos sobre as lnguas europeias na era digital, que conta com 30 volumes,
correspondendo a outros tantos idiomas.

PLAT

V. 2. N.3

2013

29

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

Um dos primeiros choques tecnolgicos envolvendo a linguagem humana de que h


registo consistiu no advento da escrita, h cerca de seis mil anos. Esta inovao passou a
permitir que os interlocutores comunicassem em linguagem natural de forma assncrona, sem
terem de estar na presena um do outro em simultneo.
Com a escrita, pode-se dizer que se quebrou a barreira do tempo na utilizao da
linguagem. Por sua vez, com o advento da imprensa mecnica, h cinco sculos atrs,
quebrou-se a barreira social no acesso informao escrita. As publicaes generalizaram-se
e deixaram de estar acessveis apenas para um pequeno grupo de leitores.
H algumas dcadas atrs um outro choque tecnolgico para a linguagem natural teve
lugar com o advento das telecomunicaes. A barreira do espao na utilizao da linguagem foi
quebrada, passando ento a ser possvel aos interlocutores comunicarem de forma sncrona
apesar de no se encontrarem presentes no mesmo local.
Todos estes choques tecnolgicos na utilizao da linguagem natural tiveram impactos
civilizacionais enormes, sobejamente assinalados pelos historiadores. O que tem sido porm
muito menos assinalado so os seus impactos nas condies de existncia das prprias lnguas
naturais. Estas mudanas tecnolgicas tm proporcionado uma evoluo tremenda nas
condies de comunicao entre indivduos: possibilitaram alargar as virtualidades da
linguagem humana muito para alm do que esta permite se restringida apenas a situaes de
conversa oral face a face. Mas a par dessa evoluo, induziram tambm fortes mecanismos de
involuo ao nvel das lnguas.
A cada choque tecnolgico, novas condies de utilizao da linguagem tm colocado
novas e mais estritas condies de existncia para os diferentes idiomas. Um exemplo bem
conhecido o das lnguas sem sistema de escrita, que foram desaparecendo, e continuam a
desaparecer, perante a vantagem de se usar outras lnguas, com escrita, que permitam tirar
partido dos benefcios dessa superioridade tecnolgica.
O progresso tecnolgico parece assim exibir uma natureza mefistoflica no que toca
linguagem humana. Ao mesmo tempo que permite alargar a capacidade de comunicao entre
indivduos, cria tambm fatores de reduo da diversidade lingustica e do multilinguismo, e
dessa forma de reduo do patrimnio cultural e da pluralidade de mundividncias que as
diferentes lnguas sustentam. Dos cerca de 6 000 idiomas existentes hoje em dia, estima-se
que cerca de 2 500 correm o risco de se extinguirem nas prximas dcadas, como acontece a
cada ano que passa com as vrias lnguas que morrem com o desaparecimento do seu ltimo
falante.
Neste enquadramento, cabe atentarmos no mais recente choque tecnolgico para a
utilizao da linguagem humana, que se encontra em curso nos dias de hoje. Este choque
provocado pela utilizao das novas tecnologias digitais e resulta na expanso das condies
de utilizao das lnguas para um novo patamar sem precedentes.

3 - Tecnologia da linguagem
A aplicao das novas tecnologias linguagem natural, e em concreto o processamento
computacional das lnguas naturais, est a dar origem a uma nova rea de investigao,
desenvolvimento e inovao conhecida por tecnologia da linguagem. De um ponto vista
genrico, esta tecnologia pode ser caracterizada como se ocupando com a obteno da
representao do significado a partir do processamento computacional de expresses

30

PLAT

V. 2. N.3

2013

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

lingusticas, e vice-versa, da obteno de expresses lingusticas a partir do processamento da


representao do seu significado.
A tecnologia da linguagem engloba duas subreas, conhecidas por processamento da
linguagem e por processamento da fala. O processamento da fala ocupa-se com a obteno de
uma representao discreta a partir de um sinal analgico correspondente a enunciados orais,
e vice-versa. O processamento da linguagem, por sua vez, ocupa-se em mapear entre uma
sequncia discreta de smbolos lingusticos e a representao do seu significado.
A tecnologia da linguagem est a abrir o leque inaudito de novas condies e de novas
oportunidades para a utilizao da linguagem natural:
Ajudar as pessoas a comunicar entre si ainda que no falem uma lngua comum;
Apoiar uma nova gerao de interfaces naturais e intuitivas, baseadas em linguagem
natural, com todo o tipo de dispositivos, desde eletrodomsticos at robs pessoais.
a. Aplicaes
As novas oportunidades propiciadas pela tecnologia da linguagem resultam da sua
explorao para o desenvolvimento de diversas aplicaes computacionais, que podem afetar
de modo diverso as condies de utilizao da linguagem natural, e que se encontram
atualmente em diferentes estados de maturidade tecnolgica e de comercializao.
Algumas destas aplicaes so usadas em contextos de utilizao profissional
especializados, como o caso, por exemplo, dos detetores de plgio, para o trabalho de
avaliao dos estudantes por parte dos professores, ou dos ambientes de apoio automatizado
traduo, para o trabalho dos tradutores.
Algumas outras aplicaes so utilizadas de forma mais generalizada, fazendo parte do
nosso quotidiano, como por exemplo, os corretores ortogrficos.
Certas aplicaes da tecnologia da linguagem, ainda que cruciais para o desempenho do
sistema global em que se inserem, no so apercebidas pelos utilizadores, como o caso, por
exemplo, dos detetores de linguagem nos motores de busca.
Algumas delas, sendo de interesse para todo o tipo de utilizadores, so de especial
relevo para pessoas portadoras de deficincias, como o caso dos sintetizadores de voz no
apoio leitura por invisuais.
H aplicaes que servem propsitos circunscritos de utilizao, como no caso dos
sistemas de produo de documentao com base em linguagem controlada, usados na
produo de manuais tcnicos de manuteno de aeronaves. Outras aplicaes servem uma
leque mais amplo de situaes de utilizao, como o caso dos sistemas de reconhecimento
de fala, que podem ser integrados em dispositivos de controlo num automvel ou suportar
sistemas de legendagem automtica de vdeos, entre inmeras outras utilizaes.
Face limitao de espao do presente artigo e natureza do seu objetivo, no caberia
fazer aqui uma listagem sistemtica nem uma apresentao exaustiva de cada uma das
possveis aplicaes da tecnologia da linguagem, das suas funcionalidades ou das situaes da
sua utilizao. Para efeitos de alargar a ilustrao apresentada at aqui, listam-se em seguida
alguns casos mais notrios de aplicaes e aqueles cuja designao ser em grande medida
autosexplicativa das suas funcionalidades. Para ajudar a exposio, estes exemplos sero
PLAT

V. 2. N.3

2013

31

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

reunidos nos seguintes grupos temticos:


Interao homem-mquina:
Interfaces com dispositivos e agentes artificiais
Deteo de linguagem, autor, domnio,
Classificao de textos
Agrupamento de textos
Busca de documentos
Extrao de informao
Levantamento de opinies
Interfaces com bases de dados
Resposta a perguntas
Reconhecimento de fala
Sntese de fala
...
Interao multilingue
Traduo automtica
Agentes conversacionais
Publicao multilingue
...
Produo e verificao de linguagem
Correo ortogrfica
Correo gramatical
Deteo de plgio
Linguagens controladas e sistemas de produo de documentao
Localizao de software
Legendagem automtica
Sistemas de ditado
Sumarizao
Gerao de relatrios
Ambientes de apoio traduo
Simplificao de textos
...
Aprendizagem de linguagens:
Formao
Avaliao de competncias

Web:
Anotao de metadados
Busca web avanada
Gesto de ontologias

Algumas destas aplicaes j encontraram no s a sua maturidade tecnolgica mas


tambm os modelos de negcio apropriados que permitem a sua ampla difuso e utilizao,
como acontece com os populares motores de busca de documentos.
Outras aplicaes encontram-se ainda em fase de investigao cientfica ou de prottipo,
como o caso, por exemplo, dos sumarizadores.
Muitas outras aplicaes encontrar-se-o certamente ainda por ser desenhadas e
imaginadas consoante a tecnologia da linguagem, que lhes servir de base, vier a ser

32

PLAT

V. 2. N.3

2013

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

desenvolvida, amadurecida e explorada em novas solues para os utilizadores.


b. Tecnologia nuclear
A tecnologia da linguagem assim uma tecnologia facilitadora e para algumas lnguas
que so objeto de esforos intensos e concertados de investigao, como o caso notrio da
lngua inglesa, encontra-se em acelerado ritmo de progresso e desenvolvimento.
Quer integrada em sistemas mais amplos quer suportando aplicaes autnomas, esta
tecnologia crucial para a revoluo tecnolgica em curso: ajudar a ultrapassar as ltimas
fronteiras comunicacionais tanto no que toca comunicao entre os seres humanos e os
agentes e dispositivos artificiais, como no que toca prpria comunicao dos seres humanos
entre si.
A investigao em tecnologia da linguagem pode ser vista como se desenrolando em
duas dimenses principais inter-relacionadas. Por um lado, envolve o desenvolvimento das
chamadas ferramentas de processamento computacional e, por outro, de aquilo que usual
designar-se por recursos lingusticos.
Os recursos lingusticos para uma dada lngua so os conjuntos de dados, de diferentes
tipos, que so cruciais para apoiar quer a investigao cientfica sobre essa lngua, quer o
desenvolvimento e a avaliao de ferramentas de processamento para a mesma.
Como exemplo de um tipo de conjunto de dados dos mais simples, pode-se mencionar
os corpora de texto corrido, que consistem em colees de textos, de domnios diversos, tal
como eles foram publicados. Mas mais comummente, os recursos lingusticos so conjuntos de
dados altamente complexos que so laboriosamente produzidos de modo a registar e a
compilar os aspetos mais sofisticados dos fenmenos lingusticos tal como estes ocorrem ou
so instanciados em enunciados usados pelos falantes. Por exemplo, no caso dos lxicos, cada
expresso pode ser pormenorizadamente classificada de acordo com as suas vrias
caractersticas lingusticas, desde os aspetos fonticos at aos semnticos. No caso dos
chamados treebanks, num outro exemplo, so as frases que so alvo de caracterizao
exaustiva em termos das relaes sintticas que se encontram instanciadas entre as suas
palavras.
Exemplos de recursos lingusticos:

PLAT

Corpora anotados
Corpora multilingues paralelos e alinhados
Bases de dados de fala
Listas de palavras
Abreviaturas, nomes prprios, palavras funcionais,
Vocabulrios
Lxicos
Ontologias lexicais
Terminologias
Treebanks
Propbanks
DeepBanks
...

V. 2. N.3

2013

33

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

As ferramentas de processamento para uma dada lngua, por sua vez, realizam um leque
de diferentes tarefas que, quando encadeadas, contribuem para executar o mapeamento entre
forma e significado nessa lngua. Essa tarefas incluem desde a funcionalidade mais bsica de
determinar o incio e o fim de frases, por exemplo, at funcionalidades altamente complexas e
sofisticadas, como acontece nas gramticas de processamento lingustico profundo, que
permitem obter a representao semntica em forma lgica da frase de entrada.
A ttulo de ilustrao, pode-se tambm mencionar os etiquetadores morfossintcticos
que anotam as expresses num texto com a categoria morfossintctica (verbo, nome,
advrbio, etc) que lhe cabe em cada uma das suas ocorrncias , os lematizadores que
associam a cada palavra a sua forma flexionada cannica, e.g. a forma infinitiva no caso dos
verbos , ou os analisadores de dependncias gramaticais que identificam as funes
gramaticais (Sujeito, Objecto Direto, etc) entre as expresses constituintes de uma frase,
entre vrios outros exemplos de diferentes tipos e funcionalidades de ferramentas para o
processamento lingustico, que lidam com a estrutura, a ambiguidade e a criatividade das
lnguas naturais.2
Exemplos de ferramentas de processamento:

Separador de frases
Separador de palavras
Etiquetador morfossintctico
Lematizador
Analisador morfolgico
Reconhecedor de nomes de entidades
Desambiguador de acees de palavras
Analisador de constituncia sinttica
Analisador de dependncias gramaticais
Etiquetador de papis semnticos
Gramtica para processamento lingustico profundo (anlise semntica)

4 - Desafios
Depois das barreiras do tempo e do espao e da barreira social terem sido quebradas em
anteriores choques tecnolgicos, a prpria barreira da linguagem, e da diversidade
lingustica, que se encontra agora a ser ultrapassada com a revoluo resultante da tecnologia
da linguagem.
Tal como nos choques tecnolgicos anteriores, o impacto civilizacional ser tremendo e
de uma dimenso ainda difcil de antever na sua totalidade. De modo anlogo, a par das novas
oportunidades abertas, tambm novos desafios e riscos se colocam agora aos idiomas e sua
existncia.
No passado, lnguas que em consequncia do seu contexto econmico e histrico
particular, no foram estudadas e, por exemplo, para as quais no foi desenvolvido um sistema
de escrita viram-se votadas ao beco sem sada da extino.
2
Para experimentar e melhor compreender a funcionalidade de algumas destas ferramentas, possvel recorrer o
LX-Center, que apresenta vrios demonstradores e servios lingusticos online gratuitos para a lngua portuguesa,
em http://lxcenter.di.fc.ul.pt.

34

PLAT

V. 2. N.3

2013

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

Hoje em dia, esse desafio joga-se ao nvel da cincia e da tecnologia da linguagem.


Lnguas que, em consequncia do seu contexto econmico e histrico, no venham a ser alvo
de estudo cientfico e para as quais no sejam desenvolvidas as solues tecnolgicas
apropriadas, so lnguas que a prazo arriscam a sua progressiva irrelevncia, em detrimento
de outras melhor preparadas, e eventualmente a sua prpria extino.
Neste enquadramento, importa analisar a actual situao no que diz respeito lngua
portuguesa.
Existem 236 milhes de falantes do portugus em quatro continentes. Este um nmero
que crescer para cerca de 335 milhes em 2050 e que faz desta lngua a quinta com maior
nmero de falantes no mundo, depois do chins, castelhano, ingls e rabe. Entre os falantes
das suas diferentes variantes existe compreenso mtua generalizada, e se se atender ao
critrio da compreenso mtua entre falantes para a circunscrio de um idioma, isso pode
fazer do portugus a terceira lngua com maior nmero de falantes no mundo, depois do ingls
e do castelhano. Cabe assinalar tambm que o portugus atualmente um dos idiomas de
trabalho de 27 organizaes internacionais.
A lngua portuguesa rene assim condies mpares para assegurar o estatuto de lngua
de comunicao internacional com projeo global.
Esta oportunidade encontra-se porm em preocupante contraste com os riscos que
decorrem do baixo nvel da preparao do portugus para a era digital em termos de cincia e
tecnologia da linguagem.
No quadro da rede cientfica europeia de excelncia META-NET,3 foi publicada uma
Coleo de Livros Brancos cujos volumes analisam a situao de diferentes lnguas na era
digital, tendo em ateno a sua preparao em termos de tecnologia da linguagem. Cada
volume, elaborado por um grupo de especialistas, dedicado a uma de 30 lnguas europeias.
No mbito desta iniciativa, foi elaborado um estudo comparativo do estado dessas diferentes
lnguas, tendo sido feita uma classificao apoiada numa escala de cinco nveis, nomadamente
"Apoio excelente", "Apoio bom", "Apoio mdio", "Apoio fragmentrio" e "Pouco/nenhum apoio".
Em resultado desse estudo comparativo, em termos de processamento da linguagem, a
lngua portuguesa surge classificada como tendo "Apoio fragmentrio": surge em situao
mais vantajosa que apenas 8 das outras 29 lnguas, e em situao igual ou pior que as
restantes, entre as quais se inclui o Alemo, o Castelhano, o Francs, o Italiano e o Neerlands,
avaliada como gozando de "Apoio mdio", e o Ingls, com "Apoio bom" (Branco et al., 2012,
p.36).
Para enfrentar o choque tecnolgico digital, a lngua portuguesa encontra-se muito
menos preparada tecnologicamente que as lnguas com que compete por protagonismo no
sistema mundial e inclusive muito menos preparada que outras lnguas com muito menor
projeo.
Face a estes desafios, so necessrias aes imediatas para que se possam obter
progressos importantes para recuperar atrasos e assegurar para o portugus a sua posio de
lngua internacional de comunicao com projeo global. Neste enquadramento, cabe
assinalar que h uma boa comunidade de centros de investigao, em Portugal e no Brasil,
3

http://www.meta-net.eu

PLAT

V. 2. N.3

2013

35

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

que cooperam ativamente entre si e que, de momento, tm capacidade instalada para fazer
avanar a tecnologia da linguagem para a lngua portuguesa. porm necessrio garantir o
incremento estratgico do esforo aplicado nesta rea para segurar e incrementar esta
capacidade e se vir a alcanar um patamar de progresso sustentado.
De modo similar ao que tem vindo a ser feito nas ltimas dcadas para outras lnguas,
e em particular e de forma notria para a lngua inglesa, este esforo deve ser articulado de
acordo com as seguintes medidas estratgicas:
estabelecer programas de estmulo investigao especificamente inter e
multidisciplinar na rea do processamento computacional da lngua
portuguesa, em particular, e da cincia e tecnologia da linguagem, em geral, nas
Universidades dos pases de lngua portuguesa;
estabelecer programas de investigao e desenvolvimento de longo alcance que
fomentem a construo de recursos lingusticos e de ferramentas para o
processamento computacional do portugus, e de aplicaes da tecnologia da
linguagem capacitadas especificamente para a lngua portuguesa;
fomentar programas de cooperao entre os pases de lngua portuguesa que
promovam a partilha e a transferncia de conhecimento e contribuam para um estado
de desenvolvimento tecnolgico das diferentes variedades do portugus mais
equilibrado;
promover a adeso a infra-estruturas de investigao internacionais dedicadas
especificamente cincia e tecnologia da linguagem natural, como o caso do
CLARIN, a primeira infra-estrutura internacional para a rea, criada em fevereiro de
2012.

Referncias
BRANCO, Antnio, Amlia MENDES, Slvia PEREIRA, Paulo HENRIQUES, Thomas PELLEGRINI,
Hugo MEINEDO, Isabel TRANCOSO, Paulo QUARESMA, Vera Lcia Strube de LIMA & Fernanda
BACELAR. 2012. A Lngua Portuguesa na Era Digital / The Portuguese Language in the Digital
Age, Coleo Livros Brancos, Berlim, Springer, ISBN 978-3-642-29592-8.

36

PLAT

V. 2. N.3

2013

A LNGUA PORTUGUESA FACE AO CHOQUE TECNOLGICO DIGITAL


Antnio Branco

PLAT

V. 2. N.3

2013

37

O USO DE CORPORA PARA A CONSTITUIO


DE RECURSOS LEXICOGRFICOS DE
REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida,
Margarita Correia

Sobre o autor
Jos Pedro Ferreira
Instituto de Lingustica Terica e Computacional, Lisboa, Portugal.
zpferreira@gmail.com
Gladis Maria de Barcellos Almeida
Universidade Federal de So Carlos e Ncleo Interinstitucional de Lingustica Computacional,
So Carlos, Brasil.
gladis@ufscar.br
Margarita Correia
Instituto de Lingustica Terica e Computacional e Universidade de Lisboa, Lisboa, Portugal.
margarita.correia@gmail.com

Resumo
Este artigo analisa os diferentes tipos de dados usados na construo de obras
lexicogrficas, com particular incidncia no uso de dados extrados de corpora, centrando-se na
sua utilidade para a construo de recursos de referncia, nomeadamente no mbito dos
trabalhos em curso para a criao do Vocabulrio Ortogrfico Comum da Lngua Portuguesa
(VOC). Comeamos por fazer um apanhado geral das diferentes prticas na lexicografia de
outras lnguas, descrevendo depois os poucos casos representativos do uso de corpora, em
sentido contemporneo, nas obras dicionarsticas do portugus, centradas historicamente na
tradio lexicogrfica e na introspeo sendo usados dados de corpora sobretudo para a
extrao de abonaes e obteno de acees. Descrevendo a metodologia adotada no
desenvolvimento VOC, procuramos mostrar o papel instrumental dos corpora para a definio
de primeiras nomenclaturas de variedades em processo de estandardizao, para a validao
de dados obtidos da tradio e para a aferio da frequncia e especificidade do mbito de uso
de cada entrada.

Palavras-chave
Corpus. Lexicografia. Dicionrio. Vocabulrio ortogrfico.

38

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

1 - Introduo
A constituio do Vocabulrio Ortogrfico Comum da Lngua Portuguesa (VOC) um
desiderato da Comunidade dos Pases de Lngua Portuguesa (CPLP) e uma determinao do
Acordo Ortogrfico da Lngua Portuguesa de 1990 (AO90). O projeto para a sua execuo
encontra-se atualmente em curso sob coordenao do Instituto Internacional de Lngua
Portuguesa (IILP). Tentativas anteriores de elaborar um vocabulrio ortogrfico comum
esbarraram nas diferentes interpretaes dadas ao texto das reformas ortogrficas que
pretendiam aplicar, que se refletiram no desenvolvimento de vocabulrios ortogrficos
nacionais com divergncias (Brasil e Portugal).1
A mais recente reforma ortogrfica da lngua portuguesa, em curso desde 2009, que visa
a unificao da ortografia nos vrios pases da CPLP, apenas unificou as regras de escrita, que
preveem a coexistncia de variantes nacionais em determinados contextos, e no exige a fuso
das tradies lexicogrfica e ortogrfica. Com efeito, continuaro a existir casos de divergncia
que dependem no da aplicao de regras, mas da tradio, como mido no Brasil e hmido
nos restantes pases. Outro dos problemas que se colocam deve-se ao facto de os diferentes
pases se encontrarem em momentos diferentes da consolidao e normalizao das suas
variedades nacionais. Neste contexto, o desenvolvimento do VOC nas condies descritas neste
trabalho constitui no s a base da aplicao do AO90 em todos os pases da CPLP, como um
avano sem precedentes na lexicografia de lngua portuguesa.
Por estas razes, a soluo adotada no VOC uma abordagem mista, na qual a tradio
lexicogrfica e o uso real em contextos de uso das variedades-padro so tidos em conta para
obter uma fatia representativa do lxico da lngua. Por um lado, a tradio desempenha um
papel fundamental na determinao das formas existentes e na das que no so alteradas pela
reforma ortogrfica; por outro lado, para que o VOC seja representativo do portugus como um
todo, lngua pluricntrica de oito pases, deve registar pelo menos as formas mais frequentes
em uso em todos os pases, dando especial ateno queles com menor ou inexistente tradio
lexicogrfica. Com esse objetivo, todos os pases da CPLP esto a constituir, no mbito do VOC,
recursos lexicogrficos representativos do portugus tal como usado no seu espao nacional,
seguindo uma metodologia comum, visando a constituio de recursos com desenho e
dimenses comparveis.
O presente artigo aborda o papel dos corpora na lexicografia moderna e no
estabelecimento da norma, nomeadamente em lnguas pluricntricas como o portugus, e
apresenta os princpios, critrios, metodologia, recolha de dados, processo de compilao e
funes dos corpora no VOC. Deste modo, num primeiro momento, discutir-se- o papel dos
corpora em lexicografia, para, num segundo momento, se apresentarem as principais
caratersticas dos corpora em geral e suas especifidades relativamente ao pluricentrismo do
portugus, e, finalmente, se explanar o seu uso no trabalho desenvolvido no mbito do VOC.

Para uma descrio detalhada do projeto VOC e da estrutura, princpios e metodologia geral seguidas na
prossecuo dos seus objetivos, leia-se Almeida et al. (2013) e Ferreira et al. (2012a).
1

PLAT

V. 2. N.3

2013

39

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

2 - O papel dos corpora na lexicografia


Quando falamos de corpus atualmente, imediatamente pensamos em corpus eletrnico.
Mas o conceito de corpus no um conceito novo em lingustica nem dependente
exclusivamente deste suporte. Svensn (2009: 43) define corpus como a collection of
language material selected according to certain criteria and used as basis for linguistic
investigation. No entanto, corpus entendido atualmente como a collection of pieces of
language text in electronic form, selected according to external criteria to represent, as far as
possible, a language or language variety as a source of data for linguistic research2. Esse
formato digital, promovido pelo advento do computador, interferiu diretamente no s na
concepo que se tem de corpus, como tambm na sua forma de armazenamento e
explorao, j que os recursos oferecidos pela mquina permitiram que grandes quantidades
de textos pudessem ser processadas em questo de segundos, fazendo com que muitas
hipteses sobre determinados processos lingusticos pudessem ser testadas rpida e
eficientemente.
Em lexicografia, o corpus diz respeito s fontes do trabalho lexicogrfico. De acordo com
Atkins & Rundell (2012: 45-46):
A reliable dictionary is one whose generalizations about word behaviour approximate
closely to the ways people normally use (and understand) language when engaging in
real communicative acts (such as writing novels or business reports, reading
newspapers, or having conversations). But how can we feel confident that we know how
people normally use words, and hence that the description given in our dictionary is
reliable? Reliability depends on the kind of evidence that underpins our account of the
language and evidence comes in several forms.

As fontes lexicogrficas podem ser primrias ou secundrias. As primrias so


constitudas por dados autnticos, que podem ser resultantes da introspeo, de ficheiros de
citaes (citation files) e de corpora propriamente ditos. As secundrias so descries da
lngua previamente existentes, em especial dicionrios, gramticas e outros estudos
(SVENSN, 2009: 39).
Definido o conceito de corpus, refira-se o que se entende por ficheiro de citaes. Estes
so recolhidos a partir de um determinado conjunto de textos estrategicamente escolhidos que
se consideram representativos da lngua ou da variedade a ser descrita; desses textos so
extrados itens lexicais ou citaes de material que so considerados adequados para serem
includos no dicionrio (SVENSN 2009: 41).
A utilizao de corpora em sentido lato no prerrogativa do mundo moderno. H muito
que se elaboram corpora constitudos por citaes, que designaremos como corpora de
citaes, para a validao ou definio de uma norma lexical. Na tradio lexicogrfica do
portugus e do ingls para exemplificar com duas grandes lnguas pluricntricas estes
corpora de citaes viriam a ser organizados e publicados em forma de grandes dicionrios de
lngua.

40

SINCLAIR, 2005

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
Na lngua portuguesa, pode citar-se o Vocabulrio Portuguez e Latino, de Rafael Bluteau,
publicado em oito volumes entre 1712-1728, o primeiro dicionrio para o qual foi fixado um
corpus de citaes3, que foi utilizado como exemplrio de uso lingustico para as palavras que
constavam da nomenclatura4. Outro exemplo, j no sculo XIX, o Diccionario da Lingua
Portugueza, 2 edio, de Antnio de Morais Silva, publicado em 1813, que tambm se valeu
de um corpus de citaes como fonte para a recolha de exemplos5.
Na lngua inglesa, pode referir-se A Dictionary of the English Language, publicado em
1755, para o qual Samuel Johnson reuniu um corpus de textos para poder observar as palavras
em seu uso autntico e como fonte de exemplos para os verbetes. Outra importante obra The
Oxford English Dictionary, cujo projeto lexicogrfico tambm se valeu de uma grande
quantidade de citaes, obtidas a partir de uma carta de apelo enviada pelo prprio Murray,
responsvel pela obra, em 1879, pedindo colaboraes. Mais de 800 leitores voluntrios
passaram a enviar ao editor tiras de papel com citaes que deveriam conter as palavras a eles
atribudas (BIBER, CONRAD & REPPEN, 1998).6
Os dicionrios produzidos com base em corpora de citaes so feitos pelo mtodo de
citaes (citation method) (SVENSN, 2009: 41-42). Os corpora de citaes destes dicionrios
so apenas constitudos, num primeiro momento, por excertos de obras literrias do cnone,
as que se consideram adequadas exaltao da lngua do Estado pelos primeiros dicionrios
das Academias, para, posteriormente, inclurem tambm excertos de textos que representem
o padro, incluindo o discurso cientfico e o discurso institucional, nas lexicografias inglesa e
norte-americana, e mais tarde excertos de textos de pocas mais remotas, na realizao de
dicionrios histricos7.
O sculo XX marca efetivamente o dealbar da lingustica como cincia, e o dicionrio
incorporou as realizaes da lingustica e o seu discurso cientfico prprio, tendo-se
transformado, sobretudo ao longo da segunda metade do sculo passado, num objeto distinto
daquele que conhecamos: os dicionrios so hoje predominantemente descritivos do uso da
lngua e da norma em uso8. na segunda metade do sculo XX que assistimos ao nascimento
da lexicografia baseada em corpus.
Comparando o mtodo de corpus (corpus method) com o mtodo de citaes, Svensn
(2009: 44-45) destaca as seguintes diferenas fundamentais:
- o mtodo de corpus permite a quantificao, ao passo que, ao utilizar o mtodo de
citaes, existe uma seleo quer dos textos, quer das citaes que so extradas e dos
prprios itens lexicais;

PLAT

V. 2. N.3

2013

41

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
- o mtodo de corpus fornece informao sobre os aspetos tpicos e centrais da lngua,
dado o grande nmero de fenmenos lingusticos frequentes que o corpus geralmente inclui,
enquanto o mtodo de citaes, criado mediante seleo deliberada de dados, pode tender a
enfatizar usos invulgares e perifricos das palavras.
Tambm Atkins & Rundell (2008: 52), ao enumerarem as desvantagens do mtodo de
citaes, colocam a nota no carter subjetivo que preside seleo das citaes e referem que
j Noah Webster e James Murray tinham observado que human readers tend to notice what is
remarkable and ignore what is typical, and this creates a bias towards the novel or the
idiosyncratic usages which inevitably catch the readers eye.
Deste modo, o mtodo de corpus permite que o dicionrio seja representativo da lngua
em uso e a sua representatividade passa a assentar na prpria representatividade do corpus,
permitindo em simultneo adotar critrios de maior objetividade no processo lexicogrfico.
Em nosso entender, so trs as grandes mudanas que a lexicografia baseada em corpus
trouxe aos dicionrios: a representatividade do vocabulrio descrito, a natureza da
exemplificao usada e, por fim, a descrio da variao lingustica e da norma.
A primeira grande mudana tem a ver com a representatividade do vocabulrio descrito.
Numa lexicografia baseada em corpus, as palavras no podem ser inseridas na nomenclatura
do dicionrio apenas com base na introspeo, nos dados dos corpora de citaes ou das fontes
secundrias, mas sim com base em critrios mais objetivos e passveis de serem aplicados com
rigor, que vo da frequncia de ocorrncia de um item no corpus sua representatividade no
tipo de discurso cujo vocabulrio se pretende retratar. Deste modo, os bons dicionrios de hoje
so representativos de fatias bem delimitadas do lxico de uma lngua, primeiramente
balizadas pelo prprio corpus, pela sua representatividade e balanceamento.
A segunda mudana prende-se com o tipo de exemplificao do uso das unidades
lexicais que feita. Os dicionrios modernos no apresentam apenas abonaes (excertos
retirados do corpus de citaes destinados a validar ou a indicar o bom uso das palavras),
mas, sim, exemplos de uso, retirados das mais diversas fontes includas no corpus e
destinados, sobretudo, a dar conta do uso efetivo, do uso real da lngua. Esses exemplos
podem ser completamente autnticos (retirados do corpus como tal, como acontece no projeto
COBUILD), ou podem ser editados e trabalhados pelo lexicgrafo para melhor servirem os seus
objetivos. Os exemplos de uso so um complemento das demais informaes associada
unidade lexical, veiculando aspetos gramaticais, colocacionais, enciclopdicos e culturais, entre
outros, facilitando o uso efetivo dos itens lexicais em novos contextos.
A terceira diferena importante entre os dicionrios baseados em corpus e os seus
antepassados que, sendo o corpus constitudo por textos representativos de diversos registos
lingusticos, os dicionrios de hoje tm a preocupao de retratar a variao lexical, no apenas
a variao diatpica e a diacrnica como j ocorria, de resto, ainda que de forma
assistemtica , mas tambm a variao diastrtica e a diafsica. Se, nas nossas sociedades,
os dicionrios veiculam a norma e se os dicionrios baseados em corpus apresentam as
caratersticas anteriormente enunciadas (representatividade, exemplificao e respeito pela
variao), o prprio conceito de norma que veiculado pelo dicionrio que diverge da dos
seus antepassados: a norma veiculada pelo dicionrio baseado em corpus a norma baseada
no uso efetivo da lngua embora apenas nos registos includos no corpus tomado como
referncia e j no uma norma idealizada, centrada apenas numa seleo feita pelo
lexicgrafo, tipicamente com critrios subjetivos e feita apenas a partir dos registos literrio e
formal.

42

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
Como temos vindo a demonstrar, lexicografia e lingustica de corpus esto intimamente
ligadas. Por outro lado, existe tambm uma ntima relao entre lexicografia baseada em
corpus e lexicografia de aprendizagem (L2 lexicography), visto que os primeiros grandes
projetos de lexicografia baseada em corpus se destinavam em primeiro lugar a estudantes de
lngua, particularmente de lngua estrangeira; dicionrios de lngua materna e dicionrios
bilingues usaram corpora um pouco mais tarde9. O exemplo pioneiro e mais tpico do dicionrio
baseado em corpus o Collins COBUILD English Language Dictionary, publicado pela primeira
vez em 1987.
Apesar dos muitos desenvolvimentos que a lexicografia baseada em corpus tem
conhecido a nvel internacional, a verdade que existe a este respeito um longo caminho a
percorrer pela lexicografia do portugus. Para a lngua portuguesa, o nico dicionrio
inteiramente baseado em corpus de que temos conhecimento o Dicionrio de Usos do
Portugus do Brasil, de Francisco da Silva Borba, tambm conhecido como DUP, com primeira
edio em 2002, que, de acordo com a informao disponvel, foi confecionado com base num
largo corpus escrito de mais de 200 milhes de palavras do portugus brasileiro
contemporneo.
Em Portugal, verifica-se que o Dicionrio da Lngua Portuguesa Contempornea usa
exemplos retirados do Corpus de Referncia do Portugus Contemporneo, embora a extenso
e a forma desse processo no sejam explicitadas na informao existente sobre o dicionrio.
Alm do corpus, este dicionrio foi construdo a partir de fontes secundrias e de ficheiros de
citaes elaborados especificamente para completar a informao recolhida no corpus.
Os atuais dicionrios de lngua portuguesa usam sobretudo fontes secundrias,
particularmente dicionrios existentes, cujos dados so completados e atualizados com recurso
seja a corpora de citaes, seja a corpora em sentido pleno. Porm, na maioria dos grandes
dicionrios da lngua portuguesa, quer portugueses, quer brasileiros, no jamais explicitada
a relao que mantm com os corpora. o caso de grandes dicionrios como o Michaelis
(Michaelis Moderno Dicionrio da Lngua Portuguesa, 1998), o Aurlio (Dicionrio Aurlio da
Lngua Portuguesa, j na 5. edio, publicada em 2010, que traz verso impressa e
eletrnica), o Houaiss (Dicionrio Houaiss da Lngua Portuguesa, 2009, tambm em verso
impressa e eletrnica), ou o Grande Dicionrio da Lngua Portuguesa, 2. ed., da Porto Editora,
de 201010.
Tambm os vocabulrios ortogrficos oficiais mais recentes recorrem sobretudo a fontes
secundrias, particularmente vocabulrios j existentes, socorrendo-se dos corpora apenas
para atualizao e completamento dos dados. o caso do Vocabulrio Ortogrfico da Lngua
Portuguesa, 5. ed., da Academia Brasileira de Letras (VOLP), e tambm do Vocabulrio
Ortogrfico do Portugus (VOP), baseado principalmente no Vocabulrio da Lngua Portuguesa,
de Rebelo Gonalves, na sua edio de 1966. Ambos os vocabulrios, VOLP e VOP, esto a ser
integrados no VOC.
A realizao do VOC com a metodologia esclarecida neste trabalho constituir um
avano na lexicografia baseada em corpus de lngua portuguesa.

9
10

Cf. TEUBERT, 2001 e SVENSN, 2009: 45-47.


Para uma retrospetiva da lexicografia de lngua portuguesa, cf. Correia 2009.

PLAT

V. 2. N.3

2013

43

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

3 - O papel dos corpora para a avaliao e o


estabelecimento do padro
Alm de os corpora terem um importante papel em grandes projetos lexicogrficos
orientados por uma metodologia emprica, considera-se que a palavra seja a principal unidade
de anlise dos estudos realizados em lingustica de corpus, dada a facilidade de sua
identificao pelas ferramentas computacionais (VIANA, 2011). Em projetos envolvendo o
lxico, a palavra praticamente a porta de entrada para a anlise de corpus, ou, como afirma
Calzolari (1997), all Language Engineering applications require knowledge about words. No
sem razo, pois, que projetos e atividades de pesquisa situados no mbito do lxico tenham
no corpus seu maior aliado.
A moderna noo de corpus tambm carrega consigo requisitos que devem ser tidos em
conta num projeto de corpus. So eles: representatividade (representativeness),
balanceamento (balance), diversidade (diversity) e tamanho (size)11.
De entre todos esses requisitos, a representatividade crucial, tendo em conta que um
corpus representativo tende a ser bem balanceado, ter boa diversidade e tamanho adequado
aos objetivos da pesquisa. Assim, para a construo do VOC12, especial ateno foi dada
representatividade, j que o vocabulrio ortogrfico dever servir como importante
instrumento de normalizao lexical do portugus.
Quanto ao caso especfico das variedades menos representadas do portugus, h que
levar em conta a discrepncia entre as condies lingusticas do portugus no conjunto dos oito
pases membros da CPLP: Angola, Brasil, Cabo Verde, Guin-Bissau, Moambique, Portugal,
So Tom e Prncipe e Timor-Leste.
Com exceo de Portugal e Brasil, que j tm corpora, grandes dicionrios tradicionais
(instrumentos lingusticos que permitem a construo e so muitas vezes a base de
vocabulrios ortogrficos) e que so pases onde o portugus a lngua mais usada, os demais
pases (Angola, Cabo Verde, Guin-Bissau, Moambique, So Tom e Prncipe e Timor-Leste)
vivem uma situao lingustica bastante diferente, uma vez que grande parte dos seus
cidados no tem o portugus como primeira lngua.
Observe-se, na Tabela 1, a quantidade de lnguas que convive com o portugus nos
Pases Africanos de Lngua Oficial Portuguesa (PALOP) e em Timor-Leste, numa lista
necessariamente incompleta dada a inexistncia de consenso em relao s lnguas faladas em
cada pas e, em alguns casos, falta de dados e de estudos recentes. Apresenta-se, tambm,
na mesma tabela, a populao aproximada de cada pas e o ano de sua independncia, para se
ter uma noo um pouco mais ampla do cenrio lingustico, demogrfico e poltico no qual se
insere este projeto do VOC.

11
12

44

MCENERY & WILSON, 1996; KENNEDY, 1998; BIBER et al., 1998; RENOUF, 1998; SINCLAIR, 2005.
A constituio dos corpora para a elaborao do VOC ser detalhada na parte 4.2.

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

Tabela 1: Lnguas faladas nos PALOP e em Timor-Leste, alm do portugus

Tendo em vista, pois, este cenrio, antes de se pensar em constituir vocabulrios


nacionais de cada um desses pases, preciso primeiro constituir os corpora que representem,
de facto, a norma lexical de cada um deles, corpora que incluam tanto palavras comuns a todos
ou a alguns pases como aquelas que so especficas de apenas um deles.
Alm desse aspeto, foi preciso ter em conta que os corpora compilados fossem
comparveis em tamanho, em distribuio por gneros e em relao ao peso de cada um dos
gneros no conjunto final16, de modo que o VOC, depois de pronto, evidenciasse uma gesto
poltica de lngua descentralizada, despolarizada (saindo do eixo Portugal e Brasil) e com
participao ativa de todos os estados-membros da CPLP.
Critrios iniciais que orientaram a seleo dos textos a incluir nos corpora para o VOC
foram: i) textos escritos e em contexto formal; ii) prioridade para textos j em formato digital.
A partir da, iniciou-se um trabalho coletivo, contando com a cooperao das equipas nacionais
de cada pas, de forma a estabelecer as caractersticas dos corpora. A partir dessas primeiras
decises, foram-se desenhando os corpora, de modo a atender o principal requisito, a
representatividade.

Independncia de Portugal.
Fim da ocupao indonsia.
15
As informaes foram obtidas no portal da CPLP (http://www.cplp.org/); nos portais dos respectivos governos
(Angola
http://www.governo.gov.ao/;
Cabo
Verde
http://www.governo.cv/;
Guin-Bissau
http://www.anpguinebissau.org/; Moambique - http://www.portaldogoverno.gov.mz; So Tom e Prncipe http://www.presidencia.st/; Timor-Leste http://timor-leste.gov.tl) e na Wikipdia, especificamente para conferir os
dados populacionais. No caso de Timor-Leste, foi tambm consultado Batoro e Casadinho (2009).
16
ALMEIDA & FERREIRA, 2012.
13
14

PLAT

V. 2. N.3

2013

45

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
Ser representativo significa que um corpus deve ser elaborado de forma a espelhar
determinadas caractersticas lingusticas da comunidade cuja lngua est sob anlise17. Da a
importncia de se fazerem escolhas adequadas para que o corpus possa realmente refletir
comportamentos lingusticos. Algumas questes devem ser postas durante a seleo dos
textos: que documentos, que tipos de textos, que gneros textuais? Enfim, o que de facto
representa os usos lingusticos de uma comunidade? No caso dos corpora para o VOC, a
pergunta teve de ser ainda mais especfica: quando se escreve em portugus num contexto
formal nesses pases, que palavras so empregadas?
Diretamente associado representatividade, est o conceito de balanceamento. Embora
seja um conceito vago, de acordo com Sinclair (2005), preciso ter em mente que o corpus
deve ter um equilbrio entre gneros discursivos (informativo, cientfico, etc.), tipos de textos
includos (artigo, editorial, entrevista, dissertao, etc.), temas (pesca, agricultura, sade,
educao, etc.), ou at mesmo ttulos, ou autores. O ideal seria que se conseguisse levar em
conta todas essas categorias, mas sempre atendendo s demandas do objetivo que se
pretende atingir.
Se o corpus for cuidadosamente balanceado, ele ter uma boa diversidade. A propsito
disso, Biber et al. (1998:248) assinalam que dado que there are important differences in the
use of lexical, grammatical and discourse features across different varieties of language, h
argumentos para afirmar que o conceito de lngua geral hipottico, dado que cada gnero
discursivo tem seus prprios padres de uso. Nesse sentido, um corpus representativo deve
conter uma grande diversidade de gneros, tipos de textos e assuntos, pois a frequncia de
muitas palavras pode variar de acordo com o assunto18.
Um corpus pensado para ser representativo, balanceado e diversificado tem, em geral,
um tamanho adequado ao tipo de pesquisa que se vai realizar e metodologia a ser adotada
na pesquisa19. Quando se fala em tamanho de corpus, no se trata somente do nmero total
de ocorrncias ou tomos (tokens) e de tipos (types, palavras diferentes), mas com quantas
categorias (gneros discursivos, tipos de textos, assuntos, ttulos, autores, etc.) um corpus
deve contar, quantas amostras de cada categoria e quantas palavras existem dentro de cada
amostra20. Assim, os corpora que esto sendo compilados nos PALOP e em Timor-Leste
atendem aos requisitos de representatividade, balanceamento, diversidade e tamanho acima
especificados).21
Todavia, para a gesto descentralizada de uma lngua pluricntrica, to importante
quanto esses requisitos o envolvimento de todas as equipas nacionais22 no projeto; afinal,
quem mais sabe responder s questes que devem ser feitas durante a seleo de textos para
compor um corpus so as equipas representativas desses pases.

17
18
19
20
21
22

46

SINCLAIR, 2005.
BIBER et al., 1998.
SINCLAIR, 2005.
KENNEDY, 1998.
Cf. detalhamento destes aspetos do projeto na parte 4.2.
Cf. ALMEIDA et al., 2013.

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

4 - O uso de corpora no VOC


Tendo em conta o que foi dito, os corpora assumem necessariamente um papel central
na criao de novos recursos lexicogrficos para a lngua portuguesa quando tomada como um
todo, como o caso do VOC, sendo o garante da validao dos dados constantes de obras
existentes e de que os dados novos so realmente representativos da lngua em uso nos vrios
pases.
Por um lado, pela sua natureza, herana e princpios metodolgicos, os dicionrios
existentes para o portugus so mais uma perpetuao da tradio lexicogrfica, ainda que em
alguns casos parcialmente atualizada, do que um verdadeiro repositrio atualizado das
palavras de facto em uso nos pases de lngua portuguesa, o que afeta a sua
representatividade. Por isso, uma primeira funo dos corpora no VOC a de validao dos
dados constantes da tradio lexicogrfica do portugus.
Alm disto, dado que a reforma ortogrfica no torna homognea a escrita de muitas
palavras com formas ortogrficas j antes divergentes (e.g. mido no Brasil, mas hmido
nos restantes pases), qualquer repositrio lexical multinacional para o portugus deve
identificar, marcar e ligar por meio de remisses as diversas variantes, o que s possvel
executar num curto espao de tempo recorrendo anlise semiautomtica das divergncias
entre corpora representativos de cada variedade.
Por ltimo, atendendo falta de cobertura lexicogrfica atual para muitas das
variedades nacionais do portugus e inexistncia de corpora representativos dessas
variedades, a criao e uso de tais recursos de base essencial para captar a realidade da
lngua escrita em contexto formal em cada pas e proceder sua integrao num recurso que
a represente, fixando a ortografia do seu lxico. Neste apartado, os corpora servem, pois, de
fonte primria para as entradas da obra em criao.

4.1 - O uso de corpora com recursos existentes


O VOC no ser, no entanto, e como j afirmado, constitudo unicamente por informao
constituda por corpora. De facto, como apontado na seco 2, o portugus dispe j de uma
longa tradio lexicogrfica, construda sobretudo nos ltimos dois sculos em Portugal e no
Brasil, que deu origem a um acervo extenso, ainda que no comparvel ao de outras lnguas
de idntica relevncia mundial.

PLAT

V. 2. N.3

2013

47

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
Por isso, o VOC ser constitudo por entradas com duas origens, que representaro duas
partes distintas da obra: uma, correspondente memria lexicogrfica do portugus,
composta pelas entradas dos vocabulrios ortogrficos oficiais j existentes; outra,
correspondente ao lxico obtido atravs da minerao de corpora, representativa do lxico
efetivamente em uso em todos os pases. A memria lexicogrfica do portugus ser
constituda por um subconjunto equilibrado das entradas do Vocabulrio Ortogrfico do
Portugus (VOP), produzido, sob a responsabilidade de Margarita Correia, pelo Instituto de
Lingustica Terica e Computacional e oficial em Portugal, e do Vocabulrio Ortogrfico da
Lngua Portuguesa, 5. ed. (VOLP), coordenado por Evanildo Bechara, da Academia Brasileira
de Letras. Ambas as obras so baseadas nas nomenclaturas de dicionrios existentes23, ainda
que os corpora venham a desempenhar um papel importante na integrao de ambos no VOC,
como se ver adiante.
Em qualquer obra desta natureza, que se proponha integrar informao provinda de
fontes vrias lexicogrficas e com caractersticas distintas, uma das principais tarefas passa
pela homogeneizao das entradas e pelo controlo da representatividade de cada uma delas,
equilibrando o resultado final. Um primeiro problema que a execuo do VOC levanta passa
pelo facto de que as obras a integrar na memria lexicogrfica do portugus tm caractersticas
diferentes quanto aos critrios lexicogrficos de incluso e de identidade lexical, alm de
diferentes dimenses e propriedades (o VOLP tem uma nomenclatura muito mais extensa que
o VOP, mas inclui muito menos informao para cada entrada). Este facto impossibilita, desde
logo, a integrao direta das duas obras lexicogrficas.
Para fazer face a estes problemas, o VOC foi planeado sobre a utilizao de uma
plataforma centralizada de edio lexicogrfica, que permite a homogeneizao das obras,
recorrendo a corpora para selecionar subconjuntos de dados. Foi escolhida pelo IILP a
plataforma usada pelo ILTEC na construo do VOC, o OSLIN24, pelo que as operaes a
executar incidem maioritariamente sobre o VOLP, ainda no adaptado a essa plataforma.
O OSLIN (sigla de Open Source Lexical Information Network, rede de informao lexical
de cdigo aberto) um conjunto de ferramentas e estruturas organizadas numa plataforma
digital desenhada com base em servios alojados na nuvem que permite a rpida criao de
recursos lexicais e a sua gesto e alargamento25. A plataforma contm ferramentas dedicadas
a diferentes funes, pensadas para serem usadas por lexicgrafos, que facilitam a gesto e a
criao, de forma integrada, a partir de um par forma de citao classe gramatical, de
entradas lexicais com outra informao formal associada: paradigma flexional, todas as formas
flexionadas, diviso silbica (para fins de translineao), acentuao, remisses para entradas
relacionadas (entre elas as variantes diatpicas decorrentes da aplicao do AO90, muito
relevantes no caso desta obra), relaes funcionais com outras entradas (e.g., todos os nomes
deverbais eventivos, nomes de qualidade e advrbios deadjetivais so associados
explicitamente) e, dentro em b reve, informao sobre a morfologia e a fontica26.

Para uma descrio do VOP, disponvel em http://www.portaldalinguaportuguesa.org/?action=vop, consulte-se


Correia e Ferreira [no prelo]. As fontes do VOLP no so referidas explicitamente na obra, embora, em comunicaes
pblicas dos seus autores, seja ponto assente que teve como base obras lexicogrficas do portugus.
24
JANSSEN, 2005.
25
Para uma descrio mais detalhada do sistema multivalente de edio e manuteno dos recursos lexicais do
OSLIN, consulte-se Ferreira et al. (2008) e a seco 4.2 do presente trabalho.
26
ASHBY & FERREIRA, 2010.
23

48

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
A integrao faseada do VOLP nesta plataforma encontra-se em fase de concluso. A
nomenclatura daquela obra foi primeiro importada para o sistema OSLIN, seguindo operaes
de equivalncia, desdobramento e sobreposio de classes gramaticais, tornando-as (e s
entradas que as contm) compatveis com as do VOC. Cada entrada do VOLP, agora j
adaptada aos critrios de identidade lexical e ao tagset27 do OSLIN, foi depois marcada como
estando ou no presente tambm no VOP, sendo validada automaticamente a sua incluso no
sistema nos casos em que tal se verificava.
O restante material lexical do VOLP est, neste momento, a ser sistematicamente
cruzado e integrado no VOC com base em intersees entre a obra e corpora existentes, de
modo a fasear o trabalho e a validar os dados. Em primeiro lugar, o VOLP foi cruzado com um
lxico computacional construdo a partir do crpus NILC28. Esse lxico foi primeiramente, tal
como o VOLP, adaptado estrutura lexical e categorial do VOC, depois de conformado com o
AO90, tarefa executada com recurso ao conversor Lince29 e a verificaes manuais por padro
atravs de expresses regulares correspondentes aos contextos em que, no portugus do
Brasil, existem potenciais mudanas.
Posteriormente, o VOLP foi tambm cruzado com o Corpus Brasileiro30 ; para tal, alm
das operaes indicadas acima, adicionalmente necessrio proceder lematizao dos
tomos constantes do corpus, sua etiquetagem morfossinttica e sua contagem e
ordenao por frequncia31.
Depois destas operaes preparatrias, que permitiram a criao de bases de dados
lexicais MySQL independentes para cada fonte, executado para cada uma delas o mesmo
pr-processamento computacional para os pares lemacategoria gramatical que foi feito para
o VOLP, usando ferramentas disponveis no sistema de administrao do OSLIN, de modo a
tornar os dados compatveis com os das outras bases de dados lexicais. A base de dados
contendo o VOLP j de acordo com o formato OSLIN ento fornecida, atravs de cruzamento,
com informao de frequncia obtida a partir do corpus, de modo a obter um subconjunto de
mais de 200 000 entradas do VOLP que estejam atestadas com suficiente frequncia. As
entradas a inserir no VOC esto, pois, sempre atestadas na fonte lexicogrfica de referncia, o
VOLP, e em corpora.

4.2 - O uso de corpora para constituio de novos recursos


Para as restantes variedades do portugus, no entanto, no possvel adotar este
procedimento acima descrito, dado que no existem ainda recursos lexicogrficos de referncia
que as representem. Cada um destes pases optou por uma de trs opes:
- criar autonomamente um recurso lexicogrfico representativo, a ser depois tratado de
acordo com o procedimento explicitado na parte 4.1 deste trabalho;
- constituir uma lista de palavras caractersticas de cada pas a adicionar base comum
entretanto constituda (que seria usada como corpus de excluso para pesquisa das formas
caractersticas de uma dada variedade);
27
28
29
30
31

Conjunto de etiquetas classificativas das palavras quanto s categorias gramaticais a que pertencem.
PINHEIRO & ALUSIO, 2003.
FERREIRA et al., 2012b.
SARDINHA et al., 2009.
O lxico do NILC j tinha sido alvo destas operaes, pelo que no foram, nesse caso, necessrias.

PLAT

V. 2. N.3

2013

49

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
- executar o trabalho de levantamento dos corpora, construindo de forma integrada no
OSLIN vocabulrios ortogrficos nacionais, tomando partido das suas ferramentas para a
rpida construo de recursos lexicais.
Seguindo as decises, no seio do IILP, dos representantes de todos os pases da CPLP,
que refletem, em boa medida, as concluses do exposto na parte 3 do presente texto, o
trabalho est a ser executado em alguns pases de acordo com a segunda proposta enunciada
acima, e noutros com base em corpora, seguindo a ltima das opes apresentadas. sobre o
trabalho destas equipas que se debrua esta seco. Seguindo uma metodologia comum32,
cada estado-membro da CPLP assegura a existncia de uma equipa nacional que executa, em
coordenao com a equipa central do projeto, as tarefas lexicogrficas necessrias
prossecuo do objetivo final.
Um primeiro problema para que isto seja possvel prende-se, no entanto, com a
inexistncia de corpora de referncia representativos das variedades nacionais desses pases.
O pouco trabalho de desenvolvimento feito nesse sentido d em geral conta, ademais, de
variedades sociais que no se coadunam com o carter dos recursos a criar, que se pretendem
representativos de variedades diafasicamente relacionadas com a escrita em contexto formal e
com a norma de cada pas.
A primeira e essencial tarefa do projeto tem passado, por isso, pela constituio de um
corpus de referncia para cada pas da CPLP que dele no disponha e se proponha executar
este trabalho. Como se justifica na parte 3 deste artigo, tal dever ser feito salvaguardando a
representatividade, o balanceamento, o tamanho e a diversidade, tendo ainda ateno
exequibilidade e custos, essenciais para permitir a rpida execuo do pretendido sem
demasiado elevados gastos com recursos humanos. Foi elaborado e aprovado pelos
representantes tcnicos dos vrios pases, em sede prpria, um conjunto de metas quanto a
tipos textuais, sua provenincia e o peso no resultado final.
Cada corpus nacional ter no mnimo 30 milhes de tomos, distribudos por
sub-corpora (cf. Fig. 1) com texto literrio (20%), jornalstico (25%), legislativo e de sesses
parlamentares (25%), tcnico (sade, educao, ambiente, pescas e agricultura: 25%) e de
provenincia variada (5%).

Fig. 1: Distribuio dos corpora do VOC por gneros textuais


32

50

ALMEIDA & FERREIRA, 2012.

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
Esta distribuio assegura que todos os pases possam ter as mesmas fontes, todas
passveis de serem obtidas desde logo em formato digital, de modo a reduzir o tempo de
execuo e o custo com recursos humanos que seria necessrio para processar texto noutros
suportes. Alm disso, garantiu-se que o material necessrio existe em todos os pases que
seguiram esta via, o que determinou os domnios de especialidade do sub-corpus tcnico
indicados acima.
Os textos so obtidos por cada equipa nacional em formato digital, renomeados
consoante o tipo e a origem da fonte e colocados numa estrutura de pastas hierarquizada num
servidor comum. Cada ficheiro depois processado pela equipa central, que o converte para
texto simples e sugere elementos no textuais a serem limpos, e pela equipa nacional, que
procede validao desse processamento e limpeza, num conjunto de operaes recursivas
em que cada equipa nacional a responsvel ltima pela qualidade do corpus representativo
da sua variedade. Posteriormente, cada texto dividido em extratos, que so anotados quando
provenincia e tipo, atomizado, lematizado, etiquetado e finalmente o seu material lexical
convertido num lxico de frequncia contendo forma de citao (correspondente ao lema),
classe de palavra e ndice de frequncia33.
Cada uma destas listas lexicais de frequncia depois inserida numa base de dados
prpria no sistema OSLIN, sendo ento assumida como lista de candidatos insero no VOC.
Todas as entradas j registadas no sistema, provindas da tradio lexicogrfica a partir dos
vocabulrios oficiais existentes, ou obtidas a partir dos vocabulrios ortogrficos nacionais j
construdos no mbito do projeto, so marcadas como estando atestadas para a variedade
nacional do pas cujo corpus est a ser processado, sendo atribudo a cada entrada um ndice
de frequncia nacional. Depois de definida uma linha de corte com base na frequncia e na
distribuio por sub-corpus, as entradas que no esto ainda atestadas so finalmente
inseridas no VOC por cada equipa nacional usando a plataforma de gesto do sistema.
Para este efeito, foi integrado na plataforma de gesto do OSLIN um mdulo de insero
em massa de entradas lexicais que permite gerar automaticamente todas as propriedades
formais de cada palavra, j indicadas na parte 4.1 do presente texto, a partir da forma de
citao e da categoria gramatical de cada candidato. Os lexicgrafos da equipa nacional de
cada pas, tal como acontece com as entradas obtidas a partir do VOP e do VOLP, verificam a
legitimidade da entrada e a correo das informaes geradas automaticamente pelo sistema,
definindo manualmente apenas o paradigma flexional de cada entrada, informao que no
pode ser aduzida pelo sistema34.
Cada palavra constante do VOC marcada explicitamente quanto sua provenincia e
quanto s fontes e pases em que se encontra atestada, sendo as propriedades formais de cada
entrada acompanhadas desta informao e, nos casos em que esteja disponvel, do seu ndice
de frequncia e das variantes j atestadas no Vocabulrio. Est em desenvolvimento um
mdulo adicional do OSLIN que permite a identificao semiautomtica de variantes, que
facilitar a difcil tarefa de registar todas as remisses correspondentes variao nacional
existente entre pases, quer a resultante da aplicao das regras do AO90, nos casos em que
permite variao, quer a que no decorre da sua aplicao, dado que este no unifica a grafia
do portugus, mas apenas a enunciao das suas regras35.

Para uma descrio detalhada do processo seguido, consultar Almeida & Ferreira (2012) e Ferreira et al. (2012a).
Para uma descrio detalhada deste mdulo, consultar Janssen (2011).
35
Para uma descrio detalhada do processo de constituio do VOC e das funes das suas equipas, cf. Almeida
et al. (2013) ou Ferreira et al. (2012a).
33
34

PLAT

V. 2. N.3

2013

51

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

6 - Referncias bibliogrficas
ALMEIDA, G. M. B.; FERREIRA, J. P. 2012. Manual para a elaborao de corpora. Com vista
organizao dos Vocabulrios Ortogrficos Nacionais dos pases integrantes da CPLP. Lisboa
(Portugal): ILTEC; So Carlos (SP, Brasil): NILC.
ALMEIDA, G. M. B.; FERREIRA, J. P.; CORREIA, M.; OLIVEIRA, G. M. 2013. Vocabulrio
Ortogrfico Comum (VOC): constituio de uma base lexical para a lngua portuguesa. In:
Estudos Lingusticos, 42 (1): p. 204-215.
ASHBY, S.; FERREIRA, J. P. 2010. The Role of Morphology in Generating High-Quality
Pronunciation Lexica for Regional Variants of Portuguese. In: Branco, A., Klautau, A.; Vieira, R.;
Lima, V. L. S. de; Pardo, T. A. S. (eds.). Computational Processing of the Portuguese Language
Lecture Notes in Artificial Intelligence, v. 6001. Berlin Heidelberg Springer-Verlag: 162-165.
ATKINS, B. T. S.; RUNDELL, M. 2008. The Oxford Guide to Practical Lexicography. Oxford:
Oxford University Press.
BATORO, H.; CASADINHO, M. 2009. O portugus, uma lngua pluricntrica: o caso de
Timor-Leste. In: Revista Portuguesa de Humanidades, Estudos Lingusticos, 13-1. Braga:
Universidade Catlica Portuguesa de Braga, 63-79. Disponvel em:
<http://www.catedraportugues.uem.mz/lib/docs/bib_timor/Batoreo_Casadinho_2009.pdf>.
Acesso em 12 ago 2012.
BIBER, D.; CONRAD, S.; REPPEN, R. 1998. Corpus Linguistics Investigating Language
Structure and Use. Cambridge, U.K.: Cambridge University Press.
CALZOLARI, N. 1997. Lexicon and Corpus: a multi-faceted interaction. In: Lxic, corpus i
diccionaris. Cicle de conferencies 95-97. Barcelona: Institut Universitari de Lingistica
Aplicada.
CORREIA, M. 2008. Lexicografia no incio do sculo XXI novas perspectivas, novos recursos
e suas consequncias. In: Jnior, M. A. (coord.) Lexicon Dicionrio de Grego-Portugus, Actas
de Colquio. Lisboa: Centro de Estudos Clssicos / FLUL, pp. 73-85.
CORREIA, M. 2009. Os dicionrios portugueses. Lisboa: Caminho.
CORREIA, M.; FERREIRA, J. P. 2013. Dicionrios e vocabulrios ortogrficos na constituio da
norma. In: Moita Lopes, L. P. (ed.). O Portugus no Sculo XXI. So Paulo: Parbola.
CORREIA, M.; FERREIRA, J. P. [no prelo]. Vocabulrio Ortogrfico do Portugus Correia,
Margarita e Ferreira, Jos Pedro (no prelo). In: Actas del 5. Congreso Internacional de
Lexicografa Hispnica, Madrid, 25-27 de junho de 2012.
FERREIRA, J. P.; BARBOSA, S.; JANSSEN, M. 2008. Mordebe Admin: A Lexical Management
System. In: Proceedings of the XIII EURALEX International Congress. Barcelona: Institut
Universitari de Lingstica Aplicada - Universitat Pompeu Fabra; Documenta Universitaria:
351-357.

52

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
FERREIRA, J. P.; JANSSEN, M.; ALMEIDA, G. M. B.; CORREIA, M.; OLIVEIRA, G. M. 2012. The
Common Orthographic Vocabulary of the Portuguese Language: a set of open lexical resources
for a pluricentric language. In: CALZOLARI, N.; CHOUKRI, K.; DECLERCK, T.; DOAN, M. U.;
MAEGAARD, B.; MARIANI, J.; ODIJK, J.; PIPERIDIS, S. (eds.). Proceedings of the Eight
International Conference on Language Resources and Evaluation (LREC'12). Istanbul:
European Language Resources Association (ELRA): 1071-1075.
FERREIRA, J. P.; LOURINHO, A.; CORREIA, M. 2012. Lince, an End User Tool for the
Implementation of the Spelling Reform of Portuguese. In: Caseli, H. M.; Villavicencio, A.;
Teixeira, A. J. S.; Perdigo, F. (eds.). Computational Processing of the Portuguese Language 10th International Conference, PROPOR 2012 Proceedings. Lecture Notes in Computer Science
7243. Springer: 46-55.
JANSSEN, M. 2005. Open Source Lexical Information Network. In: BOUILLON, P.; KANZAKI, K.
(eds.). Proceedings of the Third International Workshop on Generative Approaches to the
Lexicon, May 19-21 2005. Genebra: cole de Traduction et dInterpretation Universit de
Genve.
JANSSEN, M. 2011. Computer-Aided Inflection for Lexicography Controlled Lexica. In: KOSEM,
I.; KOSEM, K. Electronic Lexicography in the 21st Century New Applications for New Users
Proceedings of eLex 2011. Liubliana: Trojina, Institute for Applied Slovene Studies: 96-105.
KENNEDY, G. 1998. An Introduction to Corpus Linguistics. Londres / Nova Iorque: Longman.
LARA, L. F. 1997. Teora del diccionario monolinge. Mxico: El Colegio de Mxico.
MCENERY, T.; WILSON, A. 1996. Corpus linguistics. Edinburgh: Edinburgh University Press.
MURAKAWA, C. A. A. 2001. Tradio lexicogrfica em lngua portuguesa. In: OLIVEIRA, A. M.
P.; ISQUERDO, A. N. (eds.). As cincias do lxico: lexicologia, lexicografia e terminologia, 2.
ed., Campo Grande: Ed. UFMS, 153-159.
MURAKAWA, C. A. A. 2006. Antnio de Morais Silva: lexicgrafo da lngua portuguesa.
Araraquara: Laboratrio Editorial FCL/UNESP; So Paulo: Cultura Acadmica Editora.
PINHEIRO, G. M.; ALUSIO, S. M. 2003. Crpus NILC: descrio e anlise crtica com vistas
ao projeto Lacio- -TR-03-03. Disponvel em:
<http://www.nilc.icmc.usp.br/lacioweb/downloads/NILC-TR-03-03.zip>. Acesso em 8 set
2013.
Rebelo Gonalves, F. 1966. Vocabulrio da Lngua Portuguesa. Coimbra: Coimbra Editora.
RENOUF, A. (ed.) 1998. Explorations in Corpus Linguistics. Amsterdo: Rodopi.
SARDINHA, T. B.; MOREIRA FILHO, J. L.; ALAMBERT, E. 2009. The Brazilian Corpus: A
one-billion word online resource. In: MAHLBERG, M.; GONZLEZ-DAZ, V.; SMITH, C. (Eds.).
Proceedings of the Fifth Corpus Linguistics Conference, CL2009, University of Liverpool,
20-23 July 2009.
SINCLAIR, J. 2005. Corpus and Text Basic Principles. In: WYNNE, M. (Ed.). Developing
Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbow: 1-16. Disponvel em:
<http://ota.ahds.ac.uk/documents/creating/dlc/chapter1.htm>. Acesso em 12 ago 2013.
PLAT

V. 2. N.3

2013

53

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.
SVENSN, B. 2009. A Handbook of Lexicography
Dictionary-Making. Cambridge: Cambridge University Press.

The

Theory

and

Practice

of

TEUBERT, W. 2001. Corpus Linguistics and Lexicography. International Journal of Corpus


Linguistics, 6 (special issue), 125153.
VIANA, V. 2011. Lingustica de corpus: conceitos, tcnicas & anlises. In: Ed. VIANA, V.;
TAGNIN, S. E. O. Corpora no ensino de lnguas estrangeiras. So Paulo: Hub Editorial.

54

PLAT

V. 2. N.3

2013

O USO DE CORPORA PARA CONSTITUIO DE RECURSOS


LEXICOGRFICOS DE REFERNCIA: O CASO DO VOC
Jos Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia.

PLAT

V. 2. N.3

2013

55

CONSIDERAES AO COMPUTS: COMO


A ADOBE ADAPTA-SE S NOVAS
TENDNCIAS DO PORTUGUS NA INTERNET
E NO MUNDO DIGITAL

Guta Ribeiro
Sobre o autor
Adobe Systems, Inc., Sr. Group Program Manager.
Contato: gutarib@adobe.com

Resumo
Uma das reas de pesquisa mais interessantes para o grupo de globalizao da Adobe
Systems o impacto das redes sociais e da internet no nosso trabalho de localizao. E, para
mim, as consequncias para o portugus e as novas tendncias da lngua na internet. O
computs seria uma referncia ao portugus usado na rea da informtica, uma variao
usada pelas comunidades de tradutores na internet para atender a necessidade de acesso
rpido informao num mundo tecnolgico em constante mudana. Neste trabalho, pretendo
1) mostrar algumas alternativas em localizao que a Adobe tem lanado com o fim de alcanar
o melhor resultado possvel para nossos clientes lusfonos em tempo real; 2) abordar as
estratgias de implementao desses projetos; 3) fazer uma avaliao dos mesmos e uma
anlise do impacto, negativo e positivo, que esses projetos j demonstraram para a Adobe e,
finalmente, 4) mencionar planos futuros.

Palavras-chave
Internets, Computs. Adobe. Adobe systems. Globalizao. Localizao.

56

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Abstract:
Computs: How Adobe Adapts to the New Varieties of Portuguese Found on the
Internet in a Digital World
One of the most interesting areas of research for the Globalization team at Adobe Systems is
the impact that social networks and the Internet have on our localization work. Furthermore,
for me, the consequences for the Portuguese language and the new varieties of Portuguese
found on the Internet. Computs refers to the Portuguese language found on the Internet;
variations used by the communities of translators online, aiming to keep up with quick access
to information in an ever changing technological world. On this paper, I intend to 1)
demonstrate some localization alternatives used by Adobe seeking to get the best possible
results for our Portuguese-speaking customers in real time; 2) speak about the strategies used
to implement these projects; 3) evaluate the projects and analyze how these projects have
already impacted our work positively and negatively and, finally, 4) touch on some next steps.

1 - Introduo
A Adobe Systems realiza diversos tipos de trabalho de localizao, utilizando diferentes
tipos de ferramentas e tcnicas, algumas tradicionais e outras modernas. Hoje, vou discutir
apenas alguns dos nossos processos, que devem ser de interesse particular. Tenham em
mente, entretanto, que esta apenas uma faceta do processo completo de localizao da
Adobe.
Somos membros da TAUS (Translation Automation User Society) e membros fundadores
da TAUS Data Association, cujo foco melhorar a qualidade da traduo, baseando-se em
dados estatsticos. Nosso grupo est frente dos novos desenvolvimentos nesta rea e
tentamos liderar o mercado com a adoo de novas tecnologias.
Atualmente, a Adobe Systems trabalha com cinco mquinas de traduo: ProMT,
Language Weaver, Systran, Moses e CCID (para Chins Simplificado). Moses uma nova
tecnologia para desenvolver mquinas de traduo. As mquinas desenvolvidas atravs do
pacote Moses so chamadas mquinas Moses. Utilizamos todas estas mquinas para
pr-traduzir aplicativos, documentao, pginas de web, material de marketing etc., em vrios
idiomas.
Alm do uso de mquinas de traduo acima citadas, terceirizamos o trabalho de
traduo, ps-edio, teste, trabalhando com os nossos parceiros de localizao mundialmente
usados pela indstria de localizao.
A Adobe, como lder no fornecimento de solues que permitem aos clientes produzir,
distribuir e lucrar com a criao de contedo para a mdia e publicaes ou para marketing
digital, tem investido nos setores educacional, servios financeiros e governo nas comunidades
dos pases de lngua portuguesa.
A lngua portuguesa na internet hoje a quinta lngua mais utilizada na rede mundial de
computadores. O desafio da Adobe conseguir manter a consistncia lingustica dos termos
entre todos os produtos da Adobe e, ao mesmo tempo, atender a demanda do mercado que
exige produtos localizados o mais rapidamente possveis, com qualidade, e baixo custo.
PLAT

V. 2. N.3

2013

57

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S


NOVAS TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Atualmente, a Adobe produz 20 aplicativos de SaaS (Software as a Service, ou On


Demand software aplicativos como servio ou aplicativo por demanda). Estes produtos tm
um ciclo de lanamento bastante rpido at semanais e so na maioria das vezes gratuitos.
No intuito de cumprir o cronograma de lanamento dos produtos e, ao mesmo tempo,
preencher os nossos requisitos de internacionalizao e preservar a consistncia lingustica
entre os produtos da Adobe, usamos vrias ferramentas prprias, outras terceirizadas, e
estamos sempre pesquisando novas estratgias em localizao gil.
Uma das reas de pesquisa mais interessantes para o grupo de globalizao da Adobe
Systems o impacto das redes sociais e da internet no nosso trabalho de localizao. E, para
mim, as consequncias para o portugus e as novas tendncias da lngua na internet.
Neste trabalho, pretendo 1) mostrar algumas alternativas em localizao que temos
lanado com o fim de alcanar o melhor resultado possvel para nossos clientes lusfonos em
tempo real; 2) abordar as estratgias de implementao desses projetos; 3) fazer uma
avaliao dos mesmos e uma anlise do impacto que esses projetos j demonstraram para a
Adobe e, finalmente, 4) mencionar planos futuros.

2 - Consideraes Iniciais
Minha apresentao no tratar dos assuntos da transcriao. Na transcriao, os
tradutores possuem autoria criativa e plena liberdade sobre o texto. Este mtodo usado
quando o departamento de marketing deseja transmitir uma mensagem especfica com
clareza, independente de consideraes culturais e lingusticas. Este tipo de linguagem muito
usado na localizao de publicidade, piadas, slogans ou em situaes onde necessrio o
entendimento claro com o cliente.
Veja abaixo como o stio da Adobe Brasil faz a transcriao do termo My Adobe. Meu
suporte foi escolhido pelo escritrio da Adobe Brasil como o termo mais apropriado para este
mercado.

Tampouco vou abordar temas como as palavras novas do tipo blog, post, face, chat
etc., assim como as contraes que apareceram com os chats, como d+, vc, pls, qq etc., ou
a tendncia de retirada de acentos, cedilhas, e at das pontuaes em geral, relacionados ao
internets. Para mim, como linguista, as consequncias para o portugus e as novas
tendncias da lngua na Internet so temas fascinantes1.

58

Cf. RIBAS et al., 2007.

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Abaixo, alguns exemplos interessantes do internets encontrados na web:

Yahoo Brasil

Google Brasil
Note-se, em Chat Salas de Bate-Papo, a redundncia no uso de ambos, o termo em
ingls chat e a sua traduo.
Na Adobe, acreditamos que a compreenso, com clareza, vital. Se a forma original do
termo for melhor compreendida quando mantida no original, ento devemos usar a forma
original. Bitmap, hamburger, hot dog, download, display, flat, lobby, home theater,
Flex, so termos to comuns que se comearmos a traduzir ficam incompreensveis. A lngua
viva! Os computadores e a comunicao global s fizeram acelerar a evoluo.
Adotamos o que gostaria de chamar o computs: uma referncia ao portugus usado
na rea da informtica, uma variao usada pelas comunidades locais de usurios e de
tradutores na internet para atender a necessidade de acesso rpido informao num mundo
tecnolgico em constante mudana.
Alguns exemplos do computs seriam:

IBM Brasil

www.baboo.com.br/

PLAT

V. 2. N.3

2013

59

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S


NOVAS TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Finalmente alguns exemplos retirados dos glossrios da Adobe Systems:

Ingls

Portugus

anti-aliasing

antialiasing

anti-spyware

antispyware

multi-threading

multithreading

multi-spin

multispin

pre-release

pr-release

pre-roll

pr-roll

1. pr-roll = tem a ver com a veiculao online de anncios antes/durante/depois da exibio


de algum video.
2. antialiasing = suavizao de borda - se refere a Photoshop, Illustrator, Flash, Fireworks.
3. multicore = em geral se refere a um computador com vrios ncleos de processamento (dual
core, por exemplo).
4. multithreading = em geral, tem a ver com processamento do computador.
Note-se que, apesar dos termos terem sido mantidos no ingls, eles obedecem as regras
de acentuao e da reforma ortogrfica de 9 de maio de 2011.

3 - Desenvolvimento
Para demonstrar algumas iniciativas de sucesso envolvendo as comunidades locais como
tradutores, damos preferncia a estes indivduos da comunidade 1) por serem usurios experts
dos softwares da Adobe; 2) por serem voluntrios; 3) pelo seu comprometimento em colaborar
rapidamente com tradues e/ou comentrios que melhoram a qualidade dos produtos da
Adobe. Abordarei trs exemplos de ferramentas alternativas de traduo usadas na web e
mostrarei como tornamos simples para a comunidade ter acesso a estes stios da Adobe e
contribuir com tradues ou colaborar com suas ideias.
O Business Catalyst, um aplicativo SaaS, que tem desenvolvimento gil, uma
plataforma de hospedagem na web, um catalisador que ajuda aumentar o seu negcio atravs
da construo, marketing, venda e suporte de pginas na web. BC traduzido atravs do
projeto Adobe Translator - https://community.translate.adobe.com. CTT uma ferramenta de
traduo comunitria, que permite que tradutores voluntrios em todo o mundo possam
traduzir a interface do aplicativo.

60

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Em junho de 2011, Business Catalyst foi colocado no Adobe Translator em cinco lnguas,
para efeito de reviso pela comunidade local de usurios. Alm de analisar as lnguas j
includas no produto, a comunidade teve a oportunidade de fornecer tradues para outros
idiomas dinamarqus, italiano, holands, portugus do Brasil, romeno e esloveno. O que
aconteceu ao longo dos meses foi um exemplo clssico de contribuies surpreendentes e
slidas. A Adobe pretende abrir, cada vez mais, projetos para a comunidade, permitindo no s
reviso, mas tambm traduo para um nmero cada vez maior de idiomas.
A metodologia usada a seguinte: aps internacionalizao do produto e integrao com
o CTT, usamos traduo automtica (feita atravs das mquinas citadas acima) e oferecemos
os termos da interface do produto comunidade atravs do stio:
https://community.translate.adobe.com/:
Em primeiro lugar, necessrio criar um Adobe ID:

https://community.translate.adobe.com
Depois de selecionar o produto e a lngua, se pode comear o trabalho de traduo:

https://community.translate.adobe.com
PLAT

V. 2. N.3

2013

61

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S


NOVAS TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Para cada termo ou frase usada na interface, se abre um campo onde o tradutor da
comunidade oferece sua traduo. Os termos entrados pela comunidade sero indicados para
reviso pelo lder ou moderador da comunidade para este produto. Aps reviso, sero
incorporados aos glossrios da Adobe.
O ciclo de contribuio pela comunidade o seguinte:

Ciclo de contribuio pela comunidade


A viso da Adobe transformar CTT numa plataforma aberta comunidade local,
alinhando a localizao de produtos da Adobe com as necessidades reais do mercado. Num
futuro bem prximo, ser a soluo padro para a localizao dos aplicativos da Adobe
chamados Touch Apps Photoshop Touch, Adobe Ideas etc.
Atualmente, os produtos que esto disponveis para traduo atravs do CTT so:

Adobe Nav;

Adobe Story;

Adobe Translator;

Business Catalyst;

Photoshop (apenas para a comunidade de pr-release);

Flex SDK;

Muse.

62

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Para maiores informaes sobre os ltimos acontecimentos do CTT, pode-se consultar o


grupo no Facebook: http://www.facebook.com/adobe.community.translation.
O segundo exemplo de como a Adobe envolve a comunidade nos projetos de localizao
o projeto Adobe TV http://tv.adobe.com/translations/ de traduo comunitria, que
amplia o alcance do contedo, permitindo que tradutores voluntrios em todo o mundo possam
traduzir vdeos instrutivos em qualquer idioma.

http://tv.adobe.com/translations/
Assim que o usurio se inscreve como tradutor da Adobe, passa a escolher os
programas que deseja traduzir no idioma selecionado.
Alguns exemplos de tradues feitas pelas comunidades do portugus do Brasil abaixo:

PLAT

V. 2. N.3

2013

63

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S


NOVAS TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

http://tv.adobe.com/translations/
Para demonstrar o sucesso da Adobe TV, veja abaixo o nmero de participaes na
Adobe TV at 8 de abril de 2012:

http://tv.adobe.com/translations/

64

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Como mostra o quadro, o portugus do Brasil est includo entre os dez idiomas mais
traduzidos na Adobe TV.
Meu terceiro e ltimo exemplo o nosso Blog de Globalizao. A Adobe promove a
difuso da lngua portuguesa como veculo de informao e acesso ao conhecimento
tecnolgico atravs do nosso Blog de Globalizao -http://blogs.adobe.com/globalization/pt/.
Este um frum internacional que permite o dilogo entre a Adobe e as comunidades dos
pases lusfonos.
Como exemplo de traduo automtica crua, sem reviso profissional, veja o exemplo
de uma pgina do nosso Blog de Globalizao http://blogs.adobe.com/globalization/pt/:

Blog de Globalizao da Adobe Systems


Vale ressaltar que aqui colocamos a nota Este artigo foi escrito originalmente em Ingls.
Texto em outros idiomas fornecido atravs de traduo automtica. No caso do Blog de
Globalizao, a traduo automtica crua, sem reviso profissional, aceitvel pela
comunidade porque o valor mais importante do Blog a disseminao rpida de informao
para e pela comunidade de usurios da Adobe.

4 - Resultados
Os projetos exemplificados acima oferecem resultados positivos e negativos para o
nosso grupo de globalizao na Adobe. Produtos SaaS, com uma interface de usurio
relativamente simples, que tm um ciclo de lanamento bastante rpido e so, na maioria das
vezes, gratuitos, seriam os melhores candidatos ao CTT.
Um aspecto negativo do CTT que, atualmente, oferece em primeiro lugar, os termos da
interface do produto traduzidos automaticamente, crus, sem reviso, o que frustra alguns dos
nossos usurios. A Adobe planeja melhorar este aspecto do CTT, oferecendo termos
pr-traduzidos atravs de nossas mquinas de traduo que usam os nossos bancos de termos
revistos e aprovados.

PLAT

V. 2. N.3

2013

65

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S


NOVAS TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

A Adobe TV permite que tradutores voluntrios traduzam vdeos instrutivos em qualquer


idioma. Em alguns casos, as tradues tornam os vdeos mais difceis de compreender. Na
maioria dos casos, as contribuies so relativamente boas e a resposta da comunidade
positiva, como mostramos acima.
O Blog de Globalizao tem como propsito principal informar, o mais rapidamente
possvel, todas as notcias referentes a Globalizao. Neste caso, a traduo automtica crua,
sem reviso profissional, aceitvel pela comunidade. No se trata de um aplicativo, mas um
frum onde o objetivo principal a comunicao entre participantes e a criao e
fortalecimento de networks sociais.

5 - Consideraes Finais
Uma pesquisa que tenho interesse em fazer na Adobe seria mostrar, de 5 milhes de
termos retirados dos glossrios da Adobe, quantos termos teriam sido mantidos no original, em
ingls. Quantos teriam sido usados nas duas formas, ou seja, teriam dupla nacionalidade
ingls e portugus, dependendo do aplicativo e do contexto.
Por que teria interesse em analisar os termos que so mantidos no original? Acredito que
estes termos sero possivelmente incorporados lngua, no s a escrita, mas tambm
preservando a pronncia, com sotaque portugus, claro. Todos falam /mausi, egui, xis,
daunlodi/. J outros termos simplesmente no so incorporados, como keyboard. Estamos
acostumados a usar teclado, h muitos anos. Ningum usa file. Todos preferem arquivo.
Atravs da parceria com as comunidades locais, poderamos possivelmente chegar a um
glossrio mais realista, um portugus para produtos da Adobe, uma variao usada pelas
comunidades locais de nossos usurios uma variao do computs.
Em concluso, a Adobe tenta desenvolver e implementar alternativas em localizao
com o objetivo de alcanar o melhor resultado possvel para nossos clientes lusfonos em
tempo real. As novas tendncias de softwares desenvolvidos rapidamente, com atualizaes
at semanais, lanam um desafio para o trabalho de localizao. Precisamos contar cada vez
mais com a contribuio das comunidades locais e, ao mesmo tempo, temos que fazer um
trabalho consciente de manuteno da consistncia da terminologia e respeito ao idioma, tudo
isso em tempo real.
Abraamos todas e quaisquer parcerias e esperamos poder contar com os ensinamentos
do IILP e de todos os participantes deste Colquio para que a Adobe possa ter sucesso diante
das comunidades de usurios lusfonos. Ao mesmo tempo, nos colocamos a disposio para
ajudar a divulgar os seus trabalhos atravs dos nossos networks sociais.

66

PLAT

V. 2. N.3

2013

CONSIDERAES AO COMPUTS: COMO A ADOBE ADAPTA-SE S NOVAS


TENDNCIAS DO PORTUGUS NA INTERNET E NO MUNDO DIGITAL
Guta Ribeiro

Referncias
Adobe.com no Brasil, http://www.adobe.com/br.
Adobe Community Translation Tool, https://community.translate.adobe.com.
Adobe Community Translation Facebook Page,
http://www.facebook.com/adobe.community.translation. Moderator: Dirk Meyer.
Adobe TV, Adobe Systems, http://tv.adobe.com/translations.
Blog de Globalizao da Adobe Systems, http://blogs.adobe.com/globalization/pt/.
Moderator: Leandro Reis.
Baboo, http://www.babo.com.br.
Dicionrio de computs
http://hugotavio.multiply.com/journal/item/1431?&show_interstitial=1&u=%2Fjournal%2Fite
m.
IBM Brasil, http://www.ibm.com/br/pt/.
Lusofonia, http://www.orkut.co.in/Main#Community?cmm=57996&fr=1
Location: Portugal.
PORTUGUS X COMPUTS Comunidade ORKUT com 7.971 membros
http://www.orkut.com/Main#CommMsgs?tid=99398&cmm=23331&hl=pt-BR
Created: Mar 18, 2004; Location: Brazil; Owner: Vincius Ramon Fontanela;
Moderators: Miguel Afonso Linhares, SC., Luciano Caseli, Rosi., Andr Simes.
RIBAS, E. et. al. 2007. A influncia da linguagem virtual na linguagem formal de adolescentes
In: IX CICLO DE PALESTRAS SOBRE NOVAS TECNOLOGIAS NA EDUCAO. Anais. Rio Grande
do Sul: CINTED - Centro Interdisciplinar de Novas Tecnologias na Educao. UFRGS: 2007. p.
1-10. Disponvel em:
http://www.cinted.ufrgs.br/ciclo9/artigos/8dElisangela.pdf .Consultado em: 23/06/2011.
Google Brasil, http://www.google.com.br/.
Yahoo Brasil, http://br.yahoo.com/.

PLAT

V. 2. N.3

2013

67

A INTERNET EM MOAMBIQUE:
IMPLANTAO, USO E DESAFIOS
Ins Machungo / Gregrio Firmino
Sobre o autor
Ins Machungo
Universidade Eduardo Mondlane.
machungoines@aol.com.
Gregrio Firmino
Universidade Eduardo Mondlane.
gregoriofirmino@gmail.com

Resumo
As tecnologias de informao e a internet em particular constituem no mundo de hoje
um meio de interaco e comunicao das sociedades facilitando o seu desenvolvimento
socioeconmico e cultural. Este poderoso meio de comunicao permite e facilita o dilogo
intracomunitrio, o dilogo governo, empresariado e comunidade, de que resulta a circulao
de informao relevante para o desenvolvimento e integrao das comunidades no mundo
globalizado. Em Moambique, apesar de enfrentar diversos constrangimentos, assiste-se a
uma significativa implantao e uso de tecnologias de informao e comunicao e ao recurso
internet. Assim, na presente comunicao abordaremos aspectos relacionados com a
implantao e uso da internet em Moambique, dando particular ateno aos meios disponveis
de acesso rede da internet. Destacaremos os constrangimentos que impedem um mais amplo
acesso dos cidados rede digital, e por fim mostraremos alguns desafios inerentes ao uso da
internet no contexto moambicano, mormente tendo em conta a situao socioeconmica e
lingustica do pas, caracterizada entre outros aspectos, pela diversidade lingustica e um
elevado ndice de analfabetismo.

Palavras-chave
Recursos digitais; Internet; Desenvolvimento; Multilinguismo.

68

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

1 - Introduo1
Moambique est situado na costa Sul Oriental de frica e linguisticamente
caracterizado por ser heterogneo; coexistem no pas lnguas autctones de raz bantu, a
lngua portuguesa e diversas lnguas minoritrias particularmente de origem asitica. Segundo
dados do ltimo censo, realizado em 2007, a lngua portuguesa falada por cerca de 39% da
populao, residindo a sua maioria nas zonas urbanas; apenas 6% dos falantes do portugus
tm esta lngua como lngua materna. Os restantes tm-no como lngua segunda e o grau de
proficincia muito varivel. neste contexto lingustico que abordaremos as questes
relacionadas com a difuso e uso das Tecnologias de Informao e Comunicao (TICs) no
pas.
Nesta comunicao apresentaremos um breve historial do nascimento e implantao da
rede de internet em Moambique, mostraremos o estado actual do uso da internet dando
particular enfoque aos avanos e constrangimentos encontrados no processo de expanso da
rede e por fim mencionaremos os desafios a enfrentar para que no pas o acesso e uso da
internet seja uma realidade para todos os moambicanos.

2 - Breve historial do uso da internet em Moambique


A histria da internet em Moambique est ligada Universidade Eduardo Mondlane,
mais particularmente ao Centro de Informtica (CIUEM). Este o provedor pioneiro da internet
e correio electrnico em Moambique; foi a partir de um computador do CIUEM que a 3 de
Fevereiro de 1993 foi enviada a primeira mensagem electrnica para a Universidade de Rhodes
na frica do Sul; nesse ano a internet tinha cerca de 100 utilizadores, sendo na sua maioria
docentes universitrios. O CIUEM at a data o responsvel pelo domnio MZ. Em 1997, o
CIUEM passa a oferecer o servio completo de internet (full internet service) e era o nico ISP
(Internet Service Provider) em Moambique. Novos ISPs foram surgindo e hoje possvel
garantir servios de internet a grande parte do pas.
As iniciativas desencadeadas pelo CIUEM, a expanso e divulgao do conceito de TIC
em Moambique consubstanciam-se nos vrios projectos criados visando a massificao e
deselitizao da informtica no pas. Destacamos a aco determinante do MAAC (Mozambique
Acacia Advisory Committee) baseado no CIUEM que idealizou e liderou grande parte dos
projectos ligados s TICs.
Pelo grande contributo que tm dado divulgao e desenvolvimento das TICs no pas
mencionamos em particular os seguintes projectos/aces, que tiveram um certo impacto no
desenvolvimento do uso dos meios digitais em vrios sectores de actividade no pas:
a) Telecentros, cujo objectivo era a expanso das TICs no meio rural;
b) Schoolnet visando a integrao das TICs no processo de ensino-aprendizagem no Sistema
Nacional de Educao;
1
Para a preparao desta comunicao, contmos com a colaborao de diversas pessoas e entidades.
Agradecemos, especialmente, o apoio recebido de:
Augusto Nunes - Director da INTIC
Claudino Dias - do CIUEM
Francisco Mabila - Director do CIUEM
Venncio Massingue - Ministro da Cincia e Tecnologia .

PLAT

V. 2. N.3

2013

69

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

c) Evoluo pela comunicao e informtica que tinha como objectivo reforar o uso das TICs
na governao atravs da formao e assistncia tcnica em TICs a funcionrios do Governo;
d) Tecnologia de Comunicao e Gesto Ambiental de Recursos Naturais centrado na gesto da
conservao e maneio dos recursos naturais;
e) Informao, Educao e Networking para Mulheres atravs da Internet. Este programa
dedica-se recolha, processamento e disseminao de informao sobre mulher e gnero,
capacita mulheres no desenho de websites, em navegar na internet, para garantir o acesso da
mulher internet;
f) Programa para a pesquisa e desenvolvimento de uma cultura de paz atravs das TICs.
O nmero de iniciativas e projectos em todos os quadrantes da vida social e econmica
foi crescendo, o que exigiu do Governo e da sociedade em geral uma atitude mais interventiva,
no sentido de normalizar as diferentes iniciativas. neste contexto que no ano de 2000 o
Governo aprova a Poltica Nacional de Informtica2 que indica
o quadro de princpios e objectivos que permitiro que as tecnologias de informao e
comunicao sejam o motor impulsionador dos vrios aspectos do desenvolvimento
nacional, contribuindo para a erradicao da pobreza absoluta e melhoria geral da vida dos
moambicanos, para a mais ampla participao dos cidados na Sociedade Global de
Informao, para a elevao da eficcia e eficincia na prestao de servios, para a
melhoria da governao e aprofundamento da democracia, para fazer do pas produtor e no
mero consumidor das tecnologias de informao e comunicao, e para a sua participao
na economia mundial, cada vez mais assente na informao e no conhecimento (218
(19/10))..

So objectivos especficos da Poltica de Informtica entre outros:


a) Elevar a conscincia nacional sobre o papel e o potencial das tecnologias de
informao e comunicao no desenvolvimento sustentvel de Moambique;
b) Contribuir para a erradicao da pobreza absoluta e para a melhoria das condies de
vida dos moambicanos;
c) Proporcionar acesso universal informao a todos os cidados para melhorar o seu
nvel e desempenho na educao, cincia e tecnologia, sade, cultura, entretenimento e
nas suas actividades em geral;
d) Expandir e desenvolver o ensino da Informtica no Sistema Nacional de Educao;
e) Contribuir para aumentar a eficincia e eficcia dos sectores pblico e privado;
f) Contribuir para que o pas seja produtor e no apenas consumidor das tecnologias de
informao e comunicao
g) Criar um clima favorvel indstria, negcios e investimentos na rea das tecnologias
de informao e comunicao;

2
Cf. Boletim da Repblica, 3. Suplemento, Poltica de Informtica, disponvel em
http://www.portaldogoverno.gov.mz/docs_gov/fold_politicas/tecInform/politica_informatica_br.pdf

70

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

h) Assegurar que os planos e projectos de desenvolvimento em todos os sectores


possuam uma componente de tecnologias de informao e comunicao;
i) Contribuir para reduzir e gradualmente eliminar as assimetrias regionais, as
diferenasentre a cidade e o campo, e entre os vrios segmentos da sociedade, no
acesso s oportunidades de desenvolvimento;
j) Potenciar e facilitar a integrao do pas na economia mundial e na Sociedade Global
de Informao.
Para dar corpo a estes princpios e objectivos, foi criado o Mozambique Information
and Communication Technology Institute (MICTI), um programa e um plano de aco
para a implementao da Poltica de Informtica do pas. Com este programa pretende-se
criar competncias tcnicas e capacidades em TIC em Moambique facilitadas pela
combinao de energias e contribuies do Governo, Universidades, sector privado interno e
internacional, bem como de agncias de desenvolvimento e de cooperao.

3 - Expanso e uso da Internet


Moambique, apesar de ser um dos pases com um ndice de desenvolvimento mais
baixo3, tem desenvolvido esforos para se colocar no mundo da tecnologia digital, e em
particular no da internet. Contudo, excepo da rede de telefonia mvel que se encontra em
franca expanso (existem neste momento trs companhias de telefonia mvel no pas), so
ainda insuficientes os recursos oferecidos populao para o uso das tecnologias de
informao. De acordo com o Censo Populacional de 2007, o ltimo realizado at a data, a
percentagem de utentes da internet era de cerca de 0,9%. Dados estatsticos fornecidos pela
Internet World Stats indicam que at Dezembro de 2011 o grau de penetrao da internet em
Moambique era de 4,3%. Portanto, h indcios claros de que apenas uma percentagem muito
reduzida de moambicanos tem acesso internet.
Num estudo intitulado Mozambique ICT Sector Performance Review, Mabila et al.4
indicam que em Moambique existem dois meios principais de acesso internet: atravs do
computador (laptop ou computador de mesa) e atravs do telefone mvel, e em qualquer dos
casos verificou-se que o uso da internet muito baixo por variadas razes de que se destacam
os custos elevados dos equipamentos, a deficiente cobertura da rede de electricidade, a
reduzida largura de banda, barreiras lingusticas, entre outras.

3.1 - A telefonia mvel e a internet


Com a expanso da rede de telefonia mvel (existem neste momento no pas trs
companhias oferecendo estes servios), e tendo em conta que os aparelhos de telefone
modernos dispem de dispositivos que permitem o acesso internet, era de se esperar que o
nmero de utentes da internet aumentasse. Contudo, a situao diversa.
Dados do estudo supracitado revelam que a percentagem de utentes de telefonia mvel
em Moambique de 25,7%, dos quais 17,3% vivem em zonas rurais e 53% em zonas
3
Dados do Relatrio Mundial de Desenvolvimento Humano, lanados pelo Programa das Naes Unidas para o
Desenvolvimento (PNUD) em 2011, indicam que o IDH de Moambique de 0,322.
4
MABILA et al. 2010.

PLAT

V. 2. N.3

2013

71

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

urbanas; os nmeros apresentados permitem inferir que 74,3% da populao no tem telefone
celular ou SIM Card activo. Por outro lado, os servios de GSM e 3G no abrangem todo o pas
e os aparelhos de preo mais baixo tm tecnologia limitada. O mercado est pois longe de estar
saturado. Assim, podemos afirmar que a maior parte da populao no usa a internet
disponibilizada por via de telefonia mvel, quer por ser analfabeta,5 quer por falta de recursos
financeiros (o custo deste servio ainda muito elevado), quer ainda porque desconhece os
servios.
O nmero de pessoas que acedem internet atravs do telefone celular muito inferior
ao nmero dos que o fazem por via do computador. E isto deve-se ao facto de que muitos dos
que esto conectados rede fazerem-no no emprego, na escola, no internet caf etc. O acesso
atravs do celular apenas um complemento, muitas das vezes usado em situaes de
emergncia quando o acesso a partir do ponto fixo no possvel.

3.2 - Dados estatsticos sobre o uso da internet


O acesso internet significa a possibilidade de acesso a uma informao variada sobre
economia, negcios, cultura etc. Ter acesso internet sinnimo de poder. Contudo, este
poder dado a quem j o possui, pois para se ter acesso internet, tem de se estar num local
em que haja acesso a essa tecnologia, e tem de se possuir os recursos financeiros que
permitam o seu uso, como se pode notar no quadro que se segue.
No quadro 1 apresenta-se a capacidade informtica do pas no ano de 2000, por
provncia.
C.Del

Niassa

Namp

Zamb

Tete

Man

Sof

Ibane

Gaza

MPr

MCid

Total

Comp.

65

172

402

337

348

203

880

79

118

712

8021

11516

Email

18

16

66

90

13

122

110

13

17

768

4024

5257

Intern.

15

50

36

13

17

78

11

14

64

2229

2536

Legenda: Comp. Computadores existentes Email Acesso email Intern. Acesso Internet
Quadro 1 - Capacidade informtica do pas no ano de 2000, por provncia
O quadro mostra que Maputo-cidade, que tem o estatuto de uma provncia, possui 71%
dos computadores existentes no pas, mais de 85% dos outros recursos, ou seja, Maputo
cidade tem mais recursos que todas as outras provncias combinadas. Em Maputo est
concentrada a classe mdia-alta do pas, detentores do poder poltico e financeiro; em Maputo,
tambm esto sediados a maior parte dos projectos de desenvolvimento econmico-social e
um nmero considervel de organizaes internacionais. Tambm em Maputo que h maior
possibilidade de acesso internet, mesmo para os cidados de recursos modestos.

A taxa de analfabetismo no pas de 51,9%. Note-se que apesar das inmeras promoes feitas pelas
companhias de telefone mvel para reduzir o preo das SMS, muitos dos detentores de telefones celulares,
sobretudo as zonas rurais, no beneficiam destas promoes pois, no sabendo ler nem escrever, usam o telefone
apenas para transmisso de voz.
5

72

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

De salientar que mais de 65% da populao moambicana vive nas reas rurais. Por
outras palavras, a grande maioria da populao do pas no tem acesso aos recursos e
benefcios que as TICs oferecem.
Gillwald & Stork6 realizaram um estudo referente ao uso da internet no pas tendo em
conta algumas variveis de que destacamos, ponto de acesso internet, razes para o fraco
uso da internet, frequncia de uso e factores que limitam o uso da internet. O estudo forneceu
os seguintes dados:
a) Pontos de acesso
Grande parte dos que usam a internet declararam que o faziam a partir de uma
instituio educacional ou biblioteca ou no local de trabalho
Tabela 1 - Pontos de acesso

Ponto de acesso

%1

Instituio educacional ou biblioteca

35,4%

Local de trabalho

33,3%

Casa ou em casa de outros

32,1%

Internet-caf

27,9%

Telefone-mvel

21,72%

Fonte: GILLWAD & STORK,2008.


b) Fraco uso da internet
As razes apresentadas para o fraco uso da internet por parte daqueles que sabem o que
a internet, foram no geral ou a falta de computador ou a falta de domnio de uso do
computador.
Tabela 2 - Razes do fraco uso da internet

Razes do fraco uso da internet

No tem computador

68,5%

No sabe usar computador

33,6%

No tem com quem comunicar via email

20,6%

No tem acesso internet

13,8%

No dispe de recursos financeiros

7,4%

No quer usar a internet

7,1%

No sabe ler ou escrever

0,3%

Fonte: GILLWAD & STORK,2008.

GILLWALD & STORK, 2008.


Era permitido que os inquiridos indicassem mais do que uma opo de resposta. Da que a soma dos valores
percentuais possa ser superior a 100%.
6

PLAT

V. 2. N.3

2013

73

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

c) Frequncia de uso da internet


Os utentes da internet indicaram, na sua maioria, que usavam a internet todos os dias
ou quase todos os dias.
Tabela 3 - Frequncia do uso da internet

Frequncia do uso da internet

Todos os dias ou quase todos os dias

60,0%

Pelo menos uma vez por semana

23,7%

Menos de uma vez por ms

8,3%

Pelo menos uma vez por ms

7,9%

Fonte: GILLWAD & STORK,2008.


d) Factores limitativos
So vrios os factores limitativos, no uso da internet, podendo-se destacar a falta de
tempo, contedo sem interesse, falta de acesso a um computador com acesso internet, ou o
custo elevado do acesso internet.
Tabela 4 - Razes do fraco uso da internet

Razes do fraco uso da internet

Falta de tempo

29,7%

No tem contedo interessante

22,4%

No tem acesso
ligao internet

computador

com 21,1%

Custo de acesso elevado

19,9%

Velocidade baixa da internet

14,6%

No sabe como usar a internet

1,6%

No h contedos em lnguas locais

0,8%

Fonte: GILLWAD & STORK,2008.


Se adicionarmos as percentagens relativas s variveis instituio educacional e
trabalho, teremos cerca de 68% de utentes da internet usando os servios disponibilizados
pelos locais de trabalho e estudo, que como sabemos no imputam custos ao uso da internet.
Isto pode significar que a maioria dos utentes no tem recursos financeiros para adquirir um
computador ou para pagar o custo dos servios. De notar que parte dos que afirmaram usar a
internet em casa, fazem-no tambm em casa de outros. Esta interpretao sustentada pelos
dados obtidos nas respostas na tabela 2, em que cerca de 68% dos utentes afirma no usar a
internet por no possuir computador.
Se compararmos as respostas apresentadas na tabela 2 (em que lugar se acede
internet) com as respostas pergunta 4 (factores que limitam o uso da internet) poderemos
concluir que a falta de tempo manifestada pelos utentes se deve ao facto de estes usarem

74

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

a internet no local de trabalho e que a informao que procuram no est relacionada com o
trabalho. Veja-se que ainda nas respostas na tabela 4 os inquiridos indicam que a internet no
tem contedo interessante. O que procuram os moambicanos na internet? Esta uma
pergunta cuja resposta nos ajudaria a esclarecer o facto de uma boa parte dos utentes da
internet acharem que nesta no so veiculados contedos interessantes.
Assim, pode-se inferir que actualmente:
a)so poucos os que usam a internet em casa; grande parte usa ou no local de trabalho
ou na escola ou no internet-caf.
b)Os que a usam fazem-no todos os dias ou quase todos os dias.
c)Os que no usam no o fazem porque no tm computador ou no sabem usar.
d)De entre os que usam h factores limitativos como falta de tempo, contedo pouco
interessante, falta de acesso internet, custo e baixa velocidade da internet.

3.3 - Instituies que gerem o uso da internet


Falar da internet em Moambique falar dos meios que permitem o seu uso e das
instituies que gerem e promovem a sua divulgao. Vrias so as instituies no pas que
fornecem meios de acesso internet, sendo as instituies do ensino superior, pela sua
natureza, as que oferecem mais opes e a preos reduzidos ou grtis na maioria dos casos.
Contudo, na presente comunicao destacaremos o Instituto Nacional de Tecnologias de
Informao e Comunicao (INTIC) por ser uma instituio com representao em todo o pas
e que presta servios mais abrangentes.
O INTIC uma instituio que gere e administra a Rede Electrnica do Governo (GovNet)
atravs da qual funcionrios de cerca de 250 instituies pblicas de todo o pas, acedem
internet. Esta instituio disponibiliza o Portal do Governo atravs do qual, a partir de qualquer
parte do Mundo, se pode aceder a informao sobre o Governo de Moambique. Este Portal
dispe tambm de informao sobre os diversos servios prestados ao cidado pela funo
pblica.
O Portal do Governo tambm usado como meio de:
a) acesso do cidado ao correio electrnico, atravs do webmail;
b) participao do cidado na governao, contribuindo para o reforo da democracia
participativa.
O INTIC actua a nvel central, provincial e distrital.

3.3.1 - Provncia
Em cada capital provincial do pas existe um Centro Provincial de Recursos Digitais
(CPRD) ligado rede central e que tem por objectivo servir a funo pblica na provncia. Os
CPRD esto tambm vocacionados para servir o cidado comum, massificando assim o uso da
internet e mais particularmente do correio electrnico.Os CPRD oferecem entre outros:
a) Sala de internet, em que sendo subsidiada, a internet oferecida ao cidado comum
a preos mais baixos que o de outras instituies afins;
PLAT

V. 2. N.3

2013

75

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

b) Servios de formao, apoio e assistncia tcnica;


c) Nestes centros, atravs dos voluntrios, tambm se faz sensibilizao aos futuros
utilizadores sobre as vantagens do uso da internet.
Cerca de 80% das provncias do pas tm um CPRD em funcionamento.

3.3.2 - Distrito
Em nvel das sedes dos distritos, foram criados Centros Multimdia Comunitrios (CMC),
onde o cidado pode ter acesso partilhado internet; nestes centros , para alm dos pontos
de acesso internet, funcionam tambm rdios comunitrias. Os CMC so de grande
relevncia para a vida do cidado, pois a partir destes so veiculados assuntos de interesse
comunitrio; por exemplo, so lanadas campanhas de divulgao de assuntos ligados sade
(vacinaes, epidemias etc), educao, s campanhas agrcolas entre outros. Os documentos
so baixados por via da internet e so traduzidos e divulgados em lnguas locais atravs da
rdio comunitria. Equipes de voluntrios, maioritariamente estudantes, do apoio aos utentes
da internet, para alm de fazerem campanhas de divulgao e formao, visando o uso mais
frequente e adequado dos recursos digitais disponveis. Os CMC esto j instalados em cerca
de 40% dos distritos do pas encurtando assim as distncias entre as capitais provinciais e os
distritos e entre os distritos entre si; desta forma se reduzem significativamente os custos e
outros recursos que seriam usados em transportes quer de pessoas quer de materiais.
Ainda no mbito da divulgao e facilitao de comunicao por via da internet e dentro
do Programa das TICs para o desenvolvimento, foram criadas Unidades Mveis de Tecnologias
de Informao e Comunicao (UNTIC); estas tm por funo formar residentes dos distritos,
promover conhecimento e servios na rea das novas tecnologias de informao.
O INTIC gere tambm o Sistema Centralizado de correio electrnico do governo meio
seguro e fivel de comunicao electrnica para membros do Governo e outros titulares de
cargos pblicos, sendo os maiores utilizadores deste servio os Ministrios e Governos
Provinciais.

4 - Lngua e uso da internet


Tendo em conta que mais de 70% dos utentes da internet no pas so professores,
estudantes e funcionrios pblicos, a ttulo de amostragem, procurmos identificar a lngua por
eles usada nas pginas da internet visitadas e a lngua usada nos browsers utilizados. Para tal
analismos dados fornecidos pelo INTIC e pelo CIUEM referentes ao perodo que vai de 1 a 31
de Janeiro de 2012, tendo-se apurado que:
a) Os browsers mais usados esto em portugus;
b) H uma grande procura de sites em ingls mas o tempo de permanncia de visita
inferior ao dos sites em portugus.
c) Em relao aos sites em portugus os mais visitados so os brasileiros e
principalmente as pginas de divulgao de trabalhos acadmicos;

76

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

Estes dados demonstram claramente que, no contexto moambicano, o portugus


fundamental no acesso internet, o que se harmoniza com o cenrio lingustico do pas. Apesar
de o ingls ser importante, de estar entre as lnguas usadas no meio digital, o portugus a
lngua melhor dominada pelos moambicanos para o acesso a internet.

5 - Constrangimentos no acesso e uso da internet


Muitos so os avanos verificados ao longo dos ltimos 10 anos, mas existem
igualmente muitos constrangimentos. Dados recolhidos dos relatrios apresentados pelas
CPRD e CMC indicam que algum do equipamento informtico instalado nos centros no est em
uso, por se encontrar danificado devido falta de manuteno; os centros no dispem de
tcnicos especializados para garantirem o seu funcionamneto adequado. As oscilaes de
corrente elctrica e a falta de equipamento adequado de proteco so outros dos factores que
contribuem para o desgaste do equipamento. Pode-se pois inferir que a disponibilizao de
equipamento no suficiente, outros recursos, particularmente os humanos, tm de estar
disponveis.
O elevado preo dos computadores e telefones celulares constitui tambm um entrave a
ter em conta. Moambique tem um PIB de $480 USD e um computador custa cerca de $700
USD; o preo do telefone celular com capacidade instalada para aceder internet custa, no
mnimo, o equivalente a $30 USD.
A largura da banda limitada, do que resulta uma deficiente qualidade na transmisso
de dados. O elevado custo dos servios outro factor que reduz a possibilidade de o cidado
comum usar a internet.
A rede de distribuio de energia elctrica ao longo do pas deficiente, o que afecta
grandemente o fornecimento de servios de internet em grande parte dos distritos e
localidades.
Factores de outra ndole contribuem tambm para o fraco acesso e uso da internet pelos
moambicanos. Referimo-nos particularmente taxa elevada de analfabetismo, s dificuldades
lingusticas particularmente no uso do ingls, e tambm do portugus que como se sabe,
apesar de ser lngua oficial, no dominada por cerca de 75% da populao, iliteracia digital
e ao desconhecimento em geral das vantagens oferecidas por estes recursos do mundo digital.

6 - Desafios e oportunidades
As TICs so um poderoso meio de incluso social. Ao estabelecerem redes de
comunicao possibilitam a interaco entre as pessoas, facilitam transaces quer econmicas
quer sociais, fortificam e consolidam as relaes entre os cidados, governo, empresariado e
outras foras vivas dentro e fora do pas. So um motor de desenvolvimento econmico e social
das sociedades. Ter acesso s TICs significa ter acesso ao mundo global da informao e
conhecimento.O panorama demogrfico, lingustico, econmico e social de Moambique no
presente momento revela que as TICs propiciam a excluso social, impedindo os cidados de
adquirirem conhecimentos que lhes permita integrarem-se no mundo globalizado em que
vivemos.

PLAT

V. 2. N.3

2013

77

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

Para reverter esta situao, desafios se impem sociedade, alguns j identificados na


Poltica Nacional de Informtica, nomeadamente:
a) Proporcionar acesso universal informao a todos os cidados para melhorar o seu
nvel e desempenho na educao, cincia e tecnologia, sade, cultura, entretenimento e
nas suas actividades em geral;
b) Expandir e desenvolver o ensino da Informtica no Sistema Nacional de Educao;
c) Reduzir os custos de acesso internet (um pacote bsico de internet custa cerca de
$35USD mensais);
d) Identificar contedos virados para as aspiraes dos moambicanos;
e) Identificar formas de ultrapassar as barreiras lingusticas (os moambicanos so
fluentes nas lnguas locais e/ou portugus).

7 - Consideraes finais
O presente estudo mostrou que os objectivos plasmados na Poltica de Informtica
traada pelo Governo e que visavam fundamentalmente o acesso dos cidados moambicanos
s TICs esto longe de ser concretizados. Vrios factores que anteriormente mencionmos e
que repetimos concorrem para esta situao:
a) A taxa elevada de analfabetismo, que impede os cidados de terem acesso escrita
recurso por excelncia utilizado nas TICs; associada ao analfabetismo est a barreira
lingustica, pois como se mencionou acima uma percentagem reduzida da populao tem
domnio do portugus ou do ingls, lnguas usadas nos meios digitais.
b) O preo elevado dos computadores, e as taxas de acesso internet que so
incompatveis com os recursos financeiros dos cidados;
c) O desconhecimento das TICs, facto este associado tambm s condies
socio-culturais dos moambicanos;
d) Deficiente cobertura da rede de electricidade e internet.
Para que Moambique entre de facto no mundo da internet e no mundo digital em geral
preciso que:
a) Se desenvolvam campanhas de combate iliteracia incluindo a digital;
b) Se garanta a massificao do acesso ao computador, ao telefone, aos servios da
internet;
c) Se garanta que os contedos dos sites disponveis sejam relevantes e no formato
lingustico adequado;
d) Se criem pacotes de incentivos para quem investe na TIC;

78

PLAT

V. 2. N.3

2013

A INTERNET EM MOAMBIQUE: IMPLANTAO, USO E DESAFIOS


Ins Machungo / Gregrio Firmino

e) O pas disponha de recursos financeiros e tcnicos que permitam a implementao de


qualquer deciso que seja tomada relativamente s TICs.
Em suma, necessrio que se envidem esforos para que sejam verdadeiramente
implementados os princpios plasmados na poltica de informtica.

Referncias
GILLWALD, A.; STORK, C.2008. Towards Evidence-based ICT Policy and Regulation: ICT Access
and Usage in Africa.Vol.1, Policy Paper.
MABILA, F. et al.2010. Mozambique ICT Sector Performance Review 2009/2010. In: Towards
Evidence- based ICT Policy and Regulation, Vol. 2, Policy Paper 16, 2010.
MATUSSE, R.2003. Histria da Informtica em Moambique. Maputo : MAAC.
Portal do Governo de Moambique, http://www.portaldogoverno.gov.mz

PLAT

V. 2. N.3

2013

79

CONTRIBUTO GALEGO PARA A LNGUA


PORTUGUESA NA ERA DIGITAL:
AS FERRAMENTAS AO-OA DA ACADEMIA
GALEGA DA LNGUA PORTUGUESA

Ernesto Vazquez Sousa / Concha Rousia


Sobre o autor
Ernesto Vazquez Souza
Academia Galega da Lngua Portuguesa; AGLP-Arquivo Digital.
Concha Rousia
Academia Galega da Lngua Portuguesa.

Resumo
Apresentao sinttica dos projetos digitais que a Academia Galega da Lngua
Portuguesa est a desenvolver para a promoo da Lngua Portuguesa na Galiza e para o
conjunto da Lusofonia. Em destaque o Portulano de Recursos: escritrio virtual e agrupador de
recursos digitais sobre a lngua portuguesa desenhado com o software livre Netvibes; o Arquivo
Digital: repositrio de objetos digitais orientado preservao e divulgao que funciona sobre
um motor DSpace e gerencia metadados no standard Dublin Core; e o projeto do Dicionrio
eletrnico e-estraviz em parceria com a AGAL (Associaom Galega da Lngua).

Palavras-chave
AGLP. Dspace. Repositrios. Redes sociais. Agrupador de recursos.

80

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

1 - Introduo
A Academia Galega da Lngua Portuguesa uma entidade privada que se define
estatutariamente como instituio cientfica e cultural ao servio do Povo galego que
pretende promover o estudo da Lngua da Galiza para que o processo da sua normalizao e
naturalizao seja congruente com os usos que vigoram no conjunto da Lusofonia.
A Academia Galega da Lngua Portuguesa foi constituda em 20 de setembro de 2008.
Desde a sua fundao e na atualidade presidida pelo Professor Doutor Jos-Martinho Montero
Santalha e apresenta-se como uma continuao histrica da ideia de unidade do
galego-portugus que representaram vultos como Ernesto Guerra da Cal, Ricardo Carvalho
Calero, Manuel Rodrigues Lapa ou Lus Filipe Lindley Cintra, que em 1984 inclura os dialetos
da lngua galega como parte dos do portugus europeu (CINTRA, 1971) e o consagrou na
Gramtica que editou junto de Celso Cunha (CUNHA; CINTRA, 1984).
A ideia de criao de uma Academia de carter lusfono na Galiza foi do Professor Doutor
Ricardo Carvalho Calero (1910-1990). A proposta de criao da Academia foi defendida pelo
e tarefas para o futuro1 e, mais recentemente, numa interveno em Bragana, em outubro
de 2006, na realizao do V Colquio da Lusofonia.
Criada seguindo a tradio das academias, mas como uma iniciativa da sociedade civil,
independente dos organismos polticos galegos com o intuito de efetivar esta proposta, tem
sua origem ligada ao nascimento, em 1 de Dezembro de 2007 da Associao Pr-Academia
Galega da Lngua Portuguesa em Compostela integrada por pessoas de diferentes mbitos da
defesa da lngua e com o apoio de organizaes lusfonas como a Associao de Amizade
Galiza-Portugal, a Associaom Galega da Lngua, a Associao Scio-Pedaggica
Galego-Portuguesa ou o Movimento Defesa da Lngua.
Posteriormente, em 7 de abril de 2008, foi confirmada pelo presidente da Associao
Cultural Pr Academia Galega da Lngua Portuguesa durante a sua interveno na Assembleia
da Repblica de Portugal, na Conferncia Internacional de Lisboa, em 7 de abril de 2008 sobre
o Acordo Ortogrfico da Lngua Portuguesa por meio do seu Presidente, ngelo Cristvo2 , com
um comunicado a respeito da posio galega e o papel da futura Academia Galega. Neste ato
tambm o resto de associaes lusfonas galegas acima citadas estiveram representadas por
meio do Presidente da AGAL (Associaom Galega da Lngua), Alexandre Banhos. Estas
intervenes tiveram larga repercusso nos meios de comunicao.
Finalmente, a Academia foi constituda em 20 de setembro de 2008, realizando a sua
sesso inaugural em 6 de outubro de 2008 contando com a participao e respaldo de
instituies como a Academia das Cincias de Lisboa, a Academia Brasileira de Letras, o Reitor
da Universidade Aberta, a Universidade de Santiago de Compostela, a Associao Internacional
de Lusitanistas e a Junta da Galiza (Governo Autnomo da Galiza), que enviaram
representantes oficiais.
A Academia um rgo estatutrio da Fundao Academia Galega da Lngua
Portuguesa, entidade de competncia estatal inscrita no Ministrio da Cultura da Espanha
(Ordem CUL/1075/2011, de 1 de maro).

1
2

MONTERO SANTALHA, 1994.


CRISTOVO, 2008.

PLAT

V. 2. N.3

2013

81

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

Em 17 de maio de 2010 recebeu o Prmio Meendinho, atribudo pela fundao com o


mesmo nome, por existir um antes e um depois, desde a sua constituio, a respeito da
projeo e da realidade da lngua galega na Lusofonia toda, e como um elemento mais dela.
A Academia Galega da Lngua Portuguesa tem estabelecido Protocolos de Cooperao
com 25 entidades portuguesas, brasileiras e angolanas:
Em Angola:
- Fundao Antnio Agostinho Neto (Luanda) ( http://www.agostinhoneto.pt/ )
No Brasil:
- Instituto Cultural Brasil-Galiza (Florianpolis-Santiago) http://www.brasil-galiza.org
- Instituto de Investigao e Desenvolvimento em Polticas Lingusticas (IPOL)
(Florianpolis - Sta. Catarina) http://www.ipol.org.br/
- Instituto Histrico e Geogrfico Brasileiro (Rio de Janeiro) http://www.ihgb.org.br/
- Associao Brasileira de Lingustica (Curitiba - Paran) http://www.abralin.org/
- Academia Brasileira de Msica (Rio de Janeiro) http://www.abmusica.org.br/
- Real Gabinete Portugus de Leitura (RJ) http://www.realgabinete.com.br/portalWeb/
Em Portugal:
- Colquios da Lusofonia (Aores) http://www.lusofonias.net/
- Academia das Cincias de Lisboa http://www.acad-ciencias.pt
- Academia Portuguesa da Histria (Lisboa) http://www.aph.com.pt/
- Academia Internacional de Cultura Portuguesa (Lisboa)
http://www.portaldacultura.gov.pt/organismos/Pages/academias.aspx
- Sociedade de Geografia de Lisboa (Lisboa) http://www.socgeografialisboa.pt/
- Universidade Aberta (Lisboa) http://www.univ-ab.pt/
- Centro de Estudos de Histria do Atlntico (Funchal, Madeira)
http://www.ceha-madeira.net/
- Priberam Informtica, s.a. (Lisboa) http://www.priberam.pt/
- Porto Editora http://www.portoeditora.pt
- Instituto de Filosofia Luso-Brasileira (Lisboa) http://iflb.webnode.com/
- Sociedade da Lngua Portuguesa http://www.slp.pt

82

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

- ISCTE - Instituto Universitrio de Lisboa http://www.iscte.pt


- Instiuto Luso-rabe para a Cooperao http://www.luso-arabe.org/
- Centro Nacional de Cultura http://www.cnc.pt/
A Academia Galega da Lngua Portuguesa colabora ativamente com o resto de
academias da lngua, especialmente atravs da sua Comisso de Lexicologia e Lexicografia,
que elaborou um vocabulrio de lxico galego para ser incorporado no prximo Vocabulrio
Ortogrfico Comum, decorrente da implementao do Acordo Ortogrfico, e cuja coordenao
responsabilidade do Instituto Internacional da Lngua Portuguesa.
A Sesso Interacadmica realizada em 14 de abril de 2009 em Lisboa sob a presidncia
das trs academias foi a primeira cerimnia conjunta, apresentando-se publicamente o Lxico
da Galiza a ser integrado no Vocabulrio Comum.
Mais de 800 entradas do Lxico da Galiza foram incorporadas no Vocabulrio Ortogrfico
da Lngua Portuguesa3 editado em outubro de 2009 pela Porto Editora. Em maro de 2010 a
Academia Galega da Lngua Portuguesa participou da Conferncia Internacional sobre o Futuro
da Lngua portuguesa no Sistema Mundial realizada no Itamaraty, Braslia, por convite do
Ministrio de Relaes Exteriores do Brasil.
Junto atividade institucional, a publicao do Lxico da Galiza e a sua incluso nos
vocabulrios ortogrficos da Porto Editora e da Priberam marcam uma linha de atuao que vai
ser intensificada nos prximos anos.
Em 25 de setembro de 2012 decorreu em Santiago o II Seminrio de Lexicologia,
com a participao institucional de 12 especialistas, com especial destaque para os professores
Evanildo Bechara e Malaca Casteleiro. Participaram as seguintes entidades: Academia das
Cincias de Lisboa (ACL), Academia Brasileira de Letras (ABL), Associao Docentes de
Portugus na Galiza (DPG), Instituto Cames, Porto Editora e Priberam Informtica.
Neste evento foi apresentado o programa informtico FLiP 84, que incorpora na sua
configurao a opo de uso do Lxico da Galiza, alm dos pertencentes aos outros pases de
lngua portuguesa. Deste modo, o nosso contributo lexical divulgado junto do grande pblico
de uma forma prtica. O arquivo foi disponibilizado na pgina da Academia (www.aglp.net).
A Academia Galega da Lngua Portuguesa tambm articula uma Coleo de Clssicos
Galegos com obras de autores como Rosalia de Castro, Eduardo Pondal, Joo Vicente Biqueira,
Manuel Leiras Pulpeiro, Lois Amado Carvalho, editando tambm de forma peridica anual um
Boletim da Academia Galega da Lngua Portuguesa (ISSN 1888-9763) e outras publicaes
cientficas como o Anexo Galiza: Lngua e Sociedade (2009).

3
O Vocabulrio Ortogrfico da Lngua Portuguesa da Porto Editora com mais de 250 000 vocbulos representativos
do vasto patrimnio lexical da lngua portuguesa accessvel em: http://www.infopedia.pt/vocabulario/.
4
O FLiP 8 a oitava verso do pacote de ferramentas de reviso e auxlio escrita da Priberam que inclui um
corretor ortogrfico, um dicionrio e um conversor para o Acordo Ortogrfico.

PLAT

V. 2. N.3

2013

83

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

2 - As Ferramentas digitais da AGLP


Moramos num mundo definido pelo uso generalizado de tecnologias que passaram em
pouco tempo de dar acesso em tempo real informao a uma procura da plena comunicao
entre comunidades de utentes que geram e produzem no apenas contedos quanto que
personalizam, modificam, definem ou gerem as prprias ferramentas ou os meios em que se
produz a comunicao.
A rede, as redes, so naturalmente sociais, mas definem novos agrupamentos humanos,
novas fidelidades, novas necessidades individuais e grupais, que no tm a ver com os espaos
geogrficos ou com as fronteiras nacionais ou educativas quanto com as preferncias culturais,
e as identidades ideolgicas, os valores, as fidelidades.
No decurso deste desenvolvimento a lngua portuguesa passou de ser a lngua nacional
de uns quantos pases em via de desenvolvimento a canal de comunicao pelo que circulam e
do que fazem uso estas novas comunidades. Uma lngua que se movimenta num espao global
como uma das possveis lnguas de uso internacional avalizadas por uma das grandes potncias
emergentes do presente: o Brasil.
Nesse espao internacional e social que se define pela internet, os conceitos de
Lusofonia e Acordo Ortogrfico tomam uma forma e valor que vai definir e no que podem entrar
os espaos galegos criativos, comunicativos, econmicos e sociais.
Desde a dcada de 90 do sculo XX, por causa do processo de fagocitao das grandes
editoras cientficas e pela implementao dos sistemas de avaliao baseados nos ndices de
impacto e de citao dos textos acadmicos, produziu-se uma constante reduo do espao de
publicao cientfico e o temor ao controlo deste por parte de grupos editoriais movimentados
apenas pelos seus interesses econmicos e estratgias editoriais.
Segundo Hlio Kuramoto5, a partir desta perceo surgiu o movimento Open Access cuja
primeira declarao foi elaborada e lanada como resultado de uma reunio realizada nos dias
1 e 2 de dezembro de 2001, organizada pela Open Society Institute (OSI), o Budapest Open
Access Iniciative (BOAI).
um movimento que defende o acesso aberto a artigos de pesquisas, principalmente
atravs de meios digitais. Acesso sem restries, online, livre de qualquer cobrana de taxa ou
necessidade de assinatura ou pagamento de licenas.
A declarao
complementares:

Budapest

Open

Access

Initiative

recomendava

duas

estratgias

1. Autoarquivamento; e
2. Revistas Cientficas de Acesso Livre.
A primeira estratgia considera que os pesquisadores e acadmicos precisam de
ferramentas e assistncia para depositar os seus artigos publicados em revistas arbitradas por
reviso de pares (peer-review) em arquivos eletrnicos abertos, prtica tambm chamada de
autoarquivamento. Considerando que esses arquivos estejam em conformidade com as
5

84

KURAMOTO, 2012.

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

normas criadas pelo Open Archives Initiative (OAI), em seguida, os motores de busca e outras
ferramentas podem trat-los separadamente como sendo um s. Desta forma, os usurios, no
precisaro saber quais arquivos existem ou onde eles se localizam, a fim de encontrar e fazer
uso de seu contedo.
O acesso aberto atravs da rede uma excelente soluo para a escassez de recursos,
os custos elevados para manter e atualizar grandes bibliotecas, a dificuldade em manter um
nmero elevado de assinaturas e a existncia de poucos exemplares de obras para muitos
leitores.
Deve considerar-se tambm que hoje cada dia menos necessrio o acesso fsico ao
documento ou a propriedade, primando a facilidade (e ainda a maneira) de acesso
informao e as facilidades de pesquisa em seu contedo. Acompanhado isto com os baixos
custos editoriais resulta a possibilidade de difuso e intercmbio de resultados de pesquisa a
um pblico incomparavelmente maior.
O impacto potencial que o acesso s redes de comunicaes eletrnicas pode ter sobre
a concorrncia e a ampla disponibilidade de redes e servios da rede um princpio
fundamental que sustenta o enquadramento normativo europeu. Na Europa, os operadores
tradicionais receberam o mandato de facilitar o acesso aos operadores que competem com o
fim de reduzir as barreiras entrada e para promover a prestao competitiva de servios de
comunicaes eletrnicas em benefcio dos consumidores europeus6.
No caso galego a apario e espalhamento da internet e a interveno e comunicao
dos galegos nos espaos de lngua portuguesa provoca uma reestruturao da imagem de ns
e da lngua como mltipla, global e ferramenta internacional e local de comunicao (registros
mbitos ambientes comunidades utentes).
No eixo desta dupla AO-OA (Acordo Ortogrfico, Movimento Open Access)7 a Academia
Galega da Lngua Portuguesa, desde a sua fundao em 2008, dentro da sua definio antes
citada como instituio cientfica e cultural ao servio do Povo galego que pretende promover
o estudo da Lngua da Galiza para que o processo da sua normalizao e naturalizao seja
congruente com os usos que vigoram no conjunto da Lusofonia, tem ido desenvolvendo e
colaborando como parceiro em diversas ferramentas e recursos digitais.
1. Academiagalega.org.- desde 2009 e em parceria com a Associao Cultural Pro-Academia
Galega da Lngua Portuguesa, o stio foi desenhado pela empresa Eomtica para informar das
iniciativas, atividades da Academia Galega da Lngua Portuguesa, informaes e notcias sobre
a Lusofonia. Permite aceder a todas as ferramentas, sites e publicaes da AGLP,
nomeadamente, Boletim em pdf e Lxico da Galiza para ser integrado no Vocabulrio
Ortogrfico Comum da Lngua Portuguesa.8
BEREC, 2011.
O acesso aberto (Open Access) cincia o movimento que persegue a disponibilidade livre e gratuita dos
contedos cientficos em internet. Apesar de tratar de uma iniciativa conhecida, existem ainda ideias confusas e
tambm ms interpretaes sobre alguns dos seus objetivos, caractersticas ou funcionamento. Os fundamentos e
antecedentes do acesso aberto devem entender-se como uma mudana radical no funcionamento do sistema de
comunicao cientfica, envolvendo uma anlise da situao das revistas cientficas e os repositrios (que
constituem as duas vias estabelecidas para conseguir esta mudana de modelo), as feies legais relacionados com
a informao cientfica, a atitude dos cientistas a respeito do acesso aberto e as polticas desenvolvidas para facilitar
a extenso deste modelo. (cf. Abadal, 2012).
6
A incluso de lxico da Galiza no FLiP 8 da Priberam responde ao trabalho da Comisso de Lexicologia e
Lexicografia da Academia Galega da Lngua Portuguesa. O Protocolo de Cooperao assinado com a Priberam implica
que mais contedos diferenciais do portugus galego sero acrescentados lngua comum atravs dos produtos
desta empresa; ver: <http://www.academiagalega.org/info-atualidade/portugues-da-galiza-no-flip-8.html>.
6

PLAT

V. 2. N.3

2013

85

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

O lxico da Galiza um documento elaborado pela Comisso de Lexicologia e


Lexicografia da Academia Galega da Lngua Portuguesa, que foi apresentado na Academia das
Cincias de Lisboa o dia 14 de abril de 2009, e atualmente integra 2000 vocbulos de uso
frequente na Galiza, ainda no integrados nos dicionrios gerais da lngua portuguesa.
Este contributo foi acrescentado ao Vocabulrio Ortogrfico da Lngua Portuguesa da
Porto Editora, lanado em outubro de 2009, e no programa FliP-8 da empresa Priberam, que
foi disponibilizado em agosto de 2010. Os utentes podem utilizar o corretor ortogrfico com as
diversas variedades do portugus
2. Web-sites associados, em parceria com diversas entidades e associaes civis,
acadmicas e culturais galegas e internacionais.
2.1. Ricardo Carvalho Calero.- homenagem no centenrio (2010).
2.2. Ernesto Guerra da Cal.- homenagem no centenrio (2011).
2.3. Signum.- suporte ao site da Associao de acadmicos e especialistas
internacionais para promover estudos da Marca.
- agrupadores de recursos e ferramentas formativas
3. Escritrios Netvibes9
compartilhveis livremente dentro da filosofia da Web 2.0 e Web 3.0. Desenhados com
Netvibes, desktop online baseado na tecnologia AJAX com um alto nvel de personalizao.
3.1. Escritrio AGLP. informaes e links institucionais, com ligaes institucionais,
parcerias e informaes.http://www.netvibes.com/aglp#AGLP_-_Apresentao
3.2. Survival Kit - estojo virtual que visa oferecer de forma rpida e intuitiva os mais
teis recursos de apoio para a aprendizagem e o uso correto do Portugus.
um escritrio muito simples e til, que pode integrar-se em qualquer computador com
ligao rede, desenhado para neofalantes, rapazes de liceu e gente que sabendo galego se
achegue ao portugus.
Com melhor esttica e muito mais simples em 2-3 abas rene numa principal os
melhores e mais efetivos recursos. Inseriu-se uma caixinha de multipesquisador (Google, Wiki
pt... ), outra de vdeos, um FLiP corretor, um conjugador de verbos, um dicionrio de pt, o
Estraviz, o Lxico, uma ligao a alguma biblioteca de clssicos em Portugus (BN e B Domnio
Pblico...)
uma
ligao
ao
PGL
e
outra
ao
Portulano
(AGLP).
http://www.netvibes.com/academia-galega-da-lingua-portuguesa#Survival_Kit
3.3. Portulano de Recursos - na imagem das velhas Cartas portulanos, este escritrio
uma soluo para navegar pela rede num momento em que a expanso de usos, sites e TIC,
est a produzir uma absoluta mudana na percepo do conhecimento.
Agrupa recursos em linha, enlaces, catlogos, dicionrios, corretores, bibliografias,
ligaes a bibliotecas virtuais, repositrios, e-books e informaes de utilidade para bom uso e
aprendizagem da lngua portuguesa. Ao jeito dos velhos Portulanos o escritrio desenha
percursos que permitem navegar a lngua com a maior certeza por rotas de destino a portos
cheios de mercadorias.
9

86

Apresentaram-se estas ferramentas no II Seminrio de Lexicologia.

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

uma ferramenta desenhada pela Academia Galega da Lngua Portuguesa como


agrupador de recursos e ferramentas formativas online, compartilhveis livremente dentro da
filosofia da Web 2.0 e Web 3.0.
Desenhado para uso da sociedade dentro dos princpios fundacionais da AGLP, est
especialmente dirigido a todos os galegos que tm interesse na lngua portuguesa e na cultura
lusfona e para todos os lusfonos com curiosidade sobre a Galiza.
Est estruturado nesta ordem sequencial:
- Recursos em lngua portuguesa: dicionrios, corretores ortogrficos, conjugao
verbal, recursos em traduo, gramticas, dicas para um portugus correto como o falar
com jeito; buscadores e ferramentas para a pesquisa lexicogrfica.
- Recursos gerais de informao; catlogos bibliogrficos, repositrios cientficos,
revistas e bibliotecas online; enciclopdias em linha, glossrios especializados,
toponmia, onomstica, etimologia e muito mais...
- Vria: RSS, debates, blogues e sites, jogos de lngua, destaques.
Alm disto tambm incorpora informao sobre a Galiza e o seu projeto reintegrante de
incorporao lusfona. http://www.netvibes.com/portulano#Portulano_de_recursos
4. Arquivo Digital-Repositrio da AGLP - desde 2011, um repositrio de objetos
digitais ou acervo de colees de informao em suportes digitais desenhado com o motor de
Software livre DSpace, criado pelo MIT, e com interface Manakin criada pela Biblioteca da
Universidade do Texas.
A interface pode ser extensivamente modificada pelos aspetos e temas baseado em
XSL. O DSpace disponibilizado livremente s instituies de investigao, sob a forma de um
produto de cdigo aberto, que pode ser livremente adaptado e expandido funcionalmente, nos
termos da BSD Open source license.
Aceita todas as formas de materiais digitais, arquivos de texto, imagem, vdeo e udio,
o que possibilita custodiar os mais variados tipos de contedos.
Os repositrios digitais so colees de informao em suporte digital (no apenas
documentos mas objeto / item). E esto associados s ideias de:
Suportes digitais (descarregveis)
Tecnologias digitais
Produo e transmisso digital (no meros documentos tradicionais digitalizados)
Contedos audiovisuais
Objetos de aprendizagem
Metadados, procura e etiquetagem automtica

PLAT

V. 2. N.3

2013

87

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

Tags: arquivo compartilhar formatos e-learning


Um repositrio visa ser parte da Web semntica, a web inteligente, capaz de conceder
um significado a um arquivo que ser disponibilizado para outros utilizadores, podendo ser
usado como fonte de pesquisa.
Os documentos so organizados em comunidades e colees e integrados por meio das
aplicaes de Dublin Core, esquema de metadados desenvolvido pela Dublin Core Metadata
Initiative (DCMI) para promover a adoo de padres de metadados, que visa descrever
objetos digitais utilizando XML (Extensible Markup Language) e o RDF (Resource Description
Framework).
Os metadados so as informaes que ficam embutidas nos formatos digitais e
permitem aos autores e aos editores adicionarem dados sobre tipologia e caractersticas, como,
quando e quem gerou os documentos. So informaes sobre a forma e contedo que facilitam
na WEB as buscas, o compartilhamento e a captura de arquivos entre sistemas. So
desenvolvidos a partir (e em funo) de dados, por isto que designado como dados sobre
dados ou informao sobre a informao.
A importncia dos metadados para a web semntica est basicamente ligada facilidade
de recuperao e interpretao dos dados por parte de humanos e de computadores.
As possibilidades de uso so:
Capturar e descrever documentos digitais de acordo com um workflow adaptvel aos
processos especficos de uma comunidade de usurios.
Distribuir os documentos digitais da instituio na Web, possibilitando a pesquisa e
obteno de cpias aos utilizadores,
Preservar os documentos digitais a longo prazo.
Possibilidade de enriquecer o documento com metadados facilitando a procura.
O arquivo organiza-se hierarquicamente em categorias e colees que agrupam
conjuntos documentais que integram por sua vez registros (simples/completos) e que se
completa com uma caixa de procura.
Categorias no repositrio
Colees
Conjuntos documentais
Registro (simple/completo)
Arquivos no item (ficha do registro)
Relaes com outros itens

88

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

A ficha catalogrfica de um objeto (os metadados que sero acrescentados a ela) um


registro eletrnico que contm descries desta e que permitem que se saiba do que se trata
sem ter que se ler ou ouvir todo o seu contedo. O registro seria uma representao do
documento com as suas relaes com outros documentos.
Os contedos gravaes audiovisuais, udios, fotografias e documentos pdf
apresentam-se sob Licena Creative Commons. (Pode ser copiado, distribudo, exibido e
executado com atribuio da fonte, desde que seja para fins no comerciais, no podendo criar
derivaes da mesma).
As Categorias no repositrio so:
1. Publicaes da Academia
2. Trabalhos acadmicos
3. Outros textos
4. Eventos comunicativos
5. Informativos
6. Vrios
Sendo 1. Publicaes da Academia, 4. Eventos comunicativos e 5. Informativos, as
categorias que atualmente contm a maior parte dos itens e documentos em pdf.
Nomeadamente a Categoria 1 contm os pdf dos 4 Boletins da Academia Galega da Lngua
Portuguesa editados mais o Anexo Galiza, lngua e Sociedade. Estes textos podem
descarregar-se livremente como conjunto ou como textos individuais.
Os eventos compem-se de udios, vdeos, fotografias e outros documentos
relacionados que se arquivam conforme sua procedncia tratando de recolher todo o dado de
origem, autoria, localidade e data de produo, reproduo, caractersticas tcnicas. Est
conformado por palestras, conferncias, debates, atos poticos e literrios gerados dentro do
movimento associativista galego em defesa da Lngua.
O arquivo digital da Academia Galega da Lngua Portuguesa foi desenhado com trs
objetivos: divulgao, formao e preservao:
Divulgao
Interveno programtica na Sociedade Civil Galega
Projeto reintegrante associativismo
Construo do portugus da Galiza
Formao
Carncias educativo formativas da sociedad
Suporte da AGLP
PLAT

V. 2. N.3

2013

89

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

Preservao
Documentao pblica e privada da AGLP
Acervo documental do associativismo
Memria do galego oral nos 1970-2000
Qualidade dos materiais e do seu tratamento
Origina-se na constatao do espalhamento e mesmo perda (por obsolescncia de
formatos por desapario de sites, rotura de links) de contedos audiovisuais importantes para
a histria contempornea da Lngua da Galiza e do Reintegracionismo10, e da necessidade de
dar corpo ao arquivo e produo divulgativa acadmica da Academia Galega da Lngua
Portuguesa.
Com poucos recursos materiais e humanos11 o processo exemplifica as possibilidades do
Software livre e do Movimento Open Access combinado com as possibilidades do Portugus
como lngua internacional de uso crescente.
A montagem e instalao do Dspace teve um demorado processo que se articulou no ano
2011. Aps a instalao e processo informtico e localizao no site procedeu-se adatao s
necessidades da Academia Galega da Lngua Portuguesa com trabalhos e reunies:
Traduo de contedos e sistema de metadados ao portugus (Pt_Gz)
Elaborao dos registros tipo e anlise dos metadados apropriados ao nvel mais
detalhado contidos nos prprios documentos e nos registros.
Estrutura do arquivo, implementao de pesquisas e conjuntos
Provas de catalogao
O resultado, em processo, um repositrio normalizado que disponibiliza materiais
textuais e audiovisuais de alta qualidade.
Os pontos fortes do AD so:
A qualidade do sistema, do material e padro nas ferramentas suportadas numa rede
internacional de desenvolvimento institucional e aprimoramento, o que garante
estabilidade, preservao, intercmbio padro e sustentabilidade ante as evolues
tcnicas
O detalhe e cuidado no tratamento do material digital pela escolha dos melhores
(qualidade e uso) programas e qualidade da cpia conservada (grfica, audiovisual)
10
O reintegracionismo, lusismo ou movimento lusfono galego o nome com que se conhece o movimento social
na Galiza que pretende a reintegrao da lngua galega no mbito lingustico portugus e de adaptar a ortografia
galega desse mbito. Tambm a corrente lingustica que defende essas teses.
11
Uma equipa formada por: trs acadmicos Dr. Celso A. Cccamo, professor de Lingustica Geral da Universidade
da Crunha; Vitor M. Loureno, Diretor do Portal Galego da Lngua e responsvel informtico do E-estraviz que foi o
coordenador; Dr. Ernesto V. Souza, na altura Bibliotecrio da Universidade de Valhadolid e Jos Antnio Cidre
Bardels, arquiteto, tcnico em informtica. Colaboram tambm regularmente no visionado, indizado e resume
documental M Jos Castelo Lestom e o acadmico Prof. Francisco Paradelo

90

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

O esforo na implementao de uma estrutura estvel e duradoira no tempo


Pontos fracos:
Falta de recursos econmicos e humanos
O voluntarismo do trabalho dos acadmicos coordenadores e do pessoal eventual de
apoio que fornece os recursos e contribui sua catalogao e reviso
A descontinuidade do prprio trabalho, efeito da no profissionalizao e da ausncia
de oramentos e por lgica da disponibilidade do trabalho.
Prximos passos do arquivo:
Continuar a ritmo que permitam os recursos para integrao de mais objetos no
arquivo previsivelmente nestes conjuntos:
Publicaes da AGLP
Eventos comunicativos
Documentos para a histria contempornea
Outras publicaes acadmicas
Melhorar o aprimoramento dos existentes, para facilitar a sua descarga, audio e
integrao dos documentos e dados em outros ficheiros e sistemas de gesto de
bibliografias
Campanha divulgativa para dar a conhecer o projeto e solicitarmos colaborao e
incorporao de recursos humanos e fundos documentais (udio e audiovisuais de
carcter histrico)12.

5 - Iniciativas promovidas pela AGAL nas que colabora AGLP


A Associaom Galega da Lngua (AGAL) uma associao sem nimo lucrativo,
legalmente constituda em 1981, que visa a plena normalizao do Galego-Portugus da Galiza
e a sua reintegrao no mbito lingustico a que historicamente pertence: o
galego-luso-brasileiro.
A AGAL busca a incorporao do galego ao mbito lingustico galego-luso-brasileiro.
Considera que o galego a denominao que o portugus tem na Galiza e assume que o nome
internacional portugus.
O local da AGAL na Internet conhecido como Portal Galego da Lngua.
5.1. E-estraviz - o mais completo dicionrio galego em linha, constantemente atualizado e
melhorado por uma equipa de at quinze pessoas, disponibilizado pela AGAL sob a direo do
prprio lexicgrafo e acadmico Isaac Alonso Estraviz.
12
O que se est a desenvolver com uma Campanha da Pro-AGLP de Informao pelas Escolas Oficiais de Idiomas,
Universidades e espaos Associativistas culturais da Galiza.

PLAT

V. 2. N.3

2013

91

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

Sem qualquer dvida, este um dos mais completos manuais das lnguas romnicas
publicados em internet, e o mais contrastado no que variante galega da nossa lngua
diz respeito, pois conta com um total de 127.316 entradas.
Como bom dicionrio manual, o e-Estraviz possui o lxico mais fundamental e completo
possvel, quer dos ramos cientfico-tcnicos quer das expresses mais populares. Por
isso, inclui abundante lxico cientfico e popular de mais uso.
Este dicionrio vai destinado para ser utilizado por toda a lusofonia, e, nomeadamente,
pela cidadania galega.
Desde 2011 prepara com apoio da Academia Galega da Lngua Portuguesa a sua
adaptao ao Acordo Ortogrfico.
5.2. PGL - O Portal Galego da Lngua - desde 2002, um site informativo e de debate da
Associaom Galega da Lngua que oferece notcias e opinio desde Galiza para o espao
lusfono. Tem-se convertido no verdadeiro espao de conformao e associativismo de valores
civis do reintegracionismo contemporneo13.
O Portal Galego da Lngua visa oferecer aos seus utentes (galegos, portugueses,
brasileiros e outros) todas as notcias da lngua, assim como uma especial preocupao
com o sempre precrio estado da lngua oral na Galiza.
O Portal Galego da Lngua uma das mais populares janelas que o Movimento Lusfono
Galego tem na Internet. O PGL, que tem as suas origens em 1999 com os primeiros
trabalhos da Associaom Galega da Lngua (AGAL), nos ltimos anos foi deixando num
segundo lugar o seu papel como stio corporativo desta organizao para ser um dos
referentes da atualidade lingustica do Pas.
O portal geral de notcias tem hoje em dia uma mdia de 30.000 visitas mensais; a
comunidade no seu conjunto (e-Estraviz, Blogues agal-gz, Planeta NH) tem chegado a
picos de at 100.000 visitas/ms.
Algumas das suas sees so Isso no galego, portugus (de ttulo irnico), Falar
com jeito (destinado aos galegos que, dada a sua situao, metem muitos
castelhanismos nos seus textos e falas), o dicionrio e-Estraviz da lngua
galego-portuguesa, a GZ-editora etc.
Outros sites da AGAL vinculadas ao Portal Galego da Lngua:
1. Planeta NH - ludo site de divertimento com perguntas e concursos. Projeto ldico
criado na Galiza para toda a Lusofonia. Para participar elaborando Jogos sobre os teus
temas de interesse.
2. Blogues AGAL - site da AGAL que fornece software e ajuda para a criao e concepo
de blogues pessoais e coletivos.
3. Imperdvel - loja on-line da AGAL onde possvel adquirir livros, msica e publicaes
galegas e da Lusofonia.
4. Wiki-Faq do Reintegracionismo - esta wiki pretende fornecer informaes tericas e
13

92

DURO, 2008.

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

prticas sobre o reintegracionismo, tanto sobre a filosofia como sobre o movimento


social. Se bem que esta wiki seja da Associaom Galega da Lngua, e logicamente preste
especial ateno a esta organizao lusfona, pretende dar uma viso geral sobre o
reintegracionismo.

6 - Concluso
Nestes momentos est a ser, e no futuro imediato o portugus ser ainda mais, uma das
lnguas com mais projeo internacional. Dizer portugus e galego o mesmo que dizer
espanhol e castelhano.
O portugus da Galiza, como variedade europeia do portugus, comea a ser conhecido
e reconhecido no espao lusfono (desde a sua participao nas negociaes do Acordo
Ortogrfico em 1986 e 1990), o que abre novas possibilidades para uma evoluo positiva da
questo da lngua na Galiza.
Um dos mbitos pioneiros e onde se tornou evidente esta realidade tem sido a internet.
Foros, correios, sites, colaboraes e contatos gerados pelos pioneiros num tecido de
intercmbio de informao e conhecimentos que comeam a dar os seus primeiros frutos em
forma de desenvolvimento de ferramentas, colaboraes e programas.
A integrao e participao com naturalidade da Academia Galega da Lngua Portuguesa
nos espaos internacionais de Lngua Portuguesa, por meio dos seus produtos e ferramentas,
ao mesmo tempo um anncio da mudana de narrativa que a respeito da questo galega e
da sua lngua se abre na Galiza e uma evidncia da pujante realidade internacional e de
intercmbio que a lngua portuguesa para todos os lusfonos.
No decurso deste desenvolvimento a lngua portuguesa passou a ser canal de
comunicao pelo que circulam e do que fazem uso estas novas comunidades. Nesse espao
internacional e social que se define pela internet, os conceitos de Lusofonia e Acordo
Ortogrfico tomam uma forma e valor que vai ser definitria, e em que podem entrar os
espaos galegos criativos, comunicativos, econmicos e sociais.

6 - Concluso
Advice to Authors: A guide to copyright and local deposit of full text. UCD Library v., n.
2011. < http://www.ucd.ie/t4cms/Guide75.pdf>
ABADAL, Ernest. 2012. [e-Book] Acceso abierto a la ciencia Barcelona, Editorial UOC.
<http://eprints.rclis.org/bitstream/10760/16863/1/2012-acceso-abierto-epi-uoc-vfinal-autor.
pdf>
Academia Galega da Lngua Portuguesa
<http://www.netvibes.com/aglp#AGLP_-_Apresentao>
Academia Galega da Lngua Portuguesa. Arquivo Digital:
<http://arquivo.academiagalega.org/xmlui>
Academia Galega da Lngua Portuguesa (2009) Galiza: Lngua e Sociedade (XIV Ensaios) Anexo
1 do Boletim da Academia Galega da Lngua Portuguesa.
PLAT

V. 2. N.3

2013

93

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

Academia Galega da Lngua Portuguesa. Comisso de Lexicologia e Lexicografia. Lxico da


Galiza para ser integrado no Vocabulrio Ortogrfico Comum da Lngua Portuguesa, Santiago
de Compostela, novembro de 2011
<http://www.academiagalega.org/images/stories/2011/20111110_lexico_aglp.pdf>
ADNI, Rhiza. 2011. The Impact of Open Access Initiative on Knowledge Sharing. E-LIS. E-prints
in Library and Information Science. <http://eprints.rclis.org/handle/10760/16778>
AGAL (Associaom Galega da Lngua) <http://www.ir.gl/3fc44e>
BEREC 2011. [e-Book] BEREC Report on Open Access 2011.
<http://www.irg.eu/streaming/BoR%20(11)%2005%20BEREC%20report%20on%20Open%2
0Access_final.pdf?contentId=547137&field=ATTACHED_FILE>.
BOSO, Augiza Karla. 2011. Repositrios de Instituies Federais de Ensino Superior e suas
polticas:
anlise
sob
o
aspecto
das
fontes
informacionais.
Florianpolis.
<http://eprints.rclis.org/bitstream/10760/16156/1/Disserta%c3%a7%c3%a3o%20-%20Augi
za%20Karla%20Boso.pdf>.
CINTRA, Lus Filipe Lindley. 1971. Nova proposta de classificao dos dialectos
galego-portugueses. Boletim de Filologia, Lisboa, Centro de Estudos Filolgicos, 22, 81-116
<http://www.instituto-camoes.pt/cvc/hlp/biblioteca/novaproposta.pdf> (no PDF, p. 7).
Creative Commons <http://creativecommons.org/>
CRISTOVO, ngelo. 2008. Interveno de ngelo Cristvo, Representante da Associao
Cultural Pr Academia Galega da Lngua Portuguesa
<http://www.academiagalega.org/info-atualidade/interven-na-assembleia-da-repca.html>.
CUNHA, Celso; CINTRA, Lus Filipe Lindley. 1984.
Contemporneo. Lisboa: Edies Joo S da Costa, p. 10.
Dicionrio
Estraviz
On-line
e-estraviz
<http://www.estraviz.org/acerca-de.php>.

Nova

Gramtica

do

Portugus

<http://www.estraviz.org/>

DSpace <www.dspace.org>
MIT DSpace <http://dspace.mit.edu/>
Dublin Core Metadata Initiative < http://dublincore.org/>
DURO, Carlos. 2008. Sntese do Reintegracionismo contemporneo. Boletim da Academia
Galega da Lngua Portuguesa, n 1, 35-56
<http://arquivo.academiagalega.org/xmlui/handle/123456789/154>.
E-prints: <http://www.eprints.org/openaccess/>
Escritrio AGLP <http://www.netvibes.com/aglp#AGLP_-_Apresentao>
KENNAN, Mary Anne. 2011. Learning to share: mandates and open access. Library
Management. vol. 32, n. 4, 302-318. <http://dx.doi.org/10.1108/01435121111132301>

94

PLAT

V. 2. N.3

2013

CONTRIBUTO GALEGO PARA A LNGUA PORTUGUESA NA ERA DIGITAL: AS


FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LNGUA PORTUGUESA
Ernesto Vazquez Souza / Concha Rousia

KURAMOTO, Hlio. 2012. Acesso Livre: como tudo comeou. Blog


<http://kuramoto.blog.br/2012/02/27/acesso-livre-como-tudo-comecou/>

do

Kuramoto,

Manakin <https://wiki.duraspace.org/display/DSPACE/Manakin>
MONTERO SANTALHA, J. Martinho.1994. A lusofonia e a lngua portuguesa da Galiza:
dificuldades do presente e tarefas para o futuro. Temas de O Ensino de Lingustica,
Sociolingustica e Literatura, Ponte Vedra-Braga, Vol. VII-IV, n. 27-38 (1991-1994), 137-149.
<http://www.lusografia.org/mmontero.htm>
Netvibes <http://www.netvibes.com/>
PGL Portal Galego da Lngua <http://www.pglingua.org/>
Portulano de Recursos <http://www.netvibes.com/portulano>
PRO-AGLP <http://www.academiagalega.org/quem-somos/quem-somos.html>
Site AGLP <http://www.academiagalega.org>
Site Carvalho Calero <http://carvalhocalero.academiagalega.org/>
Site Guerra da Cal <http://guerradacal.academiagalega.org/index.php>
Site Signum <http://signum.academiagalega.org/>
SK - Survival Kit
<http://www.netvibes.com/academia-galega-da-lingua-portuguesa#Survival_Kit>

PLAT

V. 2. N.3

2013

95

MULTILINGUISMO NO CIBERESPAO:
A PARTICIPAO DO PORTUGUS
NUMA B@BEL DIGITAL?
Cludio Menezes
Sobre o autor
Universidade de Braslia, Brasil.
Email: claudiomenezes@unb.br
Webpage: http://let.unb.br/lea

Resumo
Para maior participao de uma lngua nos dias de hoje no se pode fechar os olhos para
uma realidade: o mundo digital um dos principais espaos para a vitalidade de uma lngua
em suas mltiplas dimenses. Por outro lado, graas s aplicaes das tecnologias da
informao e comunicao, as fronteiras para uso de uma lngua (no passado, exclusivamente
geogrficas) se dissolveram. Da a necessidade de alcanar e mobilizar falantes de outras
lnguas para que tenham interesse pelo portugus e vice-versa. Nesse contexto, a presente
comunicao se prope a apresentar o ambiente no qual uma lngua se desenvolve no mundo
digital, com uma breve descrio da situao estatstica das lnguas no mundo, concluindo com
algumas sugestes que podero contribuir para uma maior presena da lngua portuguesa no
ciberespao.

Palavras-chave
Portugus. Lngua. Mundo digital. Vitalidade lingustica. Ciberespao.

96

PLAT

V. 2. N.3

2013

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

1 - Contexto
Fenmeno iniciado nos anos 70 do sculo passado, nos dias de hoje testemunha-se um
acelerado processo de substituio de tecnologias analgicas por tecnologias digitais. Esse
processo, chamado de convergncia tecnolgica, viabilizou a transformao de texto, imagem
e som em arquivos digitais que puderam inicialmente ser tratados por computador e,
posteriormente, por diversos tipos de novos aparelhos digitais (i-Phones, i-Pads, Tablets etc.).
Acompanhado pela transformao das telecomunicaes, fator que permitiu alargar a
dimenses extremamente elevadas a banda de transmisso de dados, esse processo nos levou
situao que hoje vivemos no incio do sculo XXI: a invaso do nosso cotidiano pelas
aplicaes de computador e de outros instrumentos digitais e pelo acesso informao em
tempo real, intermediado pelas redes de telemtica.
No campo das lnguas, cujo uso era anteriormente limitado a territrio circunscrito pela
geografia, esse fenmeno conduziu a uma expanso da fronteira alcanada pelas lnguas tanto
a novos campos de aplicao como tambm sua utilizao em qualquer lugar do mundo
servido por uma infraestrutura de informao.
Pode-se observar que esse novo ambiente tecnolgico tem colaborado para uma certa
impopularidade do monolinguismo tradicional. Nos dias de hoje, no se pode imaginar um
jovem com pretenses monoglotas, e at mesmo adultos formados em uma cultura monoglota
se interessam pelo conhecimento de outras lnguas. De certa forma, esse boom faz com que
a comunicao intermediada pela transmisso por satlite e pelos aparelhos digitais induza
necessidade de uso de mais de uma lngua no crculo profissional e pessoal. No ser injusto
dizer que vivemos um momento de decadncia do monolinguismo e de ampliao do
plurilinguismo.
, portanto, no horizonte desse novo paradigma tecnolgico e social que se pode
pretender uma maior participao da lngua portuguesa nessa B@bel digital. Se se pretende
ampliar a vitalidade da lngua portuguesa em um contexto de multilinguismo, mandatrio
formular um novo enfoque no relacionamento com as outras lnguas, totalmente oposto ao
anteriormente adotado nos perodos de colonizao.

2 - Situao das lnguas no ciberespao


H diversos parmetros para avaliar a situao de uma lngua tanto no mundo real como
no virtual. Um conceito que j goza de certo reconhecimento internacional o de vitalidade
lingustica. Estudo da UNESCO a esse propsito indica que h 9 critrios (fatores) para se
determinar o grau de vitalidade/perigo e para desenvolver medidas para sua sobrevivncia ou
para a revitalizao lingustica:
1. Transmisso intergeneracional da lngua
2. Nmero absoluto de falantes
3. Proporo de falantes em relao ao total de uma populao
4. Mudanas dos domnios de uso da lngua

PLAT

V. 2. N.3

2013

97

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

5. Resposta a novos domnios e mdia


6. Disponibilidade de materiais para educao e alfabetizao numa lngua
7. Atitudes governamentais e institucionais e polticas, incluindo seu estatuto e uso
oficial
8. Atitudes dos membros de uma comunidade em torno da sua prpria lngua
9. Quantidade e qualidade da documentao (na e sobre uma dada lngua)
Dois estudos sistematizados tm servido como referncia para conhecer a situao de
algumas lnguas no mundo digital: o estudo elaborado por Daniel Pimienta, Daniel Prado e
lvaro Blanco e o censo desenvolvido periodicamente pelo Language Observatory Project,
coordenado pelo Prof. Yoshiki Mikami, da Technical University Nagaoka, Japo.
O primeiro desses estudos, com resumo editado pela atual Diviso para a Sociedade do
Conhecimento da UNESCO, foi publicado sob o ttulo Douze annes de msure de la diversit
linguistique sur lInternet: bilan et perspectives. Sua edio em francs e ingls est disponvel
em:
http://unesdoc.unesco.org/images/0014/001421/142186f.pdf (Francs)
http://unesdoc.unesco.org/images/0014/001421/142186e.pdf (Ingls).
Duas tabelas desse estudo podem ajudar a orientar polticas lingusticas voltadas para
assegurar a vitalidade do portugus no mundo digital. Seno, vejamos:

98

PLAT

V. 2. N.3

2013

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

Tabela 1 - Indicadores para as lnguas na Internet (2007)


EM
Falantes
(milhes) 1
Falantes em %
da populao
mundial
Internautas por
lngua (milhes)

Internautas
em % de falantes
Internautas
em % da
populao
mundial
% de internautas
por lngua
% de pginas
Web por lngua7
Produtividade
lingustica por
lngua8
Pginas Web
por internautas
em uma lngua
determinada

ES

670

FR
400

IT
130

PO
60

RO

AL
30

205

CAT
120

Total
6.6072

10,1%

6,1%

2,0%

0,9%

3,1%

0,5%

1,8%

0,1%

130%3

366

102

58

31

47

59

1.1545

54,6%

25,4%

44,9%

52,3%

23,1%

16,5%

49,1%

23,1%

17,5%6

5,5%

1,5%

0,9%

0,5%

0,7%

0,1%

0,9%

0,0%

17,5%

32%

9%

5%

3%

4%

0%

5%

0,2%

130%

45,0%

3,8%

4,4%

2,7%

1,4%

0,3%

5,9%

0,1%

100%

1,42

0,43

0,87

0,98

0,34

0,66

1,16

0,74

4,44

0,63

2,24

2,93

0,45

0,62

3,25

0,96

1
Fonte: Unio
Latina
Fonte:
Unio(2000).
Latina (2000).
2
Estimativa
da populao
mundial.mundial.
O nmero
total de
falantes
deveria,
no no
entanto,
se contadas
Estimativa
da populao
O nmero
total
de falantes
deveria,
entanto,ser
sermais
mais elevado,
elevado, se
as pessoas contadas
falando as
mais
de uma
lngua.
pessoas
falando
mais de uma lngua.
3
3
30% seria
umaseria
estimativa
intuitivaintuitiva
da populao
que fala
uma
Este dado
provavelmente
30%
uma estimativa
da populao
quemais
fala de
mais
de lngua.
uma lngua.
Este dado

prximo da realidade nos pases da OCDE, porm no na maior parte dos pases em desenvolvimento, onde uma
provavelmente prximo da realidade nos pases da OCDE, porm no na maior parte dos pases em
pessoa fala em mdia 2 ou 3 lnguas (como na frica).
desenvolvimento,
onde
uma pessoa fala em mdia 2 ou 3 lnguas (como na frica).
4
Fonte: Internet
Word Stats
(2005).
4
5
.
Estimativa do nmero total de internautas.
5
6
Estimativa
do nmero
total dedispondo
internautas.
Porcentagem
da populao
mundial
de acesso Internet.
6
7
Fonte: Funredes/Unio
(2005).
Porcentagem daLatina
populao
mundial dispondo de acesso Internet.
7
8
Relao entre
% de pginas Web
lngua e a % de usurios da Internet por lngua.
Fonte:a Funredes/Unio
Latinapor
(2005).
1

PLAT

Relao entre a % de pginas Web por lngua e a % de usurios da Internet por lngua.

V. 2. N.3

2013

99

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

Tabela 2 - Dados sobre a Diversidade Lingustica


(Fonte: Pimienta, Daniel et alii,
in Twelve years of measuring linguistic diversity in the Internet)

Na primeira das tabelas acima (Tabela 1), v-se que em 2007 estimava-se em 47
milhes o nmero de internautas de lngua portuguesa, correspondendo a 23% do total de
falantes (205 milhes poca).
J no estudo de Pimienta (Tabela 2), a posio do portugus oscila entre 1 e 5% em
relao ao ingls, durante as diversas medies efetuadas a partir de setembro de 1998.
J o estudo do Internet World Statistics (Grfico 1) aponta em 2010 a existncia de
82,5 milhes de usurios da lngua portuguesa na Internet, o que nos situa em 5 lugar no
ranking das lnguas mais usadas na Internet.

100

PLAT

V. 2. N.3

2013

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

Grfico 1 - Estudo do Internet World Statistics

Os indicadores acima nos permitem considerar que a participao do Portugus no mundo


Os indicadores acima nos permitem considerar que a participao do Portugus
digital promissora.

no mundo digital

importante considerar que a manuteno da vitalidade de uma lngua requer uma


preocupao e ao permanente, melhor dizendo, requer uma poltica de planejamento

lingustico.

import

De acordo com o socilogo Pierre Bourdieu9, uma relao de comunicao lingustica


Ver A Economia das Trocas Lngusticas, Reproduzido de BOURDIEU, P. Lconomie des changes linguistiques.
Langue
Franaise,
34,
Maio
1977.
Traduzido
por
Paula
Monteiro,
disponvel
em
http://www.taddei.eco.ufrj.br/AntCom/Bourdieu_1983_EconomiadasTrocasLinguisticas.pdf
9

PLAT

V. 2. N.3

2013

101

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

essencialmente uma relao de fora simblica, determinada pela estrutura do grupo social em
que ocorre a comunicao. No entanto, h que considerar que a lngua opera tanto no campo
da economia como em outros campos da sociedade. Ademais, com o processo de
desterritorializao lingustica causado pelas tecnologias de informao e comunicao, o
antigo paradigma de comunicao monolngue foi abalado, visto que h uma tendncia
evidente de bi- ou at mesmo de plurilinguismo no mundo digital.
Por isso, j no mais pertinente que uma poltica de planejamento lingustico esteja
voltada exclusivamente para o monolinguismo. Tais polticas deveriam levar em conta tanto a
tradio em favor do monolinguismo que perdurou bastante tempo, como tambm o
relacionamento entre as lnguas faladas num espao geopoltico e o relacionamento entre as
lnguas no mundo digital.

3 - Metodologias e tecnologias para incluso e revitalizao


de lnguas no mundo digital
Por meio da Carta de Maputo, os participantes do Colquio de Maputo sobre a
Diversidade Lingustica nos Pases da CPLP, realizado de 12 a 14 de setembro de 2011 na
capital moambicana, emitiram uma serie de recomendaes ao Instituto Internacional da
Lngua Portuguesa sobre esse tema. De acordo com aquele documento, 5% da diversidade
lingustica mundial est situada nos pases da CPLP, correspondendo a mais de 300 lnguas,
alm do portugus.
Dentro desse cenrio, pode-se dizer que os pases da CPLP constituem um microcosmo
da diversidade lingustica mundial, o que nos permite a realizao de experimentos de
planejamento e poltica lingustica com bastante generalidade.
Embora no haja tempo para explorar em detalhe as metodologias, simbologias,
tecnologias e polticas de desenvolvimento de um multilinguismo no espao lusfono, vale
realar, a ttulo de informao, que a incluso de uma nova lngua no ciberespao requer as
seguintes etapas:
Escolha de um sistema de escrita (script) para a lngua (ou dialeto) oral;
Elaborao um sistema ortogrfico (diversas lnguas podem usar o mesmo script);
Mapeamento dos smbolos em uma tabela de cdigos digitais (Tabelas do Consrcio
UNICODE, www.unicode.org);
Padronizao de fontes de caracteres;
Desenvolvimento de software e hardware e produo de contedos;

te considerar que a manuteno da vitalidade de uma lngua requer uma preocupao e ao permanente, me
Importante:
Desenvolvimento de contedos locais digitalizados (incluindo
identificadores de contedos, tais como os IDNs Internationalized Domain
Names).

Cada uma dessas etapas envolve certo nvel de complexidade para assegurar a evoluo
da lngua oral ao objeto digital!

102

PLAT

V. 2. N.3

2013

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

4 - A promoo da vitalidade do Portugus


Inmeras aes de poltica e planificao da Lngua Portuguesa tm sido implementadas
com o objetivo de permitir a difuso internacional do nosso idioma. Um trabalho recente das
professoras Simone da Costa Carvalho e Margarete Schlatter intitulado Aes de Difuso
Internacional da Lngua Portuguesa10, detalha com bastante propriedade cada uma dessas
aes em diversos pases. Cabe destacar entre tais aes as seguintes:
Centros Culturais do Brasil (CCB), Institutos Culturais Bilaterais (IC) e Leitorados
Brasileiros;
Programa de Estudantes Convnio de Graduao (PEC-G) e de Ps-Graduao
(PEC-PG);
Certificado de Proficincia em Lngua Portuguesa para Estrangeiros (CELPE-BRAS).
Grupos de Ensino e Pesquisa de Portugus Lngua Adicional no Brasil;
Comunidade de Pases de Lngua Portuguesa (CPLP) e o Instituto Internacional da
Lngua Portuguesa (IILP);
Polticas de Promoo da(s) Lngua(s) no MERCOSUL;
Aes de Cooperao na rea Educacional para a construo de uma regio bilngue;
Projeto Escola Intercultural Bilngue de Fronteira (PEIBF);
Associao de Universidades - Grupo de Montevidu (AUGM);
Universidade Federal da Integrao Latino-Americana (UNILA);
Curso de Espanhol-Portugus para Intercmbio (CEPI).

5 - A atuao da UnB
O Instituto de Letras da Universidade de Braslia completa 50 anos em 2012 e sempre
teve uma atuao bastante intensa na promoo da lngua portuguesa, atravs dos seus 3
Departamentos:

or dizendo,

Departamento de Lingustica, Portugus e Lnguas Clssicas - LIP: www.unb.br/il/liv;


Departamento de Lnguas Estrangeiras e Traduo - LET: www.let.unb.br;
Departamento
Literria e
Literaturas promissora.
- TEL: www.telunb.com.br
requer
uma polticadedeTeoria
planejamento
lingustico.

Ao lado da formao de professores e das atividades sobre literatura portuguesa, h dois


destaques interessantes a mencionar aqui: o PEPPFOL - Programa de Ensino e Pesquisa em
Portugus para Falantes de Outras Lnguas (http://www.let.unb.br/peppfol) e o PBSL Portugus do Brasil como Segunda Lngua.
10

Publicado em Cadernos do IL, Porto Alegre, n. 42, junho de 2011, pag. 260-284

PLAT

V. 2. N.3

2013

103

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

O primeiro desses programas, o PEPPFOL, oferece cursos de Portugus a toda a


comunidade estrangeira da capital federal e a alunos conveniados. Desenvolve, tambm,
projetos de Formao Inicial Continuada para os alunos brasileiros dos cursos de Letras da
UnB, alm de realizar pesquisas nas reas de ensino-aprendizagem da lngua portuguesa e da
cultura brasileira, de formao de professores e da insero de novas tecnologias da
comunicao (TIC) para o ensino de portugus a falantes de outras lnguas.
A Licenciatura denominada Portugus do Brasil como Segunda Lngua (PBSL) tem por
meta a formao de professores de Lngua Portuguesa para ensinar o Portugus do Brasil
lngua, literatura e cultura a falantes e usurios de outras lnguas. Para maiores detalhes, ver
http://ovpunb.blogspot.com.br/2010/08/profissiografia-portugues-do-brasil.html.
No que diz respeito s lnguas faladas no espao lusfono, a UnB desenvolve diversas
iniciativas tanto no tocante a lnguas estrangeiras como s lnguas locais. So mantidas
diversas licenciaturas e bacharelados em lngua e literatura estrangeira e programas de
Mestrado e Doutorado em Lingustica Aplicada e Literaturas. No campo das lnguas locais, vale
realar o trabalho desenvolvido pelo LALI - Laboratrio das Lnguas Indgenas
(http://www.unb.br/il/lali), uma referncia de qualidade nesse campo de estudo no Brasil.
Um aspecto a destacar nessas atividades do Instituto de Letras da UnB o novo
Bacharelado em Lnguas Estrangeiras Aplicadas ao Multilinguismo e Sociedade da Informao
(LEA-MSI, http://let.unb.br/lea), criado no Departamento de Lnguas Estrangeiras e Traduo.
Criado na esfera do Programa de Apoio a Planos de Reestruturao e Expanso das
Universidades Federais (Reuni, http://reuni.mec.gov.br), esse Bacharelado, alm da
plataforma lingustica e suas respectivas culturas, se compe de trs eixos temticos:
udio-visual, terminologia e multilinguismo digital.
O eixo udio-visual inclui disciplinas de legendagem, udio-descrio, acessibilidade,
lnguas de sinais, entre outras.
O eixo multilinguismo digital aborda simbologias, metodologias, tecnologias e polticas
para incluso e/ou revitalizao de lnguas no mundo digital. Contm tambm diversas tcnicas
e uso de programas informticos orientados para facilitar o uso de lnguas estrangeiras no
mundo digital (por exemplo: programas de auxlio traduo, programas para elaborao de
pginas web multilngues etc.).
Detalhes
sobre
o
Bacharelado
LEA-MSI
http://let.unb.br/lea e http://let.unb.br/simc.

esto

disponveis

nas

pginas

6 - Concluses
Ao nosso ver, a participao e influncia do Portugus no mundo digital podero ser
asseguradas por trs eixos de ao, a saber:
a) aes circunscritas ao espao dos pases de lngua portuguesa: de certa forma, tais
aes so anlogas s que j foram citadas anteriormente (PEPPFOL, Escolas de Fronteira,
PBSL,etc.);
b) aes novas, destinadas a fortalecer um processo de reciprocidade com as lnguas
faladas no espao lusfono, nos termos preconizados pela Carta de Maputo;

104

PLAT

V. 2. N.3

2013

MULTILINGUISMO NO CIBERESPAO: A PARTICIPAO DO


PORTUGUS NUMA B@BEL DIGITAL?
Cludio Menezes

c) aes destinadas a permitir o uso de metodologias de incluso digital para as


comunidades de lnguas faladas no espao lusfono, por meio do uso das metodologias e
tecnologias da informao e comunicao.
Finalmente, gostaria de realar a necessidade de colaborao com as Academias de
Lnguas dos pases de lngua oficial portuguesa, e, em particular, com a Academia Africana de
Lnguas (ACALAN, www.acalan.org), no sentido de estimular a convivncia harmnica do
Portugus com as 339 lnguas faladas nos nossos pases.

Referncias
BOURDIEU, P. 1977. A Economia das Trocas Lngusticas. Reproduzido de BOURDIEU, P.
Lconomie des changes linguistiques. Langue Franaise, 34. Traduzido por Paula Monteiro,
disponvel
em
http://www.taddei.eco.ufrj.br/AntCom/Bourdieu_1983_EconomiadasTrocasLinguisticas.pdf
Carta de Maputo. 2012. RIILP, V. 1, N.1, 99-100.
CARVALHO, S. da C. & M. SCHLATTER. 2011. Aes de Difuso Internacional da Lngua
Portuguesa. Cadernos do IL. Porto Alegre, n. 42, 260-284.

PLAT

V. 2. N.3

2013

105

O CENTRO VIRTUAL CAMES:


DIVULGAO E FORMAO
Rui Vaz
Sobre o autor
Cames, Instituto da Cooperao e da Lngua, I.P.; Coordenador do Centro Virtual Cames.
Contato; rvaz@instituto-camoes.pt)

Resumo
O Centro Virtual Cames o stio na Internet do Cames, Instituto da Cooperao e da
Lngua, I.P. para apoio ao ensino e aprendizagem do portugus e formao dos agentes da
educao, bem como para a divulgao da lngua e cultura portuguesa. Numa era de
comunicao digital, em que as distncias geogrficas so encurtadas pelo recurso s
tecnologias de informao, o ensino a distncia torna-se ferramenta central das polticas de
ensino da lngua e cultura, sendo prioridade a sua ampliao. Nesta comunicao, sero
apresentadas as principais linhas de atuao do Cames, I.P. para, atravs do Centro Virtual
Cames, potenciar a promoo externa da lngua e da cultura portuguesas na Internet, assim
como promover a qualificao do ensino de portugus no estrangeiro.

Palavras-chave
Instituto Cames. E-learning. Contedos digitais.

106

PLAT

V. 2. N.3

2013

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

1 - Introduo
O Centro Virtual Cames o stio na Internet do Cames, Instituto da Cooperao e da
Lngua, I.P. para apoio ao ensino e aprendizagem do portugus e formao dos agentes da
educao, bem como para a divulgao da lngua e cultura portuguesa. Disponibilizando
gratuitamente contedos nesta rea, tem uma mdia de 500 mil acessos mensais.
Vou comear por contextualizar muito brevemente a ao do Instituto Cames atravs
da Internet e contedos digitais, apresentando de seguida os projetos desenvolvidos pelo
Centro Virtual Cames.
O Portugus uma das seis lnguas mais faladas do mundo, o que se reflete na posio
que ocupa nas lnguas mais usadas na internet a 5, de acordo com dados de 20111. Contudo,
um elemento do estudo da Unio Latina/FUNREDES no pode deixar de motivar a nossa
preocupao. Apesar do crescimento na utilizao, o ndice de produtividade das pginas web
por utilizador coloca-nos muito abaixo de outras lnguas, longe do nosso potencial.
Nesse sentido, os esforos congregados de todos os pases de lngua portuguesa para
prossecuo das linhas definidas no Plano de Ao de Braslia tornam-se prementes,
reforando a necessidade de um maior investimento pblico nesta rea.
Em particular nesta comunicao, teremos presentes as estratgias propostas pelo Plano
de Ao de Braslia de promoo e difuso do ensino da lngua portuguesa, nomeadamente
para a atualizao de bibliotecas virtuais e de utilizao das tecnologias de informao e
comunicao no ensino presencial e a distncia.

2 - Contribuio Cames, I.P.


O Cames, I.P. de acordo com a sua atual Lei Orgnica (Decreto-Lei n. 21/2012, de 30
de janeiro), tem como atribuies, entre outras:
Promover, coordenar e desenvolver a realizao de cursos de lngua portuguesa e
outros contedos culturais, quer em sistema presencial, quer por recurso a tecnologias
de informao e comunicao;
Conceber, promover, propor, apoiar e executar a produo de obras e projetos de
divulgao da lngua e da cultura portuguesas no estrangeiro;
O desenvolvimento e promoo da utilizao de plataformas para o ensino e a
aprendizagem do portugus distncia e a divulgao da cultura portuguesa.
Assim, especialmente atravs do Centro Virtual Cames, o Instituto Cames d resposta
concretizao dos seus objetivos de:
Ampliao da oferta da aprendizagem, a distncia, da Lngua e da Cultura
Portuguesa, nomeadamente atravs de cursos de portugus para estrangeiros e de
contedos destinados a aprendentes avanados da lngua portuguesa;
1

(http://www.portalingua.info/pt/observato).

PLAT

V. 2. N.3

2013

107

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

Promoo de nova imagem do patrimnio cultural portugus proporcionando


maior visibilidade das novas formas de expresso e novos valores.
As tecnologias de informao e comunicao so o meio privilegiado para a
implementao de programas de:
Criao/atualizao de contedos e servios em linha nas reas da informao
cultural e do ensino a distncia, incluindo contedos para apoio dos docentes de PLE.
Promoo de uma imagem externa de qualidade da cultura portuguesa.
O Centro Virtual Cames responde ao desafio expresso na Comunicao da Comisso ao
Parlamento Europeu, ao Conselho, ao Comit Econmico e Social Europeu e ao Comit das
Regies, intitulada Multilinguismo: uma mais-valia para a Europa e um compromisso comum,
designadamente quando se afirma:
Face a uma economia cada vez mais globalizada e eletrnica e a uma massa crescente
de informao em todas as lnguas imaginveis, importante que os cidados possam aceder
e utilizar essa informao e todos os servios, ultrapassando as barreiras nacionais e
lingusticas, atravs da Internet e dos disponveis mveis. As tecnologias da informao e da
comunicao (TIC) precisam de estar conscientes e de promover a criao de contedos em
diferentes linhas.
E tambm tem presente que o investimento no Multilinguismo se faa em interao com
a Escola, a Universidade, espaos, por excelncia, do conhecimento, da memria cultural ativa,
da socializao, e que tero de assumir plenamente uma dupla funo: a de, sob o ponto de
vista tico, capaz de formar em funo das ligaes necessrias e oportunas entre o ser e o
saber, de atualizar a dimenso do saber-ser, sem prejuzo do saber-fazer; a de dotar os
cidados de uma maior capacidade cientfica, que lhes assegure a confiana necessria a serem
mais autnticos e mais livres e, logo, a tornarem-se exemplos de maior dimenso humanista.
Ao mesmo tempo tem presente o conceito de flexieducation, proposto pela Dinamarca
em 2009, em resposta aos desafios das alteraes demogrficas e do progresso
tecnolgico, bem como questo do contributo do novo quadro estratgico proposto para a
cooperao europeia em matria de educao e formao, o qual combina flexibilidade e
educao, formal ou no formal. Trata-se de reconhecer competncias, (afirma)
aproveitando a experincia e as capacidades das pessoas.
Neste contexto, tem vindo o IC a estabelecer parcerias com universidades ou a chamar
investigadores para a coordenao dos seus projetos, que poderemos agrupar em trs eixos:

108

PLAT

V. 2. N.3

2013

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

Eixo 1

Eixo 2

Eixo 3

Espao

Espao

Espao

de

de

de

Saber

Criao de saber

Formao

vivo e circulante

interativo e

contnua e

Em progresso

Ao longo da vida

2.1 - Espao de Saber


Enquanto Espao de Saber, o CVC investe, investir nos seguintes projetos:

Biblioteca digital

Bases temticas

Exposies virtuais

A Biblioteca Digital do CVC dispe para leitura gratuita ttulos de 12 reas do saber,
da Arquitetura Msica, passando, por exemplo, do Cinema Literatura, da Educao
Geografia, da Etnologia Histria.
Com cerca de 2.400 ttulos, a Biblioteca Digital Cames tem tido um crescimento de
10%/ano, objetivo que nos propomos manter em 2012, principalmente atravs do reforo da
oferta, com a digitalizao das edies da Comisso Nacional para a Comemorao dos
Descobrimentos Portugueses e o alargamento de protocolos com editoras. Outra tendncia
passar pela otimizao de obras existentes para formatos amigveis de leitura em
dispositivos mveis, correspondendo aos desejos dos nossos utilizadores.
s Bases Temticas do CVC agora disponveis, relativas a Navegaes Portuguesas,
Cincia em Portugal, Figuras da Cultura Portuguesa, Literatura Portuguesa, Cinema Portugus
e Histria da Lngua Portuguesa, Msica Portuguesa dos sculos XIX, XX e XXI, Arte e Artistas
em Portugal, em permanente atualizao, acrescer brevemente uma nova sobre Teatro
Portugus (Centro de Estudos de Teatro).
As Exposies Virtuais do CVC, compostas com carter tambm pedaggico,
constituem formas de divulgao do saber, nomeadamente sobre a Lngua Portuguesa e a
Literatura Portuguesa e as Literaturas que em Lngua Portuguesa se escrevem, como, a ttulo
exemplificativo, a exposio Novas Textualidades, que integra Vozes dos OITO da CPLP,
querendo, como o dizem as suas comissrias, dar a palavra aos novos... e o lugar s novas
textualidades e utopias, porque, se a modernidade se construiu com base em grandes
PLAT

V. 2. N.3

2013

109

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

meta-narrativas () A ps-modernidade traduzir o princpio inverso: da incredulidade e da


fragmentao de significados face ao passado recente. Sero publicadas novas exposies
virtuais de exposies produzidas pelo Cames, I.P. para circulao presencial, como a que
agora se inicia itinerncia sobre Azulejo Portugus.

2.2 -Espao de Criao de Saber


Enquanto Espao de Criao de Saber, o CVC aposta, quer sistematicamente apostar:
a) na divulgao do Novo Saber produzido pela investigao i) das Ctedras criadas
em parceria com o Instituto Cames; ii) dos bolseiros do Instituto Cames; iii) dos
professores e investigadores que, participando em Congressos apoiados pelo
Instituto Cames ou proferindo Conferncias em Leitorados do IC venham a
disponibilizar as suas investigaes e comunicaes, a serem publicadas na Biblioteca
Digital Cames;
b) na promoo e disponibilizao de Tecnologias de Informao Lingustica do
Portugus, hoje indispensveis para a promoo da diversidade lingustica, reforando
a identidade de cada uma delas pela via dos sistemas de conhecimento.
Alm dos projetos TemaNet e Lextec, est em desenvolvimento uma wordnet que
inclua todas as variedades do Portugus. Pretende-se, como resultado tangvel, uma wordnet
do Portugus que integre 10 000 ns (conceitos), com as correspondentes lexicalizaes de
todas as variedades do Portugus, devidamente identificadas.

2.3 -Espao de Formao


Enquanto Espao de Formao, o CVC desenvolve Cursos de Aprendizagem e
Formao nas reas da Lngua Portuguesa, das Literaturas em Lngua Portuguesa e da Cultura
Portuguesa.
Assim, na rea da aprendizagem, o CVC oferece os seguintes Cursos:

Portugus LE, Lngua do Portugus


Quotidiano

LE,

Lngua Portugus LE, Lngua de

para Fins Especficos

Criao

Portugus I, II e III (nveis Portugus para Negcios

Laboratrio

A1 a B2)

Criativa

Portugus para Medicina

de

Escrita

Escrita Jornalstica
De destacar ainda o curso de Intercompreenso Portugus / Espanhol / Francs,
que visa proporcionar uma abordagem alternativa s lnguas estrangeiras, destinada a jovens
adultos e a adultos que pretendam sobretudo ler nessas lnguas (jornalistas, tradutores,
agentes culturais, investigadores nas mais diferentes reas do saber, estudantes do ensino
mdio-avanado e superior, etc.).

110

PLAT

V. 2. N.3

2013

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

Se pensarmos que cerca de 798 milhes de pessoas tm como lngua materna ou


segunda uma lngua romnica, este projecto poder dar um pequeno contributo para a
intercompreenso de vrios povos.
Outros cursos de Portugus para Fins Especficos esto em desenvolvimento,
nomeadamente para portugus para diplomatas.
Na rea da Formao propriamente dita, o CVC dispe de Cursos em trs reas:

Ensino

Traduo interpretao

Cultura

Ensino e Aprendizagem do Traduo e Tecnologias de

Ps-graduao em Cultura

Portugus Lngua Segunda

Portuguesa Contempornea

Materiais

Interativos

Informao Lingustica

para Interpretao

Portugus Lngua Segunda na Conferncias

de Literatura

Dramtica

Portuguesa Contempornea

Web 2.0
A Nova Norma Ortogrfica

Novssima

Poesia

da Lngua Portuguesa

Portuguesa e a Experincia
Esttica Contempornea

Pragmtica

Lingustica

Literaturas

Ensino

Portugus:

Lngua Portuguesa

do

Africanas

de

Comunicao Oral e Escrita


Formao de professores na e

Estudos

para

Atlnticos Sul

atravs

intercompreenso
de

Ps-Coloniais:

prticas

colaborativas on-line
Meio sculo de literatura

Patrimnios

portuguesa: 1880-1930

Portuguesa
Primeira

de

Influncia

Repblica

Republicanismo

PLAT

V. 2. N.3

2013

111

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

O Centro Virtual Cames realizou nos ltimos 5 anos cerca de 150 cursos, abrangendo
cerca de 3.000 alunos. Fruto de parcerias com Universidades e ctedras do Cames, I.P. ou
atravs de encomendas a especialistas e investigadores, que chamamos a colaborar connosco,
um aspeto fundamental destes cursos prende-se com a sua creditao. Consequentemente,
os nossos cursos online so creditados quer com ECTS (European Credit Transfer System)
pelas universidades parceiras quer diretamente pelo Centro de Formao de Professores do
Instituto Cames, acreditado pelo CCPFC (Conselho Cientfico para a Formao
Contnua-Ministrio da Educao e Cincia).
To importante quanto a quantidade, a perceo de qualidade dos servios prestados
nesta rea e a satisfao dos utilizadores reforam a ideia de que estamos no caminho certo.
De acordo com os questionrios sobre qualidade mdia da oferta formativa no ensino a
distncia:

Classificao
5) Muito Bom
4) Bom
3) Razovel
2) Fraco
1) Mau
TOTAL

(%)
46,4%
43,7%
9,2%
0,6%
0,1%
100%

Na rea do b-learning, apoiamos a formao contnua, em regime misto, presencial e


distncia (b-learning) de intrpretes da Unio Africana (UA), deputados e funcionrios do
Parlamento da frica do Sul, bem como aos funcionrios da CEDEAO (Comunidade Econmica
para o Desenvolvimento da frica Ocidental), estando a ser desenvolvido outro projeto na rea
da traduo e interpretao com a Universidade Pedaggica de Maputo, Moambique.
Em preparao encontra-se um projeto para Ensino de Portugus no Estrangeiro, 3 ciclo
e secundrio (14-18 anos), que complementar a presena dos cerca de 500 docentes de
Lngua Portuguesa que o Cames tem atualmente na sua rede de ensino bsico e secundrio
em Espanha, Andorra, Frana, Reino Unido, Sua, Alemanha, Luxemburgo, Blgica, Holanda,
frica do Sul, Nambia e Suazilndia, assim como a qualificao desta rede nos Estados Unidos,
Canad e Venezuela.

4 - Concluso
Atravs do Centro Virtual Cames, o Instituto Cames d um contributo direto criao
e produo prpria de contedos em lngua portuguesa, e, indiretamente, apoia o seu
desenvolvimento atravs de protocolos com instituies de investigao, oferecendo,
finalmente, visibilidade a produtos de investigao, desta forma colocados ao dispor da
comunidade.
necessrio portanto prosseguir individualmente e em colaborao com os restantes
pases de lngua portuguesa, no quadro das organizaes oficiais, na concretizao de medidas
de criao e de apoio criao, de forma a reforar a presena da lngua portuguesa na
internet.

112

PLAT

V. 2. N.3

2013

O CENTRO VIRTUAL CAMES: DIVULGAO E FORMAO


Rui Vaz

PLAT

V. 2. N.3

2013

113

INTERNET: A NOVA GRANDE


CARAVELA DA LNGUA
PORTUGUESA NA ERA DIGITAL
Afonso Joo Miguel
Sobre o autor
Instituto Superior de Cincias de Educao (ISCED), Luanda, Angola.
Contato: manafonso@hotmail.com

Resumo
Este texto invoca as origens da nossa magna lngua portuguesa, para se compreender
a sua importncia no mundo actual, dominado pelas TIC, e lanar um olhar para o seu futuro,
que se quer mais promissor e actuante. Como se sabe, a lngua levada pelos navegadores
portugueses e acolhida pelos autctones constitui hoje o elemento aglutinador dos nossos
povos na CPLP. Se, no passado, esta lngua portuguesa viajou de caravelas, hoje meios mais
eficazes so-nos fornecidos pela cincia e pela tcnica, dentre as quais a internet. E um facto
inquestionvel que, em pleno sculo XXI, a internet facilita a divulgao da lngua portuguesa,
une os falantes desta lngua e anula as distncias temporais e geogrficas, criando um espao
virtual comum. A dimenso da lngua portuguesa no mundo virtual parece estar condicionada,
entretanto, ao desenvolvimento socioeconmico, cientfico e tecnolgico das nossas
sociedades, o que passa necessariamente pelo fortalecimento das instituies nacionais. Neste
caso, o conhecimento das potencialidades particulares de cada pas, nos domnios em apreo,
afigura-se como uma premissa fundamental. Contrariamente ao passado, nos nossos dias,
deve-se respeitar a identidade de cada povo, que se rev na lngua portuguesa, refreando os
interesses de carcter meramente hegemnico e comercial. Este facto pressupe, portanto, o
reconhecimento das especificidades sociolingusticas de cada pas membro da CPLP, o que
passa, por exemplo, pela insero das terminologias cientficas e tcnicas locais no portugus
comum a usar na internet e noutros meios digitais.

Palavras-chave
Lngua portuguesa. Valor e difuso. Internet e ferramentas digitais.

114

PLAT

V. 2. N.3

2013

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

1 - Ponto prvio
A minha comunicao, inserida no Colquio Internacional sobre a Lngua Portuguesa na
Internet e no Mundo Digital, intitula-se A internet: a nova grande caravela da lngua
portuguesa na era digital, e d origem a este texto. O ttulo em si uma metfora que invoca
o passado da nossa magna lngua, como dignamente a caracterizou Pessoa, e uma verdadeira
exaltao da sua atualidade, para se compreender a sua importncia no mundo de hoje,
dominado pelas tecnologias da informao e comunicao (TIC), lanando-se assim um olhar
para o seu futuro, que se quer mais promissor e actuante.
Como se sabe, a lngua levada pelos navegadores portugueses naquelas mticas
embarcaes, sob o signo dos descobrimentos martimos, e acolhida amigavelmente pelos
autctones, constitui hoje o elemento fundamental que aglutina os nossos povos na CPLP, sob
o princpio da unidade na diversidade.
Tomo aqui como ponto de referncia o meu Pas, Angola, para apresentar cerca de
quatro pontos que constituem o essencial da minha abordagem, nomeadamente: i) um pouco
de histria, no qual fao uma breve incurso histrica da LP; ii) a hora da internet, procurando
enfatizar a importncia deste e de outros meios tecnolgicos na (re)afirmao global LP; iii)
constatar a realidade para fazer uma breve anlise do contexto angolano no que tange ao uso
da internet e outras ferramentas digitais; iv) alguma prudncia, chamando a ateno para a
necessidade de respeito pelas diferenas socioculturais dos nosso pases, na hora das decises
para a concepo e elaborao de uma plataforma comum para o uso do portugus na internet.

1.1 - Um pouco de histria


Nunca se falou tanto da lngua portuguesa como agora. Com estes ecos, ressurgem
sempre na memria as imagens do longnquo sculo XV (1482), quando as caravelas, idas do
Tejo, sulcaram as guas do Atlntico, em busca de novos portos dourados. Ventos ocidentais
sopraram as velas rumo s terras do Oriente, onde abundavam preciosidades, mas levavam,
tambm, consigo uma outra riqueza: a lngua portuguesa. Ento, quis o fado (destino) ou o
acaso que um desses primeiros portos fossem as terras de Mwene Kongo (manicongo). Do
Atlntico, a armada de Diogo Co avista a foz de Nzadya Kongo (rio Zaire), onde viria a
atracar definitivamente.
Depois de ultrapassadas as desconfianas mtuas, estabeleceram-se os primeiros
contactos, troca de embaixadas, enfim, a amizade. E neste contexto, pode-se perceber que as
lnguas de ambos os povos (kikongo e portugus) foram o elemento fulcral nessa interaco,
fosse o que o fosse o nvel e a performance do seu uso nesses primeiros contactos.
A par do cristianismo e da cultura, a lngua portuguesa foi, no princpio, voluntria e
amavelmente acolhida pelos nativos congueses, partindo do desejo dos prprios soberanos do
Kongo, com a colaborao da monarquia portuguesa. Por exemplo, mesmo ainda em finais do
sculo XV, a pedido do rei do Kongo, Nzinga Nvemba (Nkuvu), D. Joo II, o rei de Portugal,
apoia o seu homlogo em vrios domnios, dos quais se destaca o ensino e a aprendizagem da
lngua, conforme se ilustra nos seguintes testemunhos histricos:

PLAT

V. 2. N.3

2013

115

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

O rei do Congo apercebeu-se logo da distncia que havia entre a cultura europeia e a dos
africanos. Por isso teve o cuidado de pedir ao rei de Portugal que lhe mandasse padres,
mestres de letras e oficiais mecnicos (Martins dos Santos; apud Zau, 2007: 30).
O sculo XVI conheceu poucos monarcas to desejosos de que o seu reino fosse catlico
e o seu povo fosse educado e letrado como Afonso I. Interessante neste desejo real,
que este reino no era na Europa Catlica, mas em frica. Afonso I era rei do Congo1.
(Samuels, 2011: 25).
Mas a tarefa de inculcar o portugus no seio dos nativos pode estar ligada, inicialmente,
ao trabalho dos missionrios que, na sua tarefa de difundir o Evangelho e a F, foram tambm
ensinando a lngua portuguesa; depois, com a criao das primeiras escolas, primeiro no reino
do Kongo, no sculo XVI, depois no reino do Ndongo, um sculo mais tarde2. Esta aura
espalhou-se, pouco a pouco, pelo vasto territrio que hoje Angola.
Desenha-se uma nova arquitetura da lngua portuguesa com a emancipao poltica das
antigas colnias portuguesas, em frica, aquando das suas independncias. Angola, tal como
outros novos pases, adota o portugus como lngua oficial, uma deciso soberana, tomada em
funo da realidade scio-histrica da poca. Reala-se aqui a criao, posteriormente, de uma
organizao que aglutinaria os cinco pases africanos de expresso portuguesa: PALOP Pases
Africanos de Lngua Oficial Portuguesa , tendo como base uma lngua e um passado comuns.
O retoque final desse grande edifcio dado com a constituio da CPLP, em 1996, cujos
arquitetos j no so os caraveleiros, mas os governantes dos nossos estados soberanos. Com
esta nova estrutura, novos ventos sopraram para a lngua portuguesa e ela hoje um espao
comum, um dos elementos identitrios para todos aqueles que nela se revm; uma lngua que
hoje congrega povos e culturas, aglutina interesses e vontades, articula pensamentos e ideias,
entrecruza vivncias e sentimentos; inflama paixes e emoes; enfim, um patrimnio comum
de todos os seus falantes, independentemente da sua localizao espacial.

2 - A hora da internet
No mbito do colquio A lngua portuguesa na internet e no mundo digital muitas
coisas j foram ditas e outras h ainda por dizer sobre esse assunto (abordagens mais tcnicas
e refinadas). Por isso, no vou ser repetitivo e procurar, talvez, reconhecer apenas o valor da
internet e das ferramentas digitais no desenvolvimento e divulgao de qualquer lngua, nesse
sculo das novas tecnologias.
Se no passado a lngua foi levada para muitos pontos do Globo, de caravelas, hoje outros
meios de difuso mais eficazes e dinmicos so-nos fornecidos pela cincia e pela tcnica,
dentre os quais a internet e outras ferramentas digitais; quer dizer, hoje, os ventos virtuais que
sopram de e para todas as direces, impulsionados pelo desenvolvimento tecnolgico de um
mundo em constantes e cleres mutaes, constituem uma ferramenta ideal para que a lngua
portuguesa continue a trilhar o bom caminho.
Pelos dados disponveis, podemos reconhecer uma certa pujana do uso do portugus na
internet, conforme o testemunho seguinte:
1
Afonso I o nome adoptado pelo soberano do Kongo Nzinga Mbemba ou manicongo, aps sua converso ao
cristianismo e ao consequente baptismo.
2
cf. ZAU, 2007: 33.

116

PLAT

V. 2. N.3

2013

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

Uma das virtudes da internet para a lngua portuguesa foi o feito de unir, pela rede, os
milhes de falantes lusfonos espalhados pelo globo. Com essa unio, o idioma ganhou
fora e valor virtual. De 7. lngua mais falada na Web em 2007, o portugus hoje a
5., ficando atrs apenas do ingls, chins, espanhol e japons, que, com exceo do
Japo, possuem muito mais falantes do que os pases da CPLP. (in
http://iilp.wordpress.com/2012/03/31/lingua-portuguesa-vale-46-por-cento-do-pib-mu
ndial).
consabido que o desenvolvimento multissectorial de todo e qualquer pas passa, nos
dias de hoje, pela implantao e uso das tecnologias de informao e comunicao, tendo como
vector a lngua, que dever servir de elemento de charneira na articulao desses meios com
a sociedade. Entretanto, para que a lngua possa desempenhar o seu papel central/mediador,
precisa de acompanhar essa dinmica, o que pressupe necessariamente ajust-la aos
desafios do momento.
Inmeros so os meios ou recursos tecnolgicos que viabilizam esse propsito da lngua
portuguesa e de outras, destacando-se os seguintes: uso da lngua em espaos virtuais (stios
da internet, blogs; chats; redes sociais), ensino distncia, contedos multimdia
(videoconferncia, DVD, CD), telecomunicaes, investigao cientfica, etc. Em suma, hoje,
a internet e todos estes meios ajudaram a transformar as relaes lingusticas unilaterais do
passado em relaes multilaterais/transversais.

2.1. - Um facto, uma constatao


Diz-se que os factos falam por si e verdadeiro esse aforismo. No caso em apreo,
tenho constatado um facto interessante que pode ajudar a ilustrar o valor das novas
tecnologias na interao dos falantes da lngua portuguesa, fsica e virtualmente. Trata-se de
algumas emisses televisivas via satlite da DSTV/Multichoise Angola (tambm presente
noutros PALOP), atravs dos seus canais desportivos em portugus (Super Sport Maximo 1 e
2).
O extraordinrio nisso o facto de este meio ter a capacidade de juntar comentadores
(geralmente antigos praticantes) e jornalistas de vrios pases de lngua portuguesa e no s:
nos seus debates sobre o futebol, fazem um grande exerccio de difuso da lngua portuguesa.
Angolanos (Jesus), moambicanos (Tico-Tico; Trigo; Henrique Aly), portugueses (Manich, Rui
Almeida, Lus Boa Morte) e sul-africanos, provavelmente, descendentes de portugueses, todos
irmanados no esprito futebolstico celebram a universalidade da lngua portuguesa, evento
propiciado pelo recurso a meios digitais.
Creio que, desde as competies africanas de clubes e os Campeonatos Africanos de
Futebol das Naes (CAN), passando pelos jogos do futebol europeu, at as Copas do Mundo
(realce para a da frica do Sul), esta televiso, a par das outras aqui no mencionadas, presta
um grande servio lngua portuguesa, que est sempre presente, unindo provavelmente
milhes de aficionados ao futebol, espalhado em todos os cantos do mundo.
No meio de tudo isso, o que ganha com todo este exerccio lingustico a lngua
portuguesa, porque tudo feito nesta lngua, sem recurso a mediao alguma. Por isso, um
facto inquestionvel que, em pleno sculo XXI, estes meios facilitam a expanso e a divulgao
da lngua e interaco entre os falantes de portugus, ao mesmo tempo que anula as
distncias, quer temporais quer espaciais, reduzindo a descontinuidade geogrfica, que
caracteriza a nossa comunidade lingustica, criando um espao virtual comum.
PLAT

V. 2. N.3

2013

117

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

3 - Constatar realidades
mais do que evidente que a vitalidade da lngua portuguesa na internet e no mundo
digital est condicionada ao desenvolvimento socioeconmico, cientfico e tecnolgico das
nossas sociedades, o que passa necessariamente pelo fortalecimento das instituies
nacionais, tal como o reconheceu o Professor Joo Caetano, da Universidade Aberta, que uma
lngua no pode ser mais forte que os pases que a sustm. Na medida em que os pases
crescerem em importncia no palco mundial, tambm o portugus crescer3. Mrio Filipe da
Silva, do Cames, reala tambm esse facto ao considerar que:
investigadores reconhecem que, no futuro, o peso de uma lngua dever ser avaliado
principalmente pela fora da economia, do progresso cientfico, da qualidade
institucional e no apenas pelo nmero de falantes4.
Assim, urge mobilizar todos os recursos necessrios para o feito, com a
consciencializao e o envolvimento activo dos governos e de todos os utentes da lngua. Nesse
caso, o conhecimento das potencialidades particulares de cada pas nos domnios em apreo,
afigura-se como uma premissa fundamental, para garantir a solidez desse edifcio comum que
se pretende construir.
Na realidade angolana, em particular, longe dos nveis alcanados por outros pases da
CPLP, talvez mais para o Brasil e Portugal, o acesso internet e a outras ferramentas digitais
vai registrando um crescimento considervel, a julgar pelos servios e produtos oferecidos
nesse domnio e pelo nmero dos seus consumidores/beneficirios, sobretudo nas zonas
rurais5.
Sublinhem-se aqui a preocupao e o esforo do Estado Angolano, atravs do seu
Executivo, na criao de polticas e condies necessrias, que garantam o desenvolvimento
sustentvel do Pas no domnio das TIC, procurando dotar o cidado de ferramentas
indispensveis para enfrentar os desafios da era digital. E nesse mbito, destacam-se
seguintes aspectos:
Criao do Ministrio das Telecomunicaes e Tecnologias de Informao (MTTI; cf.
http://www.mtti.gov.ao/); destaca-se nessa instituio o Centro Nacional das
Tecnologias de Informao (CNTI; cf. www.cnti.gov.ao);
Criao do Ministrio do Ensino Superior e da Cincia e Tecnologia (MESCT; cf.
http://www.mesct.gov.ao/), entidade reguladora do ensino superior no Pas, que tem
como uma das incumbncias principais o desenvolvimento e a extenso do ensino
superior para todo o Pas. assim que, no quadro das polticas de redimensionamento
in http://iilp.wordpress.com/2012/03/31/lingua-portuguesa-vale-46-por-cento-do-pib-mundial/; replicado de
http://observatorio-lp.sapo.pt/pt/noticias/quanto-vale-um-idioma.
4
Ver http://observatorio-lp.sapo.pt/pt/noticias/quanto-vale-um-idioma; acesso em 31/03/2012..
5
Deve referir-se que, apesar de um certo crescimento nesse domnio, apenas um nmero reduzido da populao
tem acesso internet e, mesmo naqueles casos em que existe, esse servio ainda deficiente/incipiente. Por
exemplo, dados do Banco Mundial, no mbito do estudo do ndice do Desenvolvimento Humano (IDH) indicam que,
em 2009, apenas 3,9% da populao angolana (num universo de cerca de 16 milhes de pessoas) tinha acesso
internet
(cf.
http://www.google.com/publicdata/explore?ds=d5bncppjof8f9_&met_y=it_net_userp2&idim=contry:AGO&dl=pt-P
T&hl=ptPT&q=uso+de+internet+em+em+angola#!ctype=l&strail=false&bcs=d&nselm=h&met_y=it_net_user_p2
&scale_y=lin&ind_y=false&rdim=country&idim=country:AGO&ifdim=country&hl=pt_PT&dl=pt_PT&ind=false;
http://www.indexmundi.com/g/g.aspx?c=ao&v=118&l=pt).
Mas hoje tenho a certeza de que a realidade complemente diferente, embora no tenha dados atualizados para
ilustrar essa realidade.
3

118

PLAT

V. 2. N.3

2013

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

do ensino superior em Angola, o Pas conta hoje com seis universidades pblicas, alm
de vrios institutos superiores, aos quais se junta um nmero considervel de
instituies de ensino superior privadas (universidades e institutos politcnicos,
sobretudo). Como era de se esperar, quase todos estes estabelecimentos tm cursos de
licenciatura em Informtica e em Engenharia de Telecomunicaes, reas indispensveis
para a digitalizao massiva da sociedade.
Neste aspeto, interessa introduzir uma nota particular para falar um pouco da realidade
do Instituto Superior de Cincias de Educao de Luanda (cf. http://isced.ed.ao/). Como
instituio de ensino Superior vocacionada fundamentalmente para a formao de professores,
incluiu nos seus curricula a cadeira de Tecnologias de Educao, cujo funcionamento
assegurado por uma ao interdepartamental, que envolve os Departamentos de Cincias de
Educao, Cincias Exatas e Informtica. Atualmente est a decorrer o curso de ps-graduao
(Mestrado) em Tecnologias Educacionais, em cooperao com o Instituto Superior de Educao
da Universidade de Lisboa. O objetivo de tudo isto dotar o futuro professor de ferramentas
necessrias para enfrentar os desafios que a atual sociedade tecnolgica coloca.
Criao de domnios oficiais de internet para Angola (co.ao e it.ao), com a existncia
no Pas de um servidor de DNS, facilitando a concepo e elaborao de stios de internet
com identidade angolana. (cf. www.info-angola.ao/...). Por exemplo, a partir de pgina
oficial do Governo de Angola (cf. www.governo.gov.ao), todos os outros ministrios e
outras instituies possuem as suas pginas na internet, facilitando assim a informao
necessria, de modo virtual.
Construo de mediatecas nas 18 provncias do Pas, processo j em curso, por forma
a facilitar o acesso da populao (com realce para a estudantil) aos meios multimdia e
outros meios tecnolgicos afins;
Cresce o nmero de stios de internet, quer institucionais quer particulares, geridos
exclusivamente por angolanos. Reala-se tambm, nesse caso, um acesso quase
massivo s famosas redes sociais, por parte de angolanos, de todos os extratos sociais
(www.twitter.com; www.faceboock.com;www.youtube.com; www.sonico.com...).
Surgimento de empresas vocacionadas para a elaborao de produtos informticos
locais, criando condies para a afirmao de uma indstria digital, genuinamente
angolana (Sistec Solues, NCR Angola, TEC Informtica, Tech Industrial, Infornet);
Crescimento exponencial do nmero de usurios de telefonia mvel, televiso digital,
internet sem fio, e outros servios afins, cujos servios so assegurados por duas
companhias nacionais de telecomunicaes (Angosat, Angola Telecom, Movicel e Unitel;
Zap; Uau TV, DSTV/Multichoise Angola, Net Kuya), o que demonstra a importncia
desse sector na vida da populao;
Introduo dos servios electrnicos/digitais no domnio da banca, destacando-se as
caixas electrnicas, designadas, em Angola, por Multicaixa. Por exemplo, no mercado
angolano, surgem assim cartes de crdito VISA Mwangol, VISA Kamba, VISA Kumbu,
para as operaes financeiras internacionais, para alm os de uso interno.
Nesta era digital, evidente que a internet e outras ferramentas do mundo virtual jogam
um papel crucial para o desenvolvimento sustentvel de qualquer pas, inserido nesta aldeia
global, onde a partilha de informao e do conhecimento constituem uma premissa
fundamental.
PLAT

V. 2. N.3

2013

119

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

Creio, portanto, perante o quadro acima traado, que o que ganha com todo este
exerccio a lngua portuguesa, projetando-se cada vez mais, porque tudo feito nesta lngua,
sem recurso a lnguas estrangeiras. Por isso, possvel que pesquisas futuras sobre o uso do
portugus na internet, incluindo todos os pases da CPLP, podem ditar outros resultados, cuja
tendncia a subida da percentagem no ranking global.

3.1 - Uma experincia


Esta experincia tem a ver com o projeto de criao do Centro de Ensino a Distncia da
Universidade Agostinho Neto (CEAD-UAN; cf. http://cead-uan.com), do qual fiz parte; fui
convidado como docente do ISCED de Luanda para montar a cadeira de Lngua Portuguesa (da
qual fui Regente) e para a elaborao dos respectivos contedos.
A referncia particular desse centro neste trabalho resulta da sua relevncia na
implementao das TIC na sociedade angolana, podendo servir mesmo de modelo nesse
domnio. Pode considerar-se como uma das iniciativas pioneiras na rea do ensino distncia,
em sistema de aulas virtuais, em Angola.
Trata-se de um centro dotado de meios de alta tecnologia, criado com o apoio da
cooperao portuguesa e da Universidade Aberta de Lisboa. Neste mbito, o centro utiliza
essencialmente as seguintes ferramentas tecnolgicas para o ensino a distncia: Mikogo;
Skype; Office Comunication; Plataforma moodle/e-lerning (http://moodle.uan.ao/moodle/);
PSP; IPOD; MP3; smartboard6, dispondo de uma sala de videoconferncia, uma sala Web,
estdio de gravao audiovisual digital e sistema de converso em vdeo, para alm dos
servios de apoio editorial. No domnio dos contedos, destaca-se a produo dos seguintes
materiais, elaborados nas cadeiras de Lngua Portuguesa, Estatstica, Qumica e Informtica:
DVD, CD, gravaes de videoconferncias em suporte digital, PowerPoint assistido em
computador, Manual de Apoio e Guia de Estudo informatizados.
Essencialmente, a CEAD-UAN utiliza a VC como meio de comunicao principal nas suas
atividades de ensino distncia. Estas atividades reproduzem o modelo da aula clssica,
ministrada a distncia por recurso VC e complementada por diversos materiais de apoio e
pela possibilidade de interagir posteriormente via audioconferncia, e-learning ou correio
eletrnico (in Folheto informativo da CEAD-UAN, Luanda, 2009).

3.2 - Uma amostra:


Como amostra de trabalho que realizamos nessa instituio, foi exibido um vdeo de
uma aula virtual de lngua portuguesa, no mbito do ensino a distncia.
Sendo hoje uma realidade, a CEAD-UAN membro da: Global Development Learning
Network (GDLN), Rede Africana de Ensino a Distncia, Rede Lusfona de Ensino a Distncia7,
Rede Angolana de Ensino a Distncia e afigura-se como um grande parceiro do Executivo
angolano no desenvolvimento do pas, conforme os propsitos da sua criao, que assentam
fundamentalmente no seguinte objetivo global:
JOS, 2009.
Conforme se pode ler no projeto de criao do CEAD-UAN, neste momento existem apenas 4 centros GDLN em
pases lusfonos: Brasil: Centro GDLN de Braslia (GDLN Brasil); Moambique: Centro de Informtica da
Universidade Eduardo Mondlane (CIUEM); Portugal: Centro de Ensino a Distncia da Universidade Aberta
(CEAD-UAb); Timor-Leste: Centro de Ensino a Distncia - Dili (CEAD-Dili).
6

120

PLAT

V. 2. N.3

2013

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

O objectivo global deste projecto consiste em apoiar o processo de desenvolvimento em


Angola e, mais especificamente, as estratgias de reduo da pobreza, atravs da
promoo de programas de ensino, de actividades de (in)formao ou de simples troca
de experincias e conhecimentos por recurso s TIC e s metodologias de ensino a
distncia, por forma a contribuir para a qualificao de recursos humanos e instituies
e para o apoio tcnico resoluo de problemas relevantes ou implementao de
projectos de desenvolvimento. Uma ateno especial ser direccionada para a melhoria
do ensino superior publico nas Provncias. (in CEAD-UAN. Projecto da Rede de Ensino a
Distncia de Angola. Luanda, s/d, p. 2).
Uma das vertentes especficas do referido centro consiste em permitir dinamizar a
difuso global de contedos de formao em portugus e a partilha de boas prticas de
desenvolvimento entre instituies dos Pases de Lngua Portuguesa8. Nesse caso, o centro
pode funcionar, portanto, como mais uma das fontes de difuso e expanso desta lngua,
escala global, a julgar pelas suas potencialidades tecnolgicas, conforme descrito acima.

4 - Alguma prudncia e solidariedade


Tal como no passado, parece-nos que, tambm hoje, as razes econmicas esto
subjacentes nessa aventura da universalizao da lngua portuguesa. Mas, contrariamente
poca das caravelas, nos nossos dias, que se respeite a identidade de cada povo, que se rev
comumente na lngua portuguesa, em detrimento de interesses hegemnicos e comerciais ou
econmicos9. Este facto pressupe, portanto, o reconhecimento das diferenas ou
especificidades sociolingusticas de cada pas membro da CPLP, o que passa, por exemplo, pela
insero de termos locais, decorrentes ou no das lnguas autctones, no portugus comum a
usar na internet e noutros meios digitais. Uma das maneiras , sem dvida, o uso de glossrios
terminolgicos que venham a contribuir para a elaborao do Vocabulrio Tcnico e Cientfico
da Lngua Portuguesa.
Um trabalho conjunto ser a chave de sucesso para esta grande empreitada. E penso
que, mais uma vez, Brasil e Portugal, pela experincia acumulada nesta matria, devem
auxiliar tcnica e cientificamente os outros pases que necessitarem de apoio.
Por outro lado, necessrio que se acautelem os custos; ou seja, que se analisem os
aspetos econmicos decorrentes de uma plataforma comum para o uso do portugus na
internet (despesas e lucros), numa era em que tudo vendvel.

5 - Ntulas finais
1. A lngua portuguesa, inicialmente falada em Portugal, levada pelos navegadores
portugueses para outras partes do Mundo. Em contacto com realidades socioculturais e
lingusticas locais, esta lngua magna ganha novas matizes, novas coloraes, que se tornam
cada vez mais ntidas, medida que se consolida a sua universalidade, guindada pelos ventos
da era digital; uma vez mais internetalizada, rompe as barreiras do tempo e territoriais,
tornando-se assim uma lngua atemporal e do mundo.
COSTA, 2009: 4.
No se pretende aqui expressar, entretanto, uma viso utpica da questo, quando hoje dados objetivos
permitem aferir o valor econmico real da lngua, veja-se o caso particular de Portugal, no qual a lngua portuguesa
representa 17% do PIB desse pas.
(cf. http://iilp.wordpress.com/2012/03/31/lingua-portuguesa-vale-46-por-cento-do-pib-mundial/).
6

PLAT

V. 2. N.3

2013

121

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

Creio, portanto, perante o quadro acima traado, que o que ganha com todo este
exerccio a lngua portuguesa, projetando-se cada vez mais, porque tudo feito nesta lngua,
sem recurso a lnguas estrangeiras. Por isso, possvel que pesquisas futuras sobre o uso do
portugus na internet, incluindo todos os pases da CPLP, podem ditar outros resultados, cuja
tendncia a subida da percentagem no ranking global.
2. Apesar de certas limitaes, existem condies necessrias em Angola para o uso das
tecnologias de informao, em todos os domnios sociais, tendo como meio de expresso a
lngua portuguesa; entretanto, necessrio que se continue a mobilizar recursos tecnolgicos
e humanos, para se atingirem nveis satisfatrios nesse campo. Reala-se aqui o engajamento
e a preocupao das autoridades locais nas polticas de desenvolvimento centradas nas TIC.
3. A concepo de estratgias comuns para o uso da lngua portuguesa na internet e nos
meios digitais deve partir de um trabalho diagnstico em cada pas membro da CPLP, para se
ter uma ideia objetiva da realidade, aferindo assim as suas potencialidades nesse domnio.
4. A criao de espao comum do portugus na internet passa pela uniformizao de
certas linguagens, o que pressupe o uso de glossrios terminolgicos que venham a contribuir
para a elaborao do Vocabulrio Tcnico e Cientfico da Lngua Portuguesa, tendo em conta as
especificidades dos nossos pases.

Referncias
AEDO, R. F. et al. 2008. Introduo das Tecnologias da Informao e o Conhecimento em
Angola. O papel do professor e o estudante nessas mudanas. Revista Udesc Virtu@l. Vol. 1,
No 2.
http://revistas.udesc.br/index.php/udescvirtual/article/viewFile/1649/1328>.
CEAD- UAN (s/d) Projecto da Rede de Ensino a Distncia de Angola. Luanda.
CEAD-UAN (s/d) Folheto de Apresentao do Centro de Ensino a Distncia da Universidade
Agostinho Neto. Luanda.
CEAD-UAN. 2009. Folheto informativo da CEAD-UAN. Luanda.
COSTA, Jos Venncio da. 2009. O Ensino Distncia: uma Nova Estratgia de Ensino e
Aprendizagem na Universidade Agostinho Neto. II Seminrio Cintfico-Metodolgico sobre o
Ensino a Distncia na UAN. Luanda, de 15 a 16 de set. de 2009.
SAMUELS, Michael Anthony. 2011. Educao ou Instruo: A Histria do Ensino em Angola
[1878-1914]. Luanda: Mayamba Editora.
ZAU, Maria Ermelinda (Coord.). 2007. Uma Revoluo Silenciosa em Angola. O Ensino
Tcnico-Profissional antes e depois da Independncia: Uma Contribuio para a Histria da
Educao. Salvador, Bahia-Brasil, MED (Angola)/Raimundo Joo (Editor).

122

PLAT

V. 2. N.3

2013

INTERNET: A NOVA GRANDE CARAVELA DA LNGUA PORTUGUESA NA ERA DIGITAL


Afonso Joo Miguel

Sites
http://iilp.wordpress.com/2012/03/31/lingua-portuguesa-vale-46-por-cento-do-pib-mundial/
whttp://www.gov.ao/
http://www.isced.ed.ao/
http://www.mtti.gov.ao/Institucionais/Missao.aspx
http://www.mesct.gov.ao/Institucionais/Atribuicoes.aspx
http://www.indexmundi.com/g/g.aspx?c=ao&v=118&l=pt
http://observatorio-lp.sapo.pt/pt/noticias/quanto-vale-um-idioma
http://www.google.com/publicdata/explore?ds=d5bncppjof8f9_&met_y=it_net_userp2&idim
=contry:AGO&dl=pt-PT&hl=pt
PT&q=uso+de+internet+em+em+angola#!ctype=l&strail=false&bcs=d&nselm=h&met_y=it_
net_user_p2&scale_y=lin&ind_y=false&rdim=country&idim=country:AGO&ifdim=country&hl
=pt_PT&dl=pt_PT&ind=false

PLAT

V. 2. N.3

2013

123

CARTA DE GUARAMIRANGA

COLQUIO INTERNACIONAL DE GUARAMIRANGA


A LNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL
Os participantes do Colquio Internacional de Guaramiranga sobre o Portugus na
Internet e no Mundo Digital, organizado pelo Instituto Internacional da Lngua Portuguesa
(IILP), reunidos em Fortaleza, Redeno e Guaramiranga, Cear, Brasil, de 23 a 26 de abril de
2012,
considerando que:
- fundamental a presena das lnguas na Internet e no mundo digital para a cultura, a
economia, a educao e para o desenvolvimento da sociedade;
- necessrio manter e ampliar a vitalidade da lngua portuguesa na Internet, no mundo digital
e na sociedade do conhecimento em geral;
- a Internet pode propocionar acesso ao conhecimento e a oportunidades de aprendizagem e
formao;
- a revoluo tecnolgica estimula a criao de novos contedos, novas metodologias e
padres relacionados com a busca e avaliao de informao, formao do pblico leitor e
intercmbio do conhecimento;
- os suportes digitais atravs da Internet em particular so um meio menos oneroso da
publicao e disseminao de conhecimento;
- o portugus atualmente a quinta lngua com mais utilizadores da Internet, mas tem um
ndice de produtividade (nmero de produtores de contedos por falante) inferior ao das outras
lnguas mais usadas;
- a Internet pode funcionar como espao de confluncia para a lngua portuguesa, atenuando
os efeitos da disperso geogrfica dos pases que a adotaram como lngua oficial;
- a criao de novos recursos lingusticos e de meios digitais de difuso do conhecimento pode
permitir a instituio de um modelo aperfeioado de gesto das polticas da lngua portuguesa,
comum e mais representativo de todos os pases;

124

PLAT

V. 2. N.3

2013

CARTA DE GUARAMIRANGA

- a evoluo da Web mundial com a incluso de tecnologias semnticas, possibilitando novas


hiperligaes de contedos na rede carregados de sentidos, trar novos desafios para a
incluso da lngua portuguesa no estabelecimento de padres e metadados na Internet global;
- existem diversas iniciativas educativas e de difuso de cincia em portugus mas que as
plataformas que as alojam no esto ligadas e nem sempre permitem a interoperabilidade,
ocasionando redundncia e elevao de custos da criao de recursos;
- existem assimetrias e situaes diversas entre os diferentes pases quanto aos recursos
existentes;
- o sucesso das lnguas no domnio digital no depende apenas do seu uso efetivo na Internet,
mas tambm da sua utilizao nas ferramentas de processamento computacional;
- a incluso das lnguas nas ferramentas mais avanadas depende, por sua vez, da existncia
de conhecimento e de recursos lingusticos de base adequados s necessidades do
processamento computacional;
- necessrio ampliar as tecnologias da informao e comunicao para o uso e difuso da
lngua portuguesa na sociedade do conhecimento;
- combinada com aplicaes inteligentes, a tecnologia da linguagem contribuir para
concretizar o potencial da sociedade da informao: ajudar as pessoas a comunicarem entre
si, mesmo que no falem uma lngua comum; servir de apoio a interfaces intuitivas com todo
o tipo de dispositivos, desde eletrodomsticos at robs pessoais;
- iniciativas de criao de recursos lingusticos em andamento e futuras, como o Vocabulrio
Ortogrfico Comum (VOC), podem ajudar a reduzir o fosso na representatividade das
variedades do portugus nos pases em que falado;
- h centros de investigao com capacidade instalada para fazer avanar a tecnologia da
linguagem para a lngua portuguesa, sendo porm necessrio garantir foco estratgico para o
esforo aplicado a esta rea, de modo a manter a capacidade atual e alcanar um patamar de
produtividade sustentada;
e considerando, ainda, as recomendaes da Carta de Maputo sobre a diversidade lingustica
no espao da Comunidade dos Pases de Lngua Portuguesa (CPLP) e da Carta da Praia sobre o
portugus nas disporas, bem como as virtualidades das novas tecnologias da informao e
comunicao que apoiam estas recomendaes, os participantes do Colquio de Guaramiranga
recomendam ao Instituto Internacional da Lingua Portuguesa que:
- sejam desenvolvidos novos e mais aprofundados estudos sobre a presena do portugus na
Internet, no mbito de um observatrio especfico e que o IILP incentive a formao de redes
orientadas para a investigao e desenvolvimento de pesquisas na rea;
- os projetos internacionais de partilha de informao sejam estimulados, em ambiente
colaborativo, a par das iniciativas nacionais;
- se crie um grupo de trabalho no IILP para identificar e estudar os projetos e portais de
publicao de acervos de equipamentos culturais como bibliotecas, museus e repositrios
digitais de produo cientfica das diversas instituies dos pases da CPLP, para propor padres
e metadados comuns que proporcionem maior interoperabilidade internacional dos acervos e
catlogos da lngua portuguesa;
PLAT

V. 2. N.3

2013

125

CARTA DE GUARAMIRANGA

- estimule o desenvolvimento de uma gesto conducente disponibilizao digital atravs da


Internet dos acervos e da produo cientfica de universidades e outras instituies;
- defina polticas pblicas integrais (incluindo acesso, contedo e alfabetizao informacional)
para a presena no mundo digital das mais de 300 lnguas faladas no espao da CPLP;
- a Revista do Instituto Internacional da Lngua Portuguesa, meio potencialmente importante
para a presena do IILP na Internet, tenha arbitragem cientfica e seja indexada;
- incentive os governos a valorizarem a produo de cincia em portugus, concebendo a
internacionalizao da cincia no apenas no sentido de os falantes de portugus produzirem
no exterior, mas tambm no de atrair falantes de outras lnguas para a produo de cincia em
portugus;
- d seguimento proposio do Plano de Ao de Braslia e crie o Portal do Professor,
plataforma na Internet integrada no portal do IILP, para o ensino e apredizagem do portugus
comum a todos os pases da CPLP;
- colabore para que os portais oficiais dos governos dos pases da CPLP sejam escritos em
portugus e, se necessrio, traduzidos em outras lnguas.
Os participantes do Colquio de Guaramiranga recomendam igualmente a incorporao, na
discusso da Segunda Conferncia Internacional sobre o Futuro do Portugus no Sistema
Mundial, a realizar-se em outubro de 2012 em Portugal, e a incluso no Plano de Ao de
Lisboa para a Promoo, Difuso e Projeo da Lngua Portuguesa dos seguintes pontos:
- desenvolver polticas que atenuem o fosso existente entre pases quanto ao acesso ao mundo
digital e com a largura de banda apropriada;
- estimular a interoperabilidade entre recursos existentes, nomeadamente portais, podendo
alargar o mbito de pesquisa dos portais nacionais existentes a todos os pases de lngua
portuguesa;
- provocar a criao de recursos educativos digitais sobre a lngua portuguesa, tanto como
lngua materna como segunda;
- criar centros de recursos multimdia em linha nos pases atualmente com menor acesso
internet, que possam servir de apoio implementao de programas de formao,
particularmente em Lngua Portuguesa e em tecnologias da informao e comunicao quer a
distncia quer em b-learning (semipresencial);
- fomentar programas de pesquisa sobre processamento computacional da lngua portuguesa,
lingustica computacional e inteligncia artificial nas Universidades dos pases da CPLP;
- originar programas especificamente inter e multidisciplinares para a cincia e a tecnologia da
linguagem e o processamento computacional da lngua portuguesa;
- fomentar o desenvolvimento de recursos lingusticos e de ferramentas, necessariamente
padronizados, abertos e de distribuio livre, para o processamento computacional do
portugus e a implementao de aplicaes da tecnologia da linguagem aplicadas lngua
portuguesa;

126

PLAT

V. 2. N.3

2013

CARTA DE GUARAMIRANGA

- estimular programas de cooperao entre os pases de lngua portuguesa que promovam a


partilha e a transferncia de conhecimento e providenciem um igual estado de
desenvolvimento tecnolgico das diferentes variedades nacionais da lngua;
- promover a adeso a infraestruturas de investigao internacionais dedicadas
especificamente cincia e tecnologia da linguagem natural, como o caso do CLARIN, a
primeira infraestrutura internacional para a rea, criada em fevereiro de 2012;
- criar, no mbito do IILP, uma comunidade virtual que se constituir em um frum para debate
e acompanhamento das aes sobre a promoo da lngua portuguesa no universo digital;
- possibilitar o acompanhamento e a participao do IILP na iniciativa em curso Ambiente
Colaborativo em Governo Eletrnico da CPLP http://cplp.governoeletronico.gov.br/
- estimular, atravs da difuso de contedos televisivos, a presena da lngua portuguesa nos
meios internacionais de comunicao e em pases falantes de outras lnguas; igualmente
promover o desenvolvimento e acesso a contedos educativos em portugus atravs das meios
de comunicao digitais;
Essas recomendaes, extradas do conhecimento partilhado no Colquio de Guaramiranga
sobre a Lngua Portuguesa na Internet e no Mundo Digital representam um entendimento
comum dos participantes e visam contribuir para a atuao do IILP e da CPLP.
Guaramiranga, 26 de abril de 2012

PLAT

V. 2. N.3

2013

127

Vous aimerez peut-être aussi