Vous êtes sur la page 1sur 32

UM ESTUDO ESTATSTICO SOBRE AS OXTONAS NO PORTUGUS

ANA LVIA DOS SANTOS AGOSTINHO*


GABRIEL ANTUNES DE ARAJO**

RESUMO
O objetivo deste artigo apresentar um estudo estatstico sobre as palavras
com acento final (ou oxtonas) no portugus. Baseado em um corpus de 10.494
palavras (ou seja, todas as palavras nominais oxtonas) do Dicionrio Houaiss
e suas respectivas transcries fonticas, mostraremos que a maioria das palavras
oxtonas do portugus formada por emprstimos lexicais. Ainda que o latim,
o tupi, o francs, o rabe e o iorub tenham sido as principais fontes dos
emprstimos, o portugus pegou emprestadas palavras de mais de cem lnguas
diferentes. Tambm discutiremos a qualidade do elemento final da oxtona (se
vogal, glide ou consoante) e a freqncia geral destas palavras.
PALAVRAS-CHAVE: oxtonas, portugus, fonologia, acento final.

INTRODUO
O objetivo deste texto analisar as palavras oxtonas em portugus
a partir de um levantamento estatstico. Partindo da hiptese segundo a
qual as palavras com acento final foram incorporadas, sobretudo, via
emprstimos, uma vez que no havia palavras oxtonas no latim,
procuraremos determinar a origem dessas palavras (ano e lngua), bem
como analisar o elemento final e a sua freqncia. O texto foi organizado
da seguinte forma: na prxima seo, apresentamos a metodologia e a
* Professora da Universidade de So Paulo. A autora contou com financiamento da Fapesp,
processo 2006/03038-5, a cuja instituio agradece.
E-mail: ana.agostinho@yahoo.com
** Professor da Universidade de So Paulo e Kyoto University of Foreign Studies (KUFS). O
autor agradece ao Departamento de Estudos Luso-Brasileiros da KUFS pelo auxlio financeiro
concedido a este trabalho.
E-mail: g.antunes@usp.br

Recebido em 4 de julho de 2006


Aceito em 15 de outubro de 2006

formao do corpus e destacamos a diferena entre a lista-expandida e


a lista-base. Na seo 3, so apresentadas e discutidas as anlises estatsticas dos dados, considerando-se as lnguas emprestadoras e as datas
de entrada das palavras oxtonas no portugus. Nesse ponto, so
consideradas em detalhe as dez lnguas que mais contriburam com
emprstimos. Em seguida, apresentamos uma anlise dos elementos
finais das oxtonas e tambm uma discusso a respeito da freqnciaweb. A seo final traz algumas concluses sobre este estudo e levanta
questes para pesquisas futuras.
Devido complexidade que envolve a formao de um corpus
confivel, optamos por empregar um corpus consolidado formado por
todas as palavras com acento lexical final registradas no Dicionrio
Houaiss (HOUAISS & VILLAR, 2001). Embora saibamos que haja palavras
oxtonas que no esto dicionarizadas e, ao mesmo tempo, palavras
dicionarizadas de origem literria ou pertencente nomenclatura tcnicocientfica, e, por isso, de uso raro, preferimos manter o corpus dicionarizado por se tratar de um conjunto consistente de dados e estar
disponvel a todos os interessados, alm de o Dicionrio Houaiss (DH)
ser o mais recente dicionrio etimolgico da lngua portuguesa. Por
mais raras ou excepcionais que sejam, as palavras do dicionrio
pertencem a um determinado registro da linguagem e, portanto, so
vlidas para o propsito de analisar a ocorrncia das palavras com acento
final no portugus. Dada a natureza deste trabalho, a informao
etimolgica do DH tambm nos fundamental. Uma vez que, conforme
Ferreira Netto (2001), no havia palavras oxtonas no latim, atribui-se a
presena de palavras portuguesas oxtonas de origem latina a alteraes
fonolgicas. Mas o que dizer das palavras de outras origens? Para tentar
responder a essa questo, abordaremos os seguintes tpicos:
a)A origem das palavras oxtonas, procurando verificar a porcentagem de termos latinos e de outras lnguas em geral;
b) A data de entrada no portugus e qual a lngua emprestadora;

178

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

c) A qualidade do elemento final (vogal, consoante ou glide);


d. A freqncia das oxtonas.

A motivao para este trabalho surgiu a partir de uma passagem


de um trabalho indito de Sandalo (1999, p. 1), no qual a autora sugere
que o grande nmero de oxtonas [no portugus] no se pode explicar
como sendo casos de emprstimos em sua maioria. No entanto, como
tentaremos mostrar, possvel afirmar que cerca de 80% das palavras
oxtonas nominais do portugus so emprstimos e que, portanto,
possvel, de fato, explic-las como casos de emprstimos em sua maioria
(AGOSTINHO, 2007).
O termo cedido por emprstimo introduzido na lngua alvo por
falantes nativos que tm acesso lngua emprestadora na sua forma
oral ou escrita. A nativizao, ou adaptao dos emprstimos, regida
por padres fonolgicos da lngua receptora. Ou seja, emprstimo
uma palavra simples ou composta (ou uma sentena) oriunda de uma
lngua emprestadora, incorporada ao discurso da lngua receptora
(adaptado de PARADIS e LABEL, 1994).

METODOLOGIA
O corpus desta pesquisa foi trabalhado com o auxlio da ferramenta computacional MatLab que nos proporcionou o desmanche da
lista de palavras original do programa do DH.1 Cabe aqui ressaltar que
empregamos a noo lingstica de acento, e no a definio ortogrfica.
Diante das possibilidades que o programa nos permitia, foi-nos possvel
elaborar uma lista com todas as palavras oxtonas presentes no DH, a
que denominaremos lista-expandida. Todo o trabalho de classificao
dos verbetes e sua posterior separao (definindo o corpus), a natureza
da slaba final, qualidade das vogais e das consoantes finais, transcrio
fontica e listagem da lngua que deu origem ao termo portugus, no
caso dos emprstimos, foi efetuado manualmente.

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

179

A lista-expandida2 contm 37.591 palavras oxtonas. No caso


de mltiplas acepes, o critrio estabelecido foi o de considerar cada
eventual entrada como mltipla, seguindo o critrio do DH. Da lista
com 37.591 palavras foram excludos todos os verbos e as palavras
formadas por composio ou derivao, o que resultou na lista-base.
No DH, em razo de a forma verbal aparecer no infinitivo, todos os
verbos so oxtonos, a priori, sendo, portanto, excludos. Tambm
foram excludas da lista-base as palavras oxtonas que, ortograficamente, possuem hfen, como, por exemplo, arte-menor, uma vez que
o hfen, como um possvel sinal grfico de composio, acarretaria a
repetio da palavra oxtona.
As palavras evidentemente derivadas de outra palavra existente
no portugus tambm foram excludas. No entanto, h casos como o da
palavra aragons, proveniente do espanhol aragons, na qual possvel
identificar a presena do sufixo derivacional para gentlicos, ainda que
a palavra arago no exista no DH como forma simples. Portanto,
qualquer palavra cuja forma no portugus seja adaptada diretamente da
lngua de origem, ser mantida na lista final, chamada doravante de
lista-base. Caso a palavra seja derivada no portugus e sua forma de
base tambm esteja dicionarizada, o termo derivado no ser computado
como oxtono. Algumas palavras que so ortograficamente oxtonas,
mas que possuem consoantes proibidas na posio de coda no portugus,
tambm foram eliminadas, como, por exemplo farad, realizada
foneticamente em grande parte dos dialetos do Portugus do Brasil (PB)
como [fa.a.d], sendo, portanto, uma pseudo-oxtona. Excluindo-se
todos os casos supramencionados, a lista-base foi formada por 10.494
palavras, contendo, assim, todas as palavras oxtonas que no so verbos,
os substantivos compostos ou derivados (exceto os casos excepcionais
mencionados) e as pseudo-oxtonas.
A lista contendo 37.591 palavras com acento final foi formatada
no programa Microsoft Excel. Foram elaboradas colunas que nos
permitiram verificar vrios aspectos que cobriam os objetivos iniciais

180

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

do projeto. A lista-base contm mais de 200 pginas, enquanto que a


lista-expandida possui cerca de mil pginas.
A lista-base composta apenas pelas palavras consideradas aptas
a partir da anlise da dcima primeira coluna da lista-expandida, o
que quer dizer que inclui todas as palavras que no sejam verbos nem
falsas-oxtonas. A primeira contm as palavras oxtonas em ordem
alfabtica, numeradas de 2 a 10.495. As colunas dois e trs so as
mesmas da lista-expandida, contendo o sculo arredondado (Data 1) e
a data original do DH (Data 2), respectivamente. A quarta coluna grafa
a transcrio fontica de cada oxtona. A quinta traz o elemento final
(abreviada como E_F) de cada palavra oxtona, ou seja, consoante,
vogal ou glide, tambm transcritos foneticamente, os quais aparecem
na sexta coluna como os nmeros 0, 1 e 2, respectivamente significando
consoante, vogal e glide. A stima coluna apresenta a freqncia-web
(F_Web), tal como descrito acima. A oitava coluna mostra a lngua
que deu origem a palavras em portugus, no caso de emprstimos.
Essa coluna tambm contm outras informaes relevantes, como, por
exemplo, sem etimologia, (origem) controversa etc. Por fim, a
nona coluna apresenta a etimologia, tal como na lista-expandida. As
colunas que marcavam a classe de palavras dos lexemas foram
excludas, posto que foram descartadas as palavras verbais e aquelas
que fogem dos nossos objetivos.
Na lista-base, h cerca de 2.500 palavras sem descrio etimolgica, o que dificulta sua classificao em relao sua origem,
embora, algumas vezes, a origem etimolgica no seja de todo obscura
ou desconhecida. o caso, por exemplo, da palavra nissei, que est
descrita no DH sem informao etimolgica, ainda que saibamos que
se trata de um emprstimo da lngua japonesa. Mesmo sem essas
informaes, palavras que se enquadram nesse tipo foram includas
na lista-base.
Adicionalmente, a lista-base contm palavras sem descrio
etimolgica e que, ao mesmo tempo, parecem ser ou so derivadas, ou

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

181

ainda so formadas a partir de falsos sufixos, como, por exemplo, o


caso da palavra trilho, cuja etimologia pode ser associada, por
analogia, s palavras milho e bilho.

DISCUSSO
Anlise estatstica dos dados
Nesta seo, analisaremos os dados referentes s colunas 2 e 8 da
lista-base, que contm o sculo arredondado e a lngua de origem. Em
seguida, analisaremos os dados referentes s colunas 5 e 6, que abarcam
o elemento final das oxtonas, e, finalmente, analisaremos os dados
referentes coluna 7, que traz a freqncia-web. vlido notar que, se
a etimologia da palavra era controversa, escolheu-se a primeira lngua
citada pelo DH como possvel emprestadora.
Alm disso, na lista-base, foi adicionada uma categoria para
topnimos, uma para antropnimos, uma para palavras derivadas de
nomes prprios, uma para vocbulos expressivos, uma para formas
histricas, uma para palavras resultantes de processo fontico-fonolgico
e uma ltima para palavras de difcil classificao, de acordo com a
etimologia descrita no DH. Essas palavras sero levadas em conta apenas
nas anlises que no se referem lngua de origem, j que no possuem
esta informao e, portanto, modificariam o resultado das anlises
estatsticas.
Anlise da fonte emprestadora: lngua e data
A Tabela 1, apresentada na pgina a seguir, contm os resultados
da anlise da etimologia das palavras oxtonas, destacando a origem
etimolgica, o nmero absoluto de entradas e tambm o valor relativo
das quinze lnguas3 que se revelaram mais representativas no corpus:

182

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

T ABELA 1 - R EPRESENTATIVIDADE

NO CORPUS : LNGUAS EMPRESTADORAS

N MERO
O RIGEM

ETIMOLGICA

NO

P ORCENTAGEM

ABSOLUTO

DE PALAVRAS OXTONAS

DH

EM RELAO AOTOTAL
DE

10.494

PALAVRAS

latim

1774

16,9%

tupi

1558

14,9%

francs

583

5,6%

rabe
iorub

207

2,0%

portugus

190

2,0%

ingls

188

1,8%

origem indgena

157

1,5%

espanhol

140

1,3%

grego

87

0,8%

concani

78

0,7%

africanismo

74

0,7%

quimbundo

70

0,7%

italiano

65

0,6%

malaio

58

0,6%

Por um lado, o latim, o tupi,4 o francs, o rabe, o iorub, o portugus, o ingls e o espanhol destacam-se com mais de 100 ocorrncias.
Por outro lado, um total de 76 lnguas emprestou ao portugus quatro
palavras ou menos, sendo que, dessas 76 lnguas, 48 aparecem com
somente um item lexical oxtono. O portugus foi desconsiderado como
lngua emprestadora, sendo sua presena na lista justificvel por se tratar
de palavras oxtonas cuja origem no pode ser associada aos processos
morfolgicos do portugus, embora tambm no haja evidncias de se
tratar de uma palavra estrangeira ou proveniente do latim, via evoluo.
Assim, as palavras de origem portuguesa foram desconsideradas. De
um total de 10.494 palavras da lista-base, 81%, cerca de 8.500 palavras,
so externas ao portugus e ao latim. No entanto, as palavras de origem
SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

183

latina direta correspondem a 16,7% de todas as oxtonas. No que diz


respeito s palavras de origem latina, possvel observar se as palavras
latinas chegaram ao portugus por evoluo ou por emprstimo tardio.
No primeiro caso, a palavra passou por um processo gradativo de
mudanas, atravs de fenmenos lingsticos ocorridos desde o latim
vulgar idioma do qual o portugus oriundo at o portugus, como,
por exemplo: radix > raiz, aprilis > abril e anellus > anel. No segundo
caso, a palavra passou por um processo erudito no-natural, que consistia
em tomar palavras diretamente do latim e adapt-las ao portugus,
sobretudo no perodo Renascentista, como, por exemplo: furor > furor,
beelzebub > belzebu e trochaeus > troqueu. Assim, se a palavra for
datada como originria do sculo XIV em diante, tratar-se-, possivelmente, de um emprstimo tardio. Dessa maneira, podemos analisar de
modo mais detalhado as palavras de origem latina. Do total de palavras
latinas (descritas acima), apenas 8%, ou seja, 145 palavras, no tm
datao definida.
Cabe aqui uma palavra sobre o mtodo de datao do DH. O
mtodo, no totalmente incontroverso, estabelece a datao das palavras
de acordo com a data do primeiro registro conhecido ou estimado de
uma palavra, com indicao da fonte onde ocorre ou da primeira obra
lexicogrfica que a incluiu em sua nominata (HOUAISS e VILLAR, 2001,
p. XXI). Assim, as datas no so sempre precisas, pois a palavra j poderia
estar sendo empregada na lngua falada muito antes de ser efetivamente
documentada. Ademais, 14,4% do total de entradas datadas da listabase so de palavras cuja datao de 1899, que aparece 869 vezes (incluindo palavras do latim e de outras lnguas). Neste caso, a fonte empregada no DH a primeira edio (em dois volumes) do Novo
Diccionrio da Lngua Portuguesa, de Cndido de Figueiredo. Portanto,
reconhecemos que a datao dos dicionrios etimolgicos apresenta
certos problemas.
No somente o latim contribuiu com palavras oxtonas. As origens
geogrficas so as mais diversas, como podemos observar na Tabela 2,

184

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

que as divide em quatro grandes grupos: frica, Amricas, Europa (com


trs subgrupos: germnicas, latinas e outras) e Oriente (extremo e mdio/
prximo).5
T ABELA 2 - G RANDES
G RUPO

N MERO

GRUPOS

ABSOLUTO

N MERO

RELATIVO

frica

522

9%

Amricas

1783

29%

Europa 1
Germnicas

215

4%

Europa 2 Latinas

2797

46%

Europa 3 Outras

109

2%

Oriente Mdio e
Prximo

552

9%

Extremo Oriente

78

1%

As lnguas latinas da Europa aparecem com 46% do total das


oxtonas incorporadas via emprstimos. As lnguas das Amricas, entre
elas o tupi, aparecem com 29% do total. As lnguas da frica e as do
Oriente (Prximo e Mdio) aparecem em igual quantidade, 9% cada
grupo. As oxtonas cujas origens podem ser remontadas s lnguas do
Extremo Oriente, s lnguas germnicas e s outras lnguas da Europa
perfazem o total de 7% dos dados.6 H, ainda, outras lnguas de difcil
classificao7 que foram descartadas, j que pouco relevantes, pois
somam apenas 5 ocorrncias, perfazendo menos de 1% dos dados.
Cada grande grupo pode ser analisado em separado. O grupo
africano, por exemplo, representa 9% do total, comparecendo com 522
palavras; iorub: 207 palavras, ou 40%; quimbundo: 70 palavras, ou 13
%; banto: 34 palavras, ou 7%; crioulo: 36 palavras, ou 7%; quicongo:
31 palavras, ou 6%; jeje: 18 palavras, ou 3%; umbundo: 10 palavras, ou
2%; outras8 lnguas: 10 palavras; africanismo: 74 palavras, ou 14%;
de origem africana: 24 palavras, ou 5%. Segundo Petter (2003), no h

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

185

um padro para a classificao de africanismos nos dicionrios de lngua


portuguesa, sendo possvel observar insegurana na indicao de muitos
vocbulos no DH. Nesse trabalho denominado Palavras de origem
africana nos dicionrios Houaiss e Novo Aurlio Sculo XXI, a autora
procura analisar os termos definidos como africanismos no Novo Aurlio
Dicionrio de Lngua Portuguesa Sculo XXI e no DH, buscando assim
compreender a extenso desse conceito. Segundo Petter, os termos de
origem africana foram [...] constituindo uma classe importante entre os
brasileirismos, distinguindo-se como africanismos (PETTER, 2002, p.
107). Mas ainda h oscilaes na definio e percepo desses termos.
Petter cita os critrios propostos por Cunha (1987) para a definio de
um brasileirismo, a saber: seu uso privativo no Brasil; seu uso exclusivamente regional; sua difuso junto a camadas sociais determinadas; a
existncia do termo em outra variante do portugus que no a brasileira
e sua origem. Cita tambm as quatro espcies de brasileirismos propostas
por Mattoso Cmara Junior (apud CUNHA, 1987, p. 27), uma das quais
o contato com outras lnguas. No DH, aparecem as seguintes definies
para brasileirismo:
a) (Rubrica: lingstica) em sentido lato, qualquer fato de
linguagem (fontico, morfolgico, sinttico, lexical, estilstico) prprio
do portugus do Brasil; b) sob o ponto de vista lexical, palavra ou locuo
(dialetismo vocabular) ou acepo (dialetismo semntico) privativa do
portugus do Brasil (HOUAISS e VILLAR, 2001, p. 507).
J as definies de africanismo so:
a) (1858) (Rubrica: lingstica) palavra, construo ou expresso
tomada de emprstimo de qualquer das lnguas africanas; b) (Rubrica:
lingstica) qualquer fato de linguagem (fontico, mrfico, sinttico,
lexical) privativo do portugus de alguma das ex-colnias portuguesas
na frica, em contraste com o de Portugal ou do Brasil; c) (Rubrica:
lingstica) os fatos lexicais distintivos do portugus da frica, no
usados em Portugal ou no Brasil (HOUAISS e VILLAR, 2001, p. 107).
Segundo a definio acima, todos os emprstimos africanos seriam
africanismos e seriam africanismos apenas expresses usadas no portu-

186

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

gus da frica. Desse modo, as razes para o agrupamento entre


africanismo e de origem africana so obscuras. Sobre isso, Petter
(2003) afirma que, apesar da incoerncia entre a definio da entrada
africanismo e da considerao de africanismo como uma categoria
identificadora da etimologia do termo, as palavras oriundas de uma lngua
africana em uso no PB no so classificadas como africanismos; so
identificados como africanismos somente os termos prprios do portugus da frica.
Outro problema de definio est no fato de que, segundo a
definio de brasileirismo, africanismos no poderiam fazer parte da
classe de brasileirismos como proposto por Petter e supracitado na
definio do DH, posio diferente da adotada pelo Novo Dicionrio
Aurlio de Lngua Portuguesa Sculo XXI.
Outra particularidade do DH, como observa Petter, a utilizao
de um nmero mais amplo de fontes para determinar a etimologia dos
vocbulos, usando, no entanto, apenas cinco fontes quando se trata de
lnguas africanas. Nele so usadas as seguintes denominaes: etimologia provavelmente africana, etimologia africana, de origem controversa, de origem obscura, ou, ento, menciona-se que um autor
sugere um timo, como no exemplo orig.contrv.; Olga Cacciatore
(apud HOUAISS e VILLAR, 2001) sugere o ior. abi o que possui + ko
conhecimento. Segundo Petter, esse procedimento comprova que no
houve nova pesquisa nessa rea por parte dos lexicgrafos. A autora
ainda diz que a anlise desses dicionrios evidencia o conhecimento
insuficiente do legado lexical das lnguas africanas no portugus do
Brasil e, novamente, que esse desconhecimento se explica em grande
parte pela falta de pesquisa nova na rea (PETTER, 2003, p. 113).
Podemos ainda fazer um paralelo com outros termos utilizados
nas definies de vocbulos no DH, como indigenismo e arabismo.
Trataremos do ltimo mais adiante. No caso de indigenismo, h a
definio: a) (Rubrica: lingstica) palavra, construo ou locuo de
uma lngua indgena tomada de emprstimo por outra lngua (HOUAISS e

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

187

VILLAR, 2001, p. 1605), mas no a encontrada nos exemplos acima, que


diz ser prpria da lngua a qual oriunda. No segundo caso, temos essas
duas definies: a) (Rubrica: lingstica) expresso caracterstica da
lngua rabe; b) (Rubrica: lingstica) palavra, construo ou expresso
prprias da lngua rabe numa outra lngua (HOUAISS e VILLAR, 2001, p.
169). Estes exemplos revelam que a insegurana na classificao dos
vocbulos de origem africana no DH pode ser estendida para outras
lnguas, sobretudo classificao inconsistente, mas amplamente empregada, de indigenismo.
Apesar desta impreciso, de acordo com o DH, a lngua africana
que deu origem a um maior nmero de oxtonas foi o iorub, com 207
ocorrncias. Em 14% dos dados aparecem os africanismos, que correspondem a 13% dos dados. Essas palavras de origem supostamente iorub
se referem, em sua maioria, ao universo religioso e ritualstico,9 mas
tambm a utenslios (ritualsticos ou no) e comida. Observemos alguns
exemplos: ab: ior. {agbo} infuso de mistura de folhas com fins medicinais, segundo Cacciatore; abror: segundo Cacciatore, ior. {ab}{-}{r}{}
sacerdote chefe da floresta sagrada; adj: segundo Cacciatore, do ior.
{aadja} tipo de chocalho us. em cerimnias rituais, der. de {dja} bater;
oim: ior. {oyin} abelha; mel; or: ior. {oro} costume, tradio.
No que diz respeito origem americana das oxtonas, a lngua
tupi aparece como a maior influenciadora comparecendo com 1.558
ocorrncias. 16 palavras (1%) so descritas como de origem guarani.
Palavras de origem indgena indeterminada aparecem em 12% dos dados,
sendo a somatria de origem indgena de 157 palavras (9%),
indigenismo: 24 palavras (1%), e outras lnguas indgenas: 27
palavras (2%). Este dado relevante, pois mostra que mais de 10% das
palavras atribudas ao grupo americano so de origem indgena, embora
sua filiao lingstica seja desconhecida e que todas as outras lnguas
indgenas americanas contriburam com somente 2% do total do grupo.
Graas ao avano nos estudos das lnguas indgenas brasileiras nos
ltimos trinta anos, esse problema poderia estar mais perto de ser

188

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

solucionado, pois se coloca como uma questo central para os especialistas nas lnguas indgenas brasileiras: qual a extenso da influncia
vocabular indgena no portugus, excluindo-se as palavras de origem
tupi? A maior parte das palavras do tupi se refere nomenclatura de
fauna e flora. Observemos alguns exemplos: abati: tupi {awati} milho,
arroz, trigo; acari: tupi {gwakari} peixe da fam. dos loricarideos,
tb. conhecido como cascudo; cacund: tupi {kaa} folha, mato, erva
+ {kundawa} retorcido; imburi: tupi {mburi } espcie de palmeira.
O latim e as lnguas neolatinas formam um grupo influente.10 O
latim aparece em 1.774 ocorrncias (63%) dos dados do grupo das
lnguas latinas. Com 21% temos o francs, com 583 palavras, o espanhol
com 140 palavras e o italiano com 65.
O grupo de lnguas germnicas contribuiu com 215 palavras, sendo
que o ingls aparece com 188 palavras (88%) do total do grupo. O alemo
(20 palavras), o dinamarqus (1 palavra), o germnico (3) e o gtico (3)
so as outras lnguas do grupo.
Outras lnguas da Europa tiveram uma influncia menos marcante,
excetuando-se o grego com 87 palavras. As outras lnguas do grupo so
o basco (2), o russo (7), o turco (10) e o hngaro (1). As lnguas do
grupo do Extremo Oriente que incluem o birmans, o chins, o japons,
o mongol e o vietnamita aparecem com menos de 80 palavras, com
destaque para o chins com 37 e o japons com 36 palavras.
No grupo das lnguas de origem do Oriente Prximo e Mdio, o
rabe destaca-se com 207 palavras, 38% do total do grupo. vlido
ressaltar que os arabismos, as palavras de origem morabe e as palavras
do persa-rabe no foram computadas nesses 38%, mas sim nos 12% de
outras. Em relao aos arabismos, difcil determinar se a palavra um
emprstimo do rabe ou uma palavra portuguesa influenciada pelo rabe,
ou seja, arabizada. J as palavras de origem morabe, segundo o prprio
DH, so originrias de dialetos romnicos falados pelos morabes e
no da lngua rabe. As palavras do persa-rabe tambm no devem ser
consideradas como da lngua rabe porque difcil comprovar sua

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

189

origem, j que essa classificao engloba duas lnguas tipologicamente


distintas. Esse grupo ainda contm o persa (com 35 palavras, 6% do
total do grupo), o snscrito (28), o hebraico (27), o concani (78), o
concani-marata (16), o hindi (22), o malaio (58) e um grupo formado
por outras lnguas minoritrias11 com 69 palavras. A forte presena
concani e concani-marata (embora tipologicamente distintas, apresentadas no DH como um grupo homogneo) deve-se influncia do concani
no vocabulrio portugus de Goa, ndia.
A quantidade de palavras oxtonas originrias das nove lnguas
majoritrias (latim, tupi, francs, rabe,12 iorub, ingls, espanhol, grego
e concani) ser correlacionada com a data da entrada do timo no
portugus. Primeiramente, preciso separar o nmero de palavras com
e sem datao. Como isto j foi feito acima com o latim, apresentaremos
a Tabela 3, contendo a porcentagem de emprstimos com datao
definida e indefinida e seus respectivos valores absolutos e relativos
associados s lnguas restantes.
T ABELA 3 - D ATAO

DEFINIDA E INDEFINIDA

C OM DA TA O
( VALOR
A BSOLUTO )

C OM DA TA O
( V ALOR
RELATIVO )

S EM DATAO
( VALOR
ABSOLUTO )

S EM DATA O
( VALOR
RELATIV O )

rabe

180

87%

27

13%

Tupi

928

60%

630

40%

Francs

459

79%

124

21%

Grego

72

83%

15

17%

Concani

68

87%

10

13%

Espanhol

120

86%

20

14%

Iorub

135

65%

72

35%

Ingls

117

62%

71

38%

Na lista-base, 57% das palavras oxtonas tm datao precisa. Das


palavras com datao precisa, 35,3% entraram no sculo XIX. Em todos
os outros sculos a entrada foi bem menor, mas vale destacar tambm que
190

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

no sculo XX houve um influxo de cerca da metade do nmero de palavras


que entraram no sculo XIX, como observamos na Figura 1.
FIGURA 1 - OXTONAS POR SCULO

A seguir, apresentaremos dados relativos ao nmero absoluto de


emprstimos de palavras oxtonas por sculo de cada uma das lnguas
restantes13 (as de maior peso nos emprstimos) e explicitaremos tambm
os valores relativos. A quantidade de palavras oxtonas de origem latina
que entrou , segundo o DH, a seguinte: 6 palavras oxtonas no sculo
IX e 7 no sculo X, atingindo um numero estatisticamente insignificante;
15 palavras (1%) no sculo XI; 25 palavras (2%) no sculo XII; 218
palavras (13%) no sculo XIII; 144, 148 e 141 palavras ou aproximadamente 11% (em cada sculo) nos sculos XIV, XV e XVIII, respectivamente; 517 palavras (32%) no sculo XIX e 49 palavras (3%) no
sculo XX. Exemplifiquemos algumas entradas para cada sculo a ttulo
de ilustrao. Das entradas por evoluo, temos: no sculo IX: caslis >
casal; no sculo X: falc nis > falco; no sculo XI: judeu > judaeos;
no sculo XII: retro > *redro > redor; e, finalmente, no sculo XIII:
alb ris > alvor. Via emprstimo tardio, temos: no sculo XIV: avell~ na
> avel; no sculo XV: capax > capaz; no sculo XVI: anthrax > antraz;
no sculo XVII: ath us > ateu; no sculo XVIII: arch os > arqueu; no
sculo XIX: turonis > turo; e no sculo XX: turg ris > turgor. Os
dados sugerem um pico inegvel no sculo XIX. Observamos que a
SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

191

entrada tardia constante, pois a maior parte das palavras oxtonas


oriundas do latim emprstimo no portugus, ou seja, no entrou no
portugus por evoluo.
FIGURA 2 - OXTONAS ORIUNDAS DO LATIM

Para o tupi, os valores so: 197 palavras (24%) no sculo XVI;


84 e 80 palavras (10%) nos sculos XVII e XVIII, cada; 301 palavras
(37%) no sculo XIX e 19% no sculo XX. O pico inicial na primeira
fase da colonizao era esperado. No entanto, houve uma entrada
substancial no sculo XIX que pode estar associada documentao e
no mais influncia direta das lnguas do grupo tupi.
FIGURA 3 -OXTONAS ORIUNDAS DO TUPI

192

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

J o francs apresenta seu pico nos sculos XIX e XX, graas,


sobretudo, influncia cultural francesa.
Os valores so os seguintes: 1 palavra no sculo XI; no h registros no sculo XII; 21 palavras (5%) no sculo XIII; 16 palavras (3%)
no sculo XIV; 27 palavras (6%) no sculo XV; 39 palavras (8%) nos
sculos XVI e XVII, cada; 44 palavras (10%) no sculo XVIII; 185 palavras (41%) no sculo XIX e 89 palavras (19%) no sculo XX. Ou seja,
houve um influxo regular, porm limitado, nos sculos anteriores aos
sculos XIX e XX.
FIGURA 4 - OXTONAS ORIUNDAS DO FRANCS

Quanto ao rabe, a documentao analisada mostra que a


influncia diminuiu depois do sculo XVI, embora no sculo XIX tenha
havido um pico, juntamente com o francs, o grego, o espanhol, o latim
e o tupi com forte presena no sculo XIX.
Os valores relativos referentes ao rabe so: 2 palavras (1%) no
sculo XI; 4 palavras (2%) no sculo XII; 24 palavras (13%) no sculo
XIII; 22 palavras (12%) nos sculos XIV e XV, cada; 41 palavras (23%)
no sculo XVI; 12 palavras (7%) nos sculos XVII e XVIII, cada; 29
palavras (16%) no sculo XIX e 12 palavras (7%) no sculo XX.

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

193

FIGURA 5 - OXTONAS ORIUNDAS DO RABE

Os emprstimos oriundos do iorub apresentam o seguinte quadro:


2 palavras (1%) no sculo XVI; 27 palavras (20%) no sculo XIX e 106
palavras (79%) no sculo XX. A lacuna nos sculos XVII e XVIII pode
ser atribuda escassez de documentao e ao desinteresse pela cultura
iorub e suas religies.
FIGURA 6 - OXTONAS ORIUNDAS DO IORUBA

Os valores relativos referentes s palavras de origem inglesa: 3


palavras ou cerca de 3% nos sculos XVI e XVIII, cada; 22 palavras (19%)
no sculo XIX e 88 palavras (75%) no sculo XX, mostram tambm
destacada influncia no sculo XX, associado ao prestgio cultural e
econmico dos pases de lngua inglesa nesses dois ltimos sculos.
194

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

FIGURA 7 - OXTONAS ORIUNDAS DO INGLS

J o espanhol apresenta uma influncia que perpassa os sculos.


Sobretudo no perodo que vai do sculo XIV ao XIX: 2 palavras nos
dois primeiros sculos, uma em cada; 6 palavras (5%) no sculo XIII;
10 palavras (8%) no XIV e a mesma quantidade no XV; 26 palavras
(22%) no sculo XVI; 23 palavras (19%) no sculo XVII; 14 palavras
(12%) no sculo XVIII; 27 palavras (22%) no sculo XIX e somente
duas palavras (2%) no sculo XX.
FIGURA 8 - OXTONAS ORIUNDAS DO ESPANHOL

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

195

Diferentemente do latim, o grego apresenta uma influncia


limitada, pelo menos no que diz respeito s palavras oxtonas, embora
seu pico seja no sculo XIX: 3 palavras (4%) no sculo XIII; uma palavra
(1%) no sculo XIV; 4 palavras (6%) no sculo XV; nos sculos XVI e
XVIII 9 palavras (13%) em cada sculo; 28 palavras (38%) no sculo
XIX e 7 palavras (10%) do total no sculo XX.
FIGURA 9 - OXTONAS ORIUNDAS DO GREGO

A presena do concani no grupo das lnguas que mais deram


emprstimos ao portugus no totalmente estranha se considerarmos
que o concani era a lngua falada na regio de Goa, na ndia. Goa
deixou de ser colnia portuguesa somente em 1961 e a presena portuguesa foi mais marcante em Goa do que em outras possesses do
oriente. Alm disso, a administrao portuguesa influenciou a regio
de Goa e foi influenciada pela cultura concani. Outras palavras oxtonas
de origem supostamente concani como as das lnguas concani-marata,
marata-concani (DH) e concani-guzarate no esto computadas na
Figura 10. Os valores relativos referentes ao concani (Figura 10) so:
7 palavras (10%) nos sculos XIV e XVII, cada; 13 palavras (19%) no
sculo XVIII; 37 palavras (55%) no sculo XIX e 4 palavras (6%) no
sculo XX.

196

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

FIGURA 10 - OXTONAS ORIUNDAS DO CONCANI

A partir dos dados apresentados nesta seo, estabelecemos o


sculo de maior incidncia de emprstimos de cada uma dessas lnguas
e a porcentagem de emprstimos no dado sculo, relativamente ao total
existente.
T ABELA 4 - S CULO

DE MAIOR INCIDNCIA

P ORCENTAGEM
S CULO

DE MAIOR INCIDNCIA

DE EMPRSTIMOS

NESSE SCULO EM RELAO AO

DE EMPRSTIMOS

TOTAL ATUALMENTE ENCONTRADO

XVI e XIX

22% em cada sculo

rabe

XVI

22%

Concani

XIX

55%

Francs

XIX

41%

Grego

XIX

38%

Tupi

XIX

37%

Latim

XIX

32%

Iorub

XX

79%

Ingls

XX

75%

Espanhol

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

197

Assim, podemos formar o seguinte quadro-resumo:


Do total de 87% das palavras do rabe com datao, 22% entraram no sculo
XVI;
Do total de 92% das palavras do latim com datao, 32% entraram no sculo
XIX;
Do total de 60% das palavras do tupi com datao, 37% entraram no sculo
XIX;
Do total de 79% das palavras do francs com datao, 41% entraram no
sculo XIX;
Do total de 83% das palavras do grego com datao, 38% entraram no
sculo XIX;
Do total de 87% das palavras do concani com datao, 55% entraram no
sculo XIX;
Do total de 86% das palavras do espanhol com datao, 22% entraram no
sculo XVI e 22% no XIX;
Do total de 65% das palavras do iorub com datao, 79% entraram no
sculo XX;
Do total de 62% das palavras do ingls com datao, 75% entraram no
sculo XX.

Anlise do elemento final das oxtonas


Nesta seo, abordaremos os elementos finais das oxtonas,
atravs dos dados das colunas 5 e 6 da lista-base, que so o elemento
final e sua classificao.
Primeiramente, separaremos os dados do elemento final da
palavra, considerando se so consoante, vogal, glide ou vogal nasalizada,
a fim de determinar sua porcentagem, para mais adiante examinar esses
elementos individualmente. Verificamos a seguinte distribuio dos
elementos finais nas oxtonas: as vogais so o elemento final de 50%
das oxtonas, ou seja, esto presentes em 5.273 palavras. As vogais
nasalizadas aparecem em 1.225 palavras, ou 12% dos dados. J os glides
[w] e [j] aparecem em 26%, ou 2.685 palavras, enquanto que as consoantes
aparecem em 1.311 das palavras, ou 12%. As vogais que ocorrem com
198

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

maior freqncia como elemento final nas oxtonas so [i], 25%, ou


1.273 palavras; [a], 24%, 1.255 palavras; e [u], 22% ou 1.162 palavras,
enquanto que a vogal [] comparece com 11% ou 596 palavras, a vogal
[] comparece com 8% ou 444 palavras, e a vogal [e] aparece em 7% ou
368 palavras, sendo as menos freqentes. A vogal menos freqente o
[o], com 3%, ou apenas 175 ocorrncias.
No que diz respeito aos glides, o elemento [w] aparece em 97%
das oxtonas terminadas em glides, ou seja, em 2.597 ocorrncias,
enquanto que o [j] aparece em apenas 3% dos dados, ou seja, em 86
ocorrncias.
Segundo Silva (2006), a nasalidade regressiva no portugus, ou
seja, as vogais e ditongos nasais do portugus resultam de vogais seguidas
de consoantes nasais no latim. Temos, por exemplo: romna > rom;
*burricana > borrega; avellna > avel; *abigone > abegom > abigo;
matina > maaam > ma; hortulna > hortelaam > hortel; jejnus >
jejum; cherubim > querubim. Podemos observar, nos exemplos acima,
a nasal latina /n/ em posio intervoclica, vogais e ditongos nasais em
posio final de vocbulo e vogais seguidas de nasal implosiva. Dessa
forma, as vogais nasalizadas [i] e [a] so as que aparecem na maior
parte dos dados, com 38% (468 palavras) e 31% (385 palavras),
respectivamente. A vogal [u] aparece com 13%, 154 ocorrncias, a vogal
[e] com 10%, ou 117 palavras e, finalmente, [o] com 8%, ou 101 palavras.
Consideramos duas consoantes [r] e [s] e descartamos as
consoantes ortogrficas [m], [e] e [z], pois, em todos os casos, no
ocorrem como elementos da coda quando a palavra pronunciada
isoladamente. No primeiro caso, ocorre a nasalizao da vogal e o
desaparecimento da consoante m; no segundo, a consoante em coda l
pronunciada como o glide [w] (na maioria dos dialetos do Brasil,
incluindo o paulista), e, no terceiro, a consoante z pronunciada como
[s]. Avaliando somente r e s, verificamos que o [r] aparece em 71% dos
dados, ou seja, em 928 palavras, sendo mais freqente do que o [s], que
aparece em 29% dos casos, ou em 385 palavras.

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

199

O quadro a seguir apresenta [s] a distribuio das palavras com


base no elemento final:
w

2.597
i
1.273
a
1.255
u
1.162
r
928

596
i
468

444

385
s
385
e
368
o
175
u
154
e
117

101
j
86
Total 10.494

24,71%
12,13
11,96
11,07
8,85
5,68
4,46
4,24
3,68
3,68
3,50
1,68
1,47
1,11
0,96
0,82
100%

Avaliando todas as oxtonas, o elemento final mais freqente


glide [w], com 24,71% to total, ou seja, de cada quatro oxtonas, uma
termina com este glide. Do outro lado da tabela est o glide [j], com
apenas 86 ocorrncias ou 0,82% do total. Cada uma das vogais /i/, /a/ e
/u/ representa cerca de 11% do total das oxtonas.
Anlise da freqncia
A freqncia-web indica cada ocorrncia individual de uma
palavra oxtona em cada pgina da internet atravs do site de buscas
Google. Dessa forma, um indicador da freqncia geral na internet, o
que, por hiptese, demonstra quo comum a palavra . Nessa consulta
34% das oxtonas apareceram em mais de 1000 pginas.
Utilizando os critrios estabelecidos por Arajo et. al. (2007, p.23)
para a delimitao de freqncia de palavras, denominamos raras as
200

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

palavras que ocorriam em menos de 10 pginas, incomuns aquelas


encontradas em at 200 pginas, comuns as que ocorriam em at 20.000
pginas e freqentes as que foram encontradas em mais de 20.000
pginas.
Observamos que 48,1% das oxtonas so raras ou incomuns e
51,9% so comuns ou freqentes. Ao sobrepor estes resultados aos de
Arajo et. al. (2007, p.23), verificamos uma nfima diferena nos
resultados. Segundo esses autores, 48,3% das oxtonas so raras ou
incomuns e 53,8% so comuns ou freqentes, nmero idntico ao das
oxtonas da lista-expandida. As concluses de nossa pesquisa ficaram
muito prximas do resultado obtido por Arajo et. al (2007) que, atravs
do exame de um corpus geral de 150.875 palavras do DH (0,4% monosslabos, 24,9% oxtonas,14 62,5% paroxtonas e 12,2% proparoxtonas),
concluiu que 53,8% so raras ou incomuns, enquanto que 46,3% so
comuns ou freqentes. Segundo Cintra (1997), as paroxtonas, que se
constituem no padro de acentuao mais freqente do portugus, representam 42% dos dados analisados pelo autor e 62,5% dos dados do
corpus geral de Arajo et al. Assim, podemos comparar a freqncia
relativa (em relao ao seu total) das paroxtonas com a das oxtonas.
Observamos esses dados com mais detalhes na Tabela 5:
T ABELA 5 - F REQNCIA - WEB
Lista-base
(10.494 oxtonas)
Lista-expandida (37.591
oxtonas)
Oxtonas do corpus
de Arajo et al.
(37.568 oxtonas)
Paroxtonas do corpus
de Arajo et al.
(94.297 paroxtonas)
Corpus geral de Arajo
et al. (150.875 palavras)

R ARAS

I NCOMUNS

C OMUNS

F REQENTES

23,8%

24,3%

26,8%

25,1%

21,1%

27,2%

26,1%

25,6%

21,1%

27,2%

26,1%

25,6%

26,3%

26,4%

24,2%

27,5%

26,3%

23,7%

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

23,1%

22,6%

201

Os dados mostram que no foram excludos os verbos e as palavras


formadas por derivao e composio do corpus de oxtonas utilizado
por Arajo et. al (2007). Apesar disso, os resultados no foram comprometidos. Observamos tambm que oxtonas e paroxtonas tm aproximadamente a mesma freqncia relativa, ou seja, a mesma freqncia em
relao ao seu respectivo nmero total. Das 10.494 oxtonas da listabase, 51,9% so comuns ou freqentes, assim como 47,3% do corpus
de 94.297 paroxtonas de Arajo et. al. O mesmo ocorre com o corpus
geral de Arajo et. al. (2007), das 150.875 palavras, 46,3% so comuns
ou freqentes.

CONSIDERAES FINAIS
O objetivo do texto era mostrar que, baseando-se em critrio
etimolgico, a maioria das palavras nominais oxtonas podem ser
classificadas como emprstimo. De certa forma, a existncia de palavras
com acento final no portugus uma inovao em relao ao latim, que
no o permitia. Assim, as palavras com acento final em portugus podem
ser derivadas das evolues fonticas do latim, dos processos internos
ao portugus, ou da adaptao de emprstimos de vrias lnguas. Estas
adaptaes revelam que o padro oxtono uma caracterstica da lngua
portuguesa desde os seus primrdios e no h nenhuma restrio que
proba a entrada de novas palavras oxtonas no portugus. Portanto,
esse padro ainda produtivo.
A anlise estatstica dos elementos finais mostra tambm que cerca
de 50% (ou 5.254 palavras) das oxtonas terminam em vogais. Isso
um desafio para as teorias do acento em portugus (ARAJO, 2007), que
defendem que o peso silbico importante para se estabelecer o locus
do acento. Outra concluso deste estudo diz respeito freqncia das
oxtonas: a anlise dos dados sugere que as oxtonas so, em mdia, to
comuns quanto as palavras paroxtonas e proparoxtonas.

202

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

O estudo tambm sugere que h uma relao entre o grau de


influncia cultural ou econmica de uma determinada lngua e o nmero
de emprstimos. Esta hiptese, contudo, precisa ser comprovada, levandose em conta os emprstimos de palavras paroxtonas e proparoxtonas.
No entanto, uma outra questo permanece em aberto e requer
novas pesquisas: a relao entre a posio de acento original na lngua
emprestadora e a efetiva adaptao em portugus e suas conseqncias.
Este estudo requerer, entre outras coisas, um conhecimento dos sistemas
prosdicos das principais lnguas emprestadoras e as possibilidades de
adaptao ao longo da histria do portugus. Como ponto de partida,
seria interessante comparar as evolues fonticas ocorridas na mudana
do latim para o portugus com o contato entre o portugus e lnguas
com acento final (como o francs e a maioria das lnguas do grupo tupi)
e at mesmo lnguas cujo sistema acentual seja diverso do portugus ou
das lnguas neolatinas, como o caso do sistema pitch-accent do japons,
por exemplo.
A STATISTICAL ACCOUNT OF FINAL STRESS IN PORTUGUESE
ABSTRACT
The aim of this paper is to analyse a corpus of final stress words (also known
as oxytone) in Portuguese. Based on a corpus of 10.494 noun words with final
stress and their respective phonetic transcriptions from the Houaiss Dictionary,
we argue that the majority of the final stress words in Portuguese are lexical
borrowings. Latin, Tupi, French, Arabic, Ioruba are the majors sources,
however, Portuguese borrowed from more than one hundred languages. We
also discuss the quality of the final element (if vowel, glide or consonant) and
the overall frequency of these final stress words.
KEY WORDS: final stress, portuguese, phonology, oxytone.

NOTAS
1 Para isso recorremos ao ps-doutorando Dr. Zwinglio Guimares-Filho e sua
equipe de colaboradores do Instituto de Fsica da USP, a partir da sugesto

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

203

do Prof. Dr. Mrio Eduardo Viaro da FFLCH. A equipe do Dr. GuimaresFilho nos auxiliou na formatao da base de dados que constitui o corpus da
pesquisa.
2 A lista-expandida foi organizada em colunas. A primeira coluna contm as
palavras oxtonas numeradas de 1 a 37.591, em ordem alfabtica, conforme
o DH. A segunda coluna contm, a partir da datao do dicionrio, o sculo
arredondado, ou seja, para fins estatsticos, o ano preciso da datao foi
normalizado para uma data cheia. No caso de datao imprecisa ou desconhecida, atribuiu-se o valor zero. Com esta informao, pode-se tambm
determinar se uma palavra latina possui seu primeiro registro de datao no
portugus por evoluo ou por emprstimo tardio. Neste caso, por exemplo,
se a palavra for datada como oriunda do sculo 14 em diante, ser um
emprstimo erudito. Posteriormente, isto nos permitir tambm estabelecer
em quais sculos houve maior entrada das oxtonas no portugus e se houve
uma maior incidncia de determinada lngua especfica em algum sculo. A
terceira coluna contm a data original registrada no dicionrio e sua
respectiva fonte. A datao precisa pode ser til para estudos scio-culturais,
estabelecendo, por exemplo, a maior influncia de uma determinada lngua
estrangeira em um perodo qualquer. A quarta coluna contm a transliterao,
gerada a partir dos dados do programa do DH e da programao, para tal
fim, no MatLab. Na lista final, esta coluna foi substituda pela transcrio
fontica, feita manualmente, considerando-se o dialeto paulistano. A quarta
coluna apresenta a slaba final da palavra, sendo importante para
verificarmos a sua constituio, sobretudo sua vogal e consoante finais, as
quais aparecem na quinta e na sexta colunas, respectivamente. A stima
coluna um desdobramento das colunas 5 e 6. Foram atribudos os nmeros
zero e 1, respectivamente para vogal e consoante, com o intuito de
composio e anlise dos dados. A oitava coluna apresenta a freqnciaweb, que consiste na anlise da freqncia de uso das palavras oxtonas,
considerando-se sua ocorrncia em pginas em portugus da internet
indexadas pelo site de buscas Google, www.google.com.br. A freqncia
indica cada ocorrncia individual de uma palavra oxtona em cada pgina.
Dessa forma, a freqncia-web um indicador da freqncia geral na
internet. As colunas 9 e 10 marcam a classe de palavra do lexema, separandoas entre verbo e no-verbo (substantivos, adjetivos, advrbios etc.). Para
tanto, a legenda empregada nestas duas colunas foi 1 para sim e zero para
no. A dcima primeira coluna foi inserida depois que a lista-expandida

204

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

estava pronta. Cada uma das palavras foi analisada, a fim de classific-la
apta lista-base, a partir dos critrios supramencionados. Por fim, h a
coluna com a informao etimolgica, a qual traz informaes histricas,
morfolgicas e tambm sobre os processos fonolgicos do processo de
nativizao.
3 Demais lnguas: chins, 37 palavras, 0,4% do total das oxtonas; crioulo,
36, 0,3%; japons, 36, 0,3%; persa, 35, 0,3%; (de origem) banta, 34, 0,3%;
quicongo, 31, 0,3%; snscrito, 28, 0,3%; hebraico, 27, 0,3%; (de origem)
africana, 24, 0,2%; indigenismo, 24, 0,2%; hindi, 22, 0,2%; alemo, 20,
0,2%; jeje, 18, 0,2%; concani-marata, 16, 0,2%; guarani, 16, 0,2%;
provenal, 16, 0,2%; marata, 13, 0,1%; guzarate, 11, 0,1%; turco, 10, 0,1%;
umbundo, 10, 0,1%; catalo, 8, 0,1%; hispano-americano, 8, 0,1%; neorico, 8, 0,1%; russo, 7, 0,1%; (de origem) caribe, 6, 0,1%; tamil, 6, 0,1%;
cariri, 5, 0,1%; asteca/nuatle, 4, 0,0%; cingals, 4, 0,0%; hau, 4, 0,0%;
hispano-rabe, 4, 0,0%; nheengatu, 4, 0,0%; bangali, 3, 0,0%; galibi, 3,
0,0%; germnico, 3, 0,0%; gtico, 3, 0,0%; malaio-javans, 3, 0,0%; marataconcani, 3, 0,0%; qechua, 3, 0,0%; tamil-malaio, 3, 0,0%; (de origem)
amerndia, 2, 0,0%; arabismo africano, 2, 0,0%; basco, 2, 0,0%; birmans,
2, 0,0%; dravdico, 2, 0,0%; espanhol platino, 2, 0,0%; franco, 2, 0,0%;
javans, 2, 0,0%; kwa, 2, 0,0%; macua, 2, 0,0%; marata-guzarete, 2, 0,0%;
mongol, 2, 0,0%; persa-rabe, 2, 0,0%; tapuio, 2, 0,0%; tupi-guarani, 2,
0,0%; (de origem) altaica, 1, 0,0%; amrico, 1, 0,0%; arabismo, 1, 0,0%;
armnio, 1, 0,0%; aruaque, 1, 0,0%; (de origem) bengali, 1, 0,0%; berbere,
1, 0,0%; butans, 1, 0,0%; (de origem) cltica, 1, 0,0%; (de origem) cigana,
1, 0,0%; cigano, 1, 0,0%; concani-guzarati, 1, 0,0%; copta, 1, 0,0%; crioulo
macaense, 1, 0,0%; dinamarqus, 1, 0,0%; divehi, 1, 0,0%; egpcio, 1, 0,0%;
(de origem) escandinava, 1, 0,0%; fula, 1, 0,0%; galg, 1, 0,0%; ganguela,
1, 0,0%; havaiano, 1, 0,0%; hindi-persa, 1, 0,0%; hngaro, 1, 0,0%; indoiraniano, 1, 0,0%; j, 1, 0,0%; lngua de Moambique, 1, 0,0%; lun, 1,
0,0%; lutiazi, 1, 0,0%; malgaxe, 1, 0,0%; malinqu, 1, 0,0%; maratahindustni, 1, 0,0%; marati, 1, 0,0%; (de origem) morabe, 1, 0,0%; nup,
1, 0,0%; occitano, 1, 0,0%; panjabi, 1, 0,0%; pareci, 1, 0,0%; purocoto, 1,
0,0%; semtica, 1, 0,0%; tagalog, 1, 0,0%; tsonga, 1, 0,0%; twi, 1, 0,0%;
uigur, 1, 0,0%; vietnamita, 1, 0,0%; e xipaia, 1, 0,0%. As lnguas com
porcentagem de 0,0% so estatisticamente insignificantes.
4 O uso do termo tupi segue to somente a nomenclatura do DH. A lngua
tupi, efetivamente, nunca existiu. A expresso lngua tupi refere-se ao

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

205

dialeto empregado pelos jesutas, sem especificao das diferenas regionais,


muito mais do que a uma lngua especfica. Cientificamente, emprega-se o
termo tupi como denominao de um tronco lingstico, embora, nos
crculos no-cientficos e paracientficos, empregue-se o termo tupi como
designao de uma lngua indgena brasileira (RODRIGUES, 1986).
5 Oriente Prximo/Oriente Mdio: amrico, rabe, arabismo, arabismo africano, armnio, bengali, butans, concani, cingals, concani-guzarati,
concani-marata, copta, crioulo macaense, divehi, dravdico, guzarete,
hebraico, hindi, hindi-persa, indo-ariano, javans, malaio, malaio-javans,
marata, marata-concani, marata-guzarete, marata-hindustni, marati, neorico, origem bengala, origem morabe, panjabi, persa, persa-rabe,
snscrito, semtica, tagalog, tamil, tamil-malaio e uigur. frica: africanismo,
berbere, crioulo, egpcio, fula, ganguela, hau, iorub, jeje, kwa, lngua de
Moambique, lun, macua, malgaxe, nup, origem africana, origem banta,
quicongo, quimbundo, tsonga, umbundo e twi; Amricas: asteca/nuatle,
cariri, galabi, guarani, havaiano, indigenismo, j, nheengatu, origem
amerndia, origem caribenha, origem indgena, pareci, quechua, tapuio, tupi,
tupi-guarani e xipaia; Europa (germnicas): alemo, dinamarqus, germnico, gtico e ingls; Europa (latinas): catalo, espanhol, espanhol platino,
francs, franco, hispano-americano, hispano-rabe, italiano, latim, occitano,
portugus e provenal; Europa (outras): basco, grego, hngaro, origem
cltica, origem escandinava, russo e turco; Extremo Oriente: birmans,
chins, japons, mongol e vietnamita;
6 vlido ressaltar que toda a classificao das lnguas nos grupos acima
citados foi feita atravs do prprio DH.
7 A saber: galg, luziati, malinqu, origem cigana e purocoto.
8 Foram colocadas como outras, as lnguas com menos de 10 ocorrncias,
somando 3% dos dados, sendo elas: berbere, egpcio, fula, ganguela, hau,
kwa, lngua de Moambique, lun, macua, malgaxe, nup, tsonga, e twi.
9 Petter (2003) afirma que como conseqncia dessa expanso de fontes
consultadas vai haver um maior nmero de entradas de origem africana,
relativas, principalmente, ao universo religioso, tendo como fonte
Cacciatore.
10 As outras lnguas deste grupo so: catalo, espanhol platino, franco, hispanoamericano, hispano-rabe e occitano. Com menos de 8 ocorrncias, somam
1% dos dados.

206

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

11 Amrico, arabismo, arabismo africano, armnio, bangali, butans, cingals,


concani-guzarati, copta, crioulo macaense, divehi, dravdico, guzarete, hindipersa, indo-ariano, javans, malaio-javans, marata-concani, marataguzarete, marata-hindustni, marati, neo-rico, origem bengala, origem
morabe, panjabi, persa-rabe, semtica, tagalog, tamil, tamil-malaio e
uigur. Todas com menos de 12 ocorrncias, somando 12% dos dados.
12 Os nmeros relativos ao rabe excluem os arabismos, as palavras de origem
morabe e persa-rabe.
13 A saber: tupi, francs, rabe, iorub, ingls, espanhol, grego e concani.
14 Ou seja, 37.568 oxtonas (nmero prximo ao da lista-expandida: 37.591).

REFERNCIAS
AGOSTINHO, A. L. S. Relatrio do projeto palavras oxtonas em portugus. So
Paulo: FFLCH-USP, 2007. (Mimeografado).
ARAJO, G. (Org.). O acento em portugus: abordagens fonolgicas. So Paulo:
Parbola, 2007.
ARAJO, G. A. et al. Algumas observaes sobre as proparoxtonas e o sistema
acentual do portugus. In: ARAJO, G. (Org.). O acento em portugus: abordagens fonolgicas. So Paulo: Parbola, 2007.
CACCIATORE, Olga G. Dicionrio de cultos afro-brasileiros. Rio de Janeiro:
Forense Universitria, 1988.
CAVAZZI, G. A. Descrio histrica dos trs reinos do Congo, Matamba e Angola,
de Joo Antonio Cavazzi de Montecccolo. Lisboa: Junta de Investigao do
Ultramar/ Agrupamento de estudos de cartografia antiga, [1687]1965.
CINTRA, G. Distribuio de padres acentuais no vocbulo em portugus.
Confluncia, n. 5/3, Unesp/Assis, p. 82-93, 1997.
CORREA, E. A. da S. Historia de Angola. Lisboa: Atica, [1782]1937, 2v.
CUNHA, C. O. O que um brasileirismo? Rio de Janeiro: Tempo Brasileiro,
1987.
FERREIRA NETTO, W. Introduo fonologia da lngua portuguesa. So Paulo:
Hedra, 2001.
HOUAISS, Antnio; VILLAR, Mauro. Dicionrio Houaiss da Lngua Portuguesa.
So Paulo: Objetiva, 2001.

SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007

207

MACHADO FILHO, A. M. O negro e o garimpo em Minas Gerais. Rio de Janeiro:


Jos Olympio, 1944.
MENDONA, R. A influncia africana no portugus do Brasil. Rio de Janeiro:
Sauer, 1933.
PETTER, M. M. T. Talvez sejam africanismos. Estudos Lingsticos XXIX GEL
Grupo de estudos Lingsticos do Estado de So Paulo. v. 1, p. 713-718,
2000.
_____. Palavras de origem africana nos dicionrios Houaiss e Novo Aurlio.
Papia Revista Brasileira de Estudos Crioulos e Similares, Braslia, v. 1, p.
107-114, 2003.
PARADIS, Carole; LABEL, Caroline. Contrasts from segmental parameters settings
in loanwords: core and periphery in Quebec French. Proceedings of the MOT
conference on contrasts in phonology, n. 13, p. 75-94, 1994.
RODRIGUES, Aryon. Lnguas brasileiras. So Paulo: Loyola, 1986.
SANDALO, F. Acento e sonoridade. Reunio da Abralin, 1999, Florianpolis/
UFSC.
SILVA, R. V. M. O portugus arcaico: fonologia, morfologia e sintaxe. So
Paulo: Contexto, 2006.

208

AGOSTINHO, Ana L. dos S.; ARAJO, Gabriel A. de. UM ESTUDO ESTATSTICO...

Vous aimerez peut-être aussi