Académique Documents
Professionnel Documents
Culture Documents
RESUMO
O objetivo deste artigo apresentar um estudo estatstico sobre as palavras
com acento final (ou oxtonas) no portugus. Baseado em um corpus de 10.494
palavras (ou seja, todas as palavras nominais oxtonas) do Dicionrio Houaiss
e suas respectivas transcries fonticas, mostraremos que a maioria das palavras
oxtonas do portugus formada por emprstimos lexicais. Ainda que o latim,
o tupi, o francs, o rabe e o iorub tenham sido as principais fontes dos
emprstimos, o portugus pegou emprestadas palavras de mais de cem lnguas
diferentes. Tambm discutiremos a qualidade do elemento final da oxtona (se
vogal, glide ou consoante) e a freqncia geral destas palavras.
PALAVRAS-CHAVE: oxtonas, portugus, fonologia, acento final.
INTRODUO
O objetivo deste texto analisar as palavras oxtonas em portugus
a partir de um levantamento estatstico. Partindo da hiptese segundo a
qual as palavras com acento final foram incorporadas, sobretudo, via
emprstimos, uma vez que no havia palavras oxtonas no latim,
procuraremos determinar a origem dessas palavras (ano e lngua), bem
como analisar o elemento final e a sua freqncia. O texto foi organizado
da seguinte forma: na prxima seo, apresentamos a metodologia e a
* Professora da Universidade de So Paulo. A autora contou com financiamento da Fapesp,
processo 2006/03038-5, a cuja instituio agradece.
E-mail: ana.agostinho@yahoo.com
** Professor da Universidade de So Paulo e Kyoto University of Foreign Studies (KUFS). O
autor agradece ao Departamento de Estudos Luso-Brasileiros da KUFS pelo auxlio financeiro
concedido a este trabalho.
E-mail: g.antunes@usp.br
178
METODOLOGIA
O corpus desta pesquisa foi trabalhado com o auxlio da ferramenta computacional MatLab que nos proporcionou o desmanche da
lista de palavras original do programa do DH.1 Cabe aqui ressaltar que
empregamos a noo lingstica de acento, e no a definio ortogrfica.
Diante das possibilidades que o programa nos permitia, foi-nos possvel
elaborar uma lista com todas as palavras oxtonas presentes no DH, a
que denominaremos lista-expandida. Todo o trabalho de classificao
dos verbetes e sua posterior separao (definindo o corpus), a natureza
da slaba final, qualidade das vogais e das consoantes finais, transcrio
fontica e listagem da lngua que deu origem ao termo portugus, no
caso dos emprstimos, foi efetuado manualmente.
179
180
181
DISCUSSO
Anlise estatstica dos dados
Nesta seo, analisaremos os dados referentes s colunas 2 e 8 da
lista-base, que contm o sculo arredondado e a lngua de origem. Em
seguida, analisaremos os dados referentes s colunas 5 e 6, que abarcam
o elemento final das oxtonas, e, finalmente, analisaremos os dados
referentes coluna 7, que traz a freqncia-web. vlido notar que, se
a etimologia da palavra era controversa, escolheu-se a primeira lngua
citada pelo DH como possvel emprestadora.
Alm disso, na lista-base, foi adicionada uma categoria para
topnimos, uma para antropnimos, uma para palavras derivadas de
nomes prprios, uma para vocbulos expressivos, uma para formas
histricas, uma para palavras resultantes de processo fontico-fonolgico
e uma ltima para palavras de difcil classificao, de acordo com a
etimologia descrita no DH. Essas palavras sero levadas em conta apenas
nas anlises que no se referem lngua de origem, j que no possuem
esta informao e, portanto, modificariam o resultado das anlises
estatsticas.
Anlise da fonte emprestadora: lngua e data
A Tabela 1, apresentada na pgina a seguir, contm os resultados
da anlise da etimologia das palavras oxtonas, destacando a origem
etimolgica, o nmero absoluto de entradas e tambm o valor relativo
das quinze lnguas3 que se revelaram mais representativas no corpus:
182
T ABELA 1 - R EPRESENTATIVIDADE
N MERO
O RIGEM
ETIMOLGICA
NO
P ORCENTAGEM
ABSOLUTO
DE PALAVRAS OXTONAS
DH
EM RELAO AOTOTAL
DE
10.494
PALAVRAS
latim
1774
16,9%
tupi
1558
14,9%
francs
583
5,6%
rabe
iorub
207
2,0%
portugus
190
2,0%
ingls
188
1,8%
origem indgena
157
1,5%
espanhol
140
1,3%
grego
87
0,8%
concani
78
0,7%
africanismo
74
0,7%
quimbundo
70
0,7%
italiano
65
0,6%
malaio
58
0,6%
Por um lado, o latim, o tupi,4 o francs, o rabe, o iorub, o portugus, o ingls e o espanhol destacam-se com mais de 100 ocorrncias.
Por outro lado, um total de 76 lnguas emprestou ao portugus quatro
palavras ou menos, sendo que, dessas 76 lnguas, 48 aparecem com
somente um item lexical oxtono. O portugus foi desconsiderado como
lngua emprestadora, sendo sua presena na lista justificvel por se tratar
de palavras oxtonas cuja origem no pode ser associada aos processos
morfolgicos do portugus, embora tambm no haja evidncias de se
tratar de uma palavra estrangeira ou proveniente do latim, via evoluo.
Assim, as palavras de origem portuguesa foram desconsideradas. De
um total de 10.494 palavras da lista-base, 81%, cerca de 8.500 palavras,
so externas ao portugus e ao latim. No entanto, as palavras de origem
SIGNTICA, v. 19, n. 2, p. 177-208, jul./dez. 2007
183
184
N MERO
GRUPOS
ABSOLUTO
N MERO
RELATIVO
frica
522
9%
Amricas
1783
29%
Europa 1
Germnicas
215
4%
Europa 2 Latinas
2797
46%
Europa 3 Outras
109
2%
Oriente Mdio e
Prximo
552
9%
Extremo Oriente
78
1%
185
186
187
188
solucionado, pois se coloca como uma questo central para os especialistas nas lnguas indgenas brasileiras: qual a extenso da influncia
vocabular indgena no portugus, excluindo-se as palavras de origem
tupi? A maior parte das palavras do tupi se refere nomenclatura de
fauna e flora. Observemos alguns exemplos: abati: tupi {awati} milho,
arroz, trigo; acari: tupi {gwakari} peixe da fam. dos loricarideos,
tb. conhecido como cascudo; cacund: tupi {kaa} folha, mato, erva
+ {kundawa} retorcido; imburi: tupi {mburi } espcie de palmeira.
O latim e as lnguas neolatinas formam um grupo influente.10 O
latim aparece em 1.774 ocorrncias (63%) dos dados do grupo das
lnguas latinas. Com 21% temos o francs, com 583 palavras, o espanhol
com 140 palavras e o italiano com 65.
O grupo de lnguas germnicas contribuiu com 215 palavras, sendo
que o ingls aparece com 188 palavras (88%) do total do grupo. O alemo
(20 palavras), o dinamarqus (1 palavra), o germnico (3) e o gtico (3)
so as outras lnguas do grupo.
Outras lnguas da Europa tiveram uma influncia menos marcante,
excetuando-se o grego com 87 palavras. As outras lnguas do grupo so
o basco (2), o russo (7), o turco (10) e o hngaro (1). As lnguas do
grupo do Extremo Oriente que incluem o birmans, o chins, o japons,
o mongol e o vietnamita aparecem com menos de 80 palavras, com
destaque para o chins com 37 e o japons com 36 palavras.
No grupo das lnguas de origem do Oriente Prximo e Mdio, o
rabe destaca-se com 207 palavras, 38% do total do grupo. vlido
ressaltar que os arabismos, as palavras de origem morabe e as palavras
do persa-rabe no foram computadas nesses 38%, mas sim nos 12% de
outras. Em relao aos arabismos, difcil determinar se a palavra um
emprstimo do rabe ou uma palavra portuguesa influenciada pelo rabe,
ou seja, arabizada. J as palavras de origem morabe, segundo o prprio
DH, so originrias de dialetos romnicos falados pelos morabes e
no da lngua rabe. As palavras do persa-rabe tambm no devem ser
consideradas como da lngua rabe porque difcil comprovar sua
189
DEFINIDA E INDEFINIDA
C OM DA TA O
( VALOR
A BSOLUTO )
C OM DA TA O
( V ALOR
RELATIVO )
S EM DATAO
( VALOR
ABSOLUTO )
S EM DATA O
( VALOR
RELATIV O )
rabe
180
87%
27
13%
Tupi
928
60%
630
40%
Francs
459
79%
124
21%
Grego
72
83%
15
17%
Concani
68
87%
10
13%
Espanhol
120
86%
20
14%
Iorub
135
65%
72
35%
Ingls
117
62%
71
38%
191
192
193
195
196
DE MAIOR INCIDNCIA
P ORCENTAGEM
S CULO
DE MAIOR INCIDNCIA
DE EMPRSTIMOS
DE EMPRSTIMOS
XVI e XIX
rabe
XVI
22%
Concani
XIX
55%
Francs
XIX
41%
Grego
XIX
38%
Tupi
XIX
37%
Latim
XIX
32%
Iorub
XX
79%
Ingls
XX
75%
Espanhol
197
199
2.597
i
1.273
a
1.255
u
1.162
r
928
596
i
468
444
385
s
385
e
368
o
175
u
154
e
117
101
j
86
Total 10.494
24,71%
12,13
11,96
11,07
8,85
5,68
4,46
4,24
3,68
3,68
3,50
1,68
1,47
1,11
0,96
0,82
100%
R ARAS
I NCOMUNS
C OMUNS
F REQENTES
23,8%
24,3%
26,8%
25,1%
21,1%
27,2%
26,1%
25,6%
21,1%
27,2%
26,1%
25,6%
26,3%
26,4%
24,2%
27,5%
26,3%
23,7%
23,1%
22,6%
201
CONSIDERAES FINAIS
O objetivo do texto era mostrar que, baseando-se em critrio
etimolgico, a maioria das palavras nominais oxtonas podem ser
classificadas como emprstimo. De certa forma, a existncia de palavras
com acento final no portugus uma inovao em relao ao latim, que
no o permitia. Assim, as palavras com acento final em portugus podem
ser derivadas das evolues fonticas do latim, dos processos internos
ao portugus, ou da adaptao de emprstimos de vrias lnguas. Estas
adaptaes revelam que o padro oxtono uma caracterstica da lngua
portuguesa desde os seus primrdios e no h nenhuma restrio que
proba a entrada de novas palavras oxtonas no portugus. Portanto,
esse padro ainda produtivo.
A anlise estatstica dos elementos finais mostra tambm que cerca
de 50% (ou 5.254 palavras) das oxtonas terminam em vogais. Isso
um desafio para as teorias do acento em portugus (ARAJO, 2007), que
defendem que o peso silbico importante para se estabelecer o locus
do acento. Outra concluso deste estudo diz respeito freqncia das
oxtonas: a anlise dos dados sugere que as oxtonas so, em mdia, to
comuns quanto as palavras paroxtonas e proparoxtonas.
202
NOTAS
1 Para isso recorremos ao ps-doutorando Dr. Zwinglio Guimares-Filho e sua
equipe de colaboradores do Instituto de Fsica da USP, a partir da sugesto
203
do Prof. Dr. Mrio Eduardo Viaro da FFLCH. A equipe do Dr. GuimaresFilho nos auxiliou na formatao da base de dados que constitui o corpus da
pesquisa.
2 A lista-expandida foi organizada em colunas. A primeira coluna contm as
palavras oxtonas numeradas de 1 a 37.591, em ordem alfabtica, conforme
o DH. A segunda coluna contm, a partir da datao do dicionrio, o sculo
arredondado, ou seja, para fins estatsticos, o ano preciso da datao foi
normalizado para uma data cheia. No caso de datao imprecisa ou desconhecida, atribuiu-se o valor zero. Com esta informao, pode-se tambm
determinar se uma palavra latina possui seu primeiro registro de datao no
portugus por evoluo ou por emprstimo tardio. Neste caso, por exemplo,
se a palavra for datada como oriunda do sculo 14 em diante, ser um
emprstimo erudito. Posteriormente, isto nos permitir tambm estabelecer
em quais sculos houve maior entrada das oxtonas no portugus e se houve
uma maior incidncia de determinada lngua especfica em algum sculo. A
terceira coluna contm a data original registrada no dicionrio e sua
respectiva fonte. A datao precisa pode ser til para estudos scio-culturais,
estabelecendo, por exemplo, a maior influncia de uma determinada lngua
estrangeira em um perodo qualquer. A quarta coluna contm a transliterao,
gerada a partir dos dados do programa do DH e da programao, para tal
fim, no MatLab. Na lista final, esta coluna foi substituda pela transcrio
fontica, feita manualmente, considerando-se o dialeto paulistano. A quarta
coluna apresenta a slaba final da palavra, sendo importante para
verificarmos a sua constituio, sobretudo sua vogal e consoante finais, as
quais aparecem na quinta e na sexta colunas, respectivamente. A stima
coluna um desdobramento das colunas 5 e 6. Foram atribudos os nmeros
zero e 1, respectivamente para vogal e consoante, com o intuito de
composio e anlise dos dados. A oitava coluna apresenta a freqnciaweb, que consiste na anlise da freqncia de uso das palavras oxtonas,
considerando-se sua ocorrncia em pginas em portugus da internet
indexadas pelo site de buscas Google, www.google.com.br. A freqncia
indica cada ocorrncia individual de uma palavra oxtona em cada pgina.
Dessa forma, a freqncia-web um indicador da freqncia geral na
internet. As colunas 9 e 10 marcam a classe de palavra do lexema, separandoas entre verbo e no-verbo (substantivos, adjetivos, advrbios etc.). Para
tanto, a legenda empregada nestas duas colunas foi 1 para sim e zero para
no. A dcima primeira coluna foi inserida depois que a lista-expandida
204
estava pronta. Cada uma das palavras foi analisada, a fim de classific-la
apta lista-base, a partir dos critrios supramencionados. Por fim, h a
coluna com a informao etimolgica, a qual traz informaes histricas,
morfolgicas e tambm sobre os processos fonolgicos do processo de
nativizao.
3 Demais lnguas: chins, 37 palavras, 0,4% do total das oxtonas; crioulo,
36, 0,3%; japons, 36, 0,3%; persa, 35, 0,3%; (de origem) banta, 34, 0,3%;
quicongo, 31, 0,3%; snscrito, 28, 0,3%; hebraico, 27, 0,3%; (de origem)
africana, 24, 0,2%; indigenismo, 24, 0,2%; hindi, 22, 0,2%; alemo, 20,
0,2%; jeje, 18, 0,2%; concani-marata, 16, 0,2%; guarani, 16, 0,2%;
provenal, 16, 0,2%; marata, 13, 0,1%; guzarate, 11, 0,1%; turco, 10, 0,1%;
umbundo, 10, 0,1%; catalo, 8, 0,1%; hispano-americano, 8, 0,1%; neorico, 8, 0,1%; russo, 7, 0,1%; (de origem) caribe, 6, 0,1%; tamil, 6, 0,1%;
cariri, 5, 0,1%; asteca/nuatle, 4, 0,0%; cingals, 4, 0,0%; hau, 4, 0,0%;
hispano-rabe, 4, 0,0%; nheengatu, 4, 0,0%; bangali, 3, 0,0%; galibi, 3,
0,0%; germnico, 3, 0,0%; gtico, 3, 0,0%; malaio-javans, 3, 0,0%; marataconcani, 3, 0,0%; qechua, 3, 0,0%; tamil-malaio, 3, 0,0%; (de origem)
amerndia, 2, 0,0%; arabismo africano, 2, 0,0%; basco, 2, 0,0%; birmans,
2, 0,0%; dravdico, 2, 0,0%; espanhol platino, 2, 0,0%; franco, 2, 0,0%;
javans, 2, 0,0%; kwa, 2, 0,0%; macua, 2, 0,0%; marata-guzarete, 2, 0,0%;
mongol, 2, 0,0%; persa-rabe, 2, 0,0%; tapuio, 2, 0,0%; tupi-guarani, 2,
0,0%; (de origem) altaica, 1, 0,0%; amrico, 1, 0,0%; arabismo, 1, 0,0%;
armnio, 1, 0,0%; aruaque, 1, 0,0%; (de origem) bengali, 1, 0,0%; berbere,
1, 0,0%; butans, 1, 0,0%; (de origem) cltica, 1, 0,0%; (de origem) cigana,
1, 0,0%; cigano, 1, 0,0%; concani-guzarati, 1, 0,0%; copta, 1, 0,0%; crioulo
macaense, 1, 0,0%; dinamarqus, 1, 0,0%; divehi, 1, 0,0%; egpcio, 1, 0,0%;
(de origem) escandinava, 1, 0,0%; fula, 1, 0,0%; galg, 1, 0,0%; ganguela,
1, 0,0%; havaiano, 1, 0,0%; hindi-persa, 1, 0,0%; hngaro, 1, 0,0%; indoiraniano, 1, 0,0%; j, 1, 0,0%; lngua de Moambique, 1, 0,0%; lun, 1,
0,0%; lutiazi, 1, 0,0%; malgaxe, 1, 0,0%; malinqu, 1, 0,0%; maratahindustni, 1, 0,0%; marati, 1, 0,0%; (de origem) morabe, 1, 0,0%; nup,
1, 0,0%; occitano, 1, 0,0%; panjabi, 1, 0,0%; pareci, 1, 0,0%; purocoto, 1,
0,0%; semtica, 1, 0,0%; tagalog, 1, 0,0%; tsonga, 1, 0,0%; twi, 1, 0,0%;
uigur, 1, 0,0%; vietnamita, 1, 0,0%; e xipaia, 1, 0,0%. As lnguas com
porcentagem de 0,0% so estatisticamente insignificantes.
4 O uso do termo tupi segue to somente a nomenclatura do DH. A lngua
tupi, efetivamente, nunca existiu. A expresso lngua tupi refere-se ao
205
206
REFERNCIAS
AGOSTINHO, A. L. S. Relatrio do projeto palavras oxtonas em portugus. So
Paulo: FFLCH-USP, 2007. (Mimeografado).
ARAJO, G. (Org.). O acento em portugus: abordagens fonolgicas. So Paulo:
Parbola, 2007.
ARAJO, G. A. et al. Algumas observaes sobre as proparoxtonas e o sistema
acentual do portugus. In: ARAJO, G. (Org.). O acento em portugus: abordagens fonolgicas. So Paulo: Parbola, 2007.
CACCIATORE, Olga G. Dicionrio de cultos afro-brasileiros. Rio de Janeiro:
Forense Universitria, 1988.
CAVAZZI, G. A. Descrio histrica dos trs reinos do Congo, Matamba e Angola,
de Joo Antonio Cavazzi de Montecccolo. Lisboa: Junta de Investigao do
Ultramar/ Agrupamento de estudos de cartografia antiga, [1687]1965.
CINTRA, G. Distribuio de padres acentuais no vocbulo em portugus.
Confluncia, n. 5/3, Unesp/Assis, p. 82-93, 1997.
CORREA, E. A. da S. Historia de Angola. Lisboa: Atica, [1782]1937, 2v.
CUNHA, C. O. O que um brasileirismo? Rio de Janeiro: Tempo Brasileiro,
1987.
FERREIRA NETTO, W. Introduo fonologia da lngua portuguesa. So Paulo:
Hedra, 2001.
HOUAISS, Antnio; VILLAR, Mauro. Dicionrio Houaiss da Lngua Portuguesa.
So Paulo: Objetiva, 2001.
207
208