Vous êtes sur la page 1sur 61

UNIVERSIDADE FEDERAL DE MINAS GERAIS

FACULDADE DE LETRAS

Wanderley Gonalves dos Santos Junior

ANLISE DE DADOS TEXTUAIS POR MEIO DE ANOTAO DE


ARQUIVOS DE UDIO E VDEO

Belo Horizonte
Faculdade de Letras UFMG
2015
1

Wanderley Gonalves dos Santos Junior

ANLISE DE DADOS TEXTUAIS POR MEIO DE ANOTAO DE


ARQUIVOS DE UDIO E VDEO

Monografia apresentada ao curso de


graduao da Faculdade de Letras da
Universidade Federal de Minas Gerais, como
requisito parcial obteno do ttulo de
bacharel em Letras.
rea de concentrao: Estudos da Traduo
Orientadora: Professora Doutora Adriana
Silvina Pagano

Belo Horizonte
Faculdade de Letras UFMG
2015
2

AGRADECIMENTOS

Pela oportunidade de desenvolver este trabalho e toda a ateno dispensada a este


agradeo minha orientadora Adriana Pagano.

Por toda ateno e suporte na discusso desta pesquisa, agradeo Adriana Alves.
Pela compreenso e incentivo, agradeo minha esposa Izabela.

E pelo companheirismo e ateno durante estes 4 anos de graduao, agradeo


Thas Rayanna.
3

RESUMO

Este trabalho enfoca a anlise de dados no estruturados, do tipo texto, por


meio de anotao de arquivos de udio e vdeo e apresenta o software ELAN (MAX
PLANCK INSTITUTE FOR PSYCHOLINGUISTICS, 2015), destacando sua utilizao
relevncia nos estudos lingusticos. Atravs da utilizao dos recursos deste
programa, foi realizada a transcrio e anlise de 54 oraes de uma narrativa
gravada em formato de vdeo. Utilizando-se como base a teoria sistmico-funcional
(HALLIDAY; MATTHIESSEN, 2014), mais especificamente, os estudos de Figueredo
(2011) quanto ao sistema de MODO e o sistema de SUJEITABILIDADE, as oraes
foram classificadas, primeiramente, quanto ao Modo da orao: Imperativo,
Declarativo e Interrogativo; posteriormente, quanto ao Modo da narrativa: Primeira
pessoa, Segunda pessoa ou Terceira pessoa; em seguida, quanto ao Tipo de
Sujeito: Responsvel, Distante Impessoal e Distante no-responsvel; e por ltimo,
quanto Pressuposio do Sujeito: Recuperado explcito, Recuperado implcito e
No recupervel. Foram contabilizadas as ocorrncias das categorias anotadas a
fim de se tentar identificar frequncias de ocorrncia que permitissem caracterizar a
narrativa do ponto de vista do Modo e SUJEITABILIDADE. Os resultados confirmam
os estudos de Figueredo (2011) no que diz respeito ao fato de que para toda orao
no portugus brasileiro possvel a identificao de um elemento que cumpre o
papel de Sujeito e da possibilidade de este ser responsvel ou no responsvel, j
que o nico caso em que o sistema de SUJEITABILIDADE no capaz de identificar
um elemento com funo de Sujeito nas oraes meteorolgicas, que neste
estudo foi identificado apenas em uma ocorrncia. Nas demais, predominou o
Sujeito responsvel e apenas um caso de Sujeito no responsvel foi identificado. A
Pressuposio predominante foi Recupervel explcito e recupervel implcito, tendo
as demais categorias ocorrido em menor quantidade. Constatou-se que por ser uma
narrativa em um vdeo, na qual a linguagem verbal est acompanhada de imagens e
gestos, foi possvel estabelecer a maior parte dos Sujeitos, pois possvel recorrer
s imagens do vdeo para identific-los, quando estes no esto claramente
expressos no texto verbal. Os resultados corroboram a afirmativa de Figueredo
4

(2011) no que diz respeito rede de SUJEITABILIDADE, mostrando que em toda


orao do portugus brasileiro possvel identificar o elemento capaz de receber
imputao modal, estando este claramente expresso ou no.
Palavras-chave: anotao de udio e vdeo ; Sistema de SUJEITABILIDADE ;
Sistema de MODO ; lingustica sistmico-funcional ; ELAN
5

ABSTRACT

This paper focuses on unstructured data analysis, more specifically text,


through annotation of audio and video files and introduces the software ELAN (MAX
PLANCK INSTITUTE FOR Psycholinguistics, 2015) with a view to highlighting its
relevance to linguistic studies. By means of this software, 54 clauses from a narrative
recorded in video format were transcribed and analysed. Drawing on systemic-
functional theory (Halliday; Matthiessen, 2014), more specifically, FIGUEREDO
(2011) regarding the MODE system and the Subjectivity system in BP, the clauses
were first annotated in terms of Mode: Imperative, Declarative and Interrogative. After
that, they were annotated regarding narrative Mode: First person, Second person
and Third person. Finally, they were annotated regarding type of Subject:
Responsible, Distant impersonal and distant non-responsible, and Subject
presupposition: Explicit recoverable, Implicit recoverable and Non recoverable.
Clauses were also translated into English as subtitles to the video file. The
frequency of occurrence of annotated categories was computed in order to
characterize the narrative from the point of view of Mode and Subjectivity. The results
confirm FIGUEREDO (2011)'s claim that for every clause in Brazilian Portuguese it is
possible to identify an element that fulfills the role of Subject and to ascribe to it
responsibility or non-responsibility, the only case in which a Subject function is not
identifiable being meteorological clauses, which occurred only once in this study.
Responsible Subject was the most frequent annotated category, there being only one
occurrence for Non responsible Subject. Regarding Subject presupposition, the
categories Explicit recoverable and Implicit recoverable were the most frequent, the
remaining categories occurring in smaller quantities. Since the text analyzed is a
filmed narrative in which verbal language operates together with images and
gestures, it was possible to recover most of the Subjects using the images and
gestures captured on the video to identify Subjects when they were not expressed.
The results support FIGUEREDO (2011)'s claim with respect to Subjectivity, showing
that in all clauses in BP it is possible to identify an element capable of being ascribed
modal responsibility, this element being expressed or not.
Keywords: video annotation Subjectivity system - MODE system - systemic
functional linguistics - ELAN
6

SUMRIO
1. INTRODUO ..................................................................................................... 7
2. REVISO TERICA............................................................................................. 9
2.1. Modo das oraes .............................................................................................................. 9
2.2. Sistema de SUJEITABILIDADE ....................................................................................... 9
2.2.1. Responsabilidade do Sujeito ................................................................................ 10
2.2.2. Sujeito Responsvel ................................................................................................ 10
2.2.3. Sujeito Distante......................................................................................................... 11
2.2.3.1. Sujeito Distante Impessoal ............................................................................ 11
2.2.3.2. Sujeito Distante No Responsvel .............................................................. 11
2.3. Pressuposio do Sujeito .............................................................................................. 12
3. METODOLOGIA ................................................................................................. 14
4. RESULTADOS E DISCUSSO ......................................................................... 18
5. DISCUSSO DOS RESULTADOS E CONCLUSO Erro! Indicador no definido.
REFERNCIAS ......................................................................................................... 27
APNDICE A - GUIA PRTICO DE UTILIZAO DO ELAN ................................. 30
APNDICE B LISTA DE ORAES TRANSCRITAS .......................................... 59
7

1. INTRODUO

Este trabalho tem por objetivo a anlise de dados textuais por meio de
anotao de 1 arquivo de vdeo, apresentando uma breve guia de utilizao do
software ELAN (MAX PLANCK INSTITUTE FOR PSYCHOLINGUISTICS, 2015) que
nos permite a realizao de tal anlise. Este guia pode ser localizado na sesso
Apndice deste trabalho, ao final, e foi elaborado para este trabalho levando em
conta a sua aplicao nos estudos lingusticos. A anlise foi feita com base na
lingustica- sistmico-funcional, mais especificamente nos estudos de FIGUEREDO
(2011) do portugus brasileiro, onde so definidos a rede de SUJEITABILIDADE e o
sistema de MODO.
Atravs da utilizao dos recursos deste software, foi realizada a
transcrio e anlise de 54 oraes de uma narrativa gravada em formato de vdeo.
Elas foram classificadas, primeiramente, quanto ao Modo da orao: Imperativo,
Declarativo e Interrogativo. Posteriormente, quanto ao Modo da narrativa: Primeira
pessoa, Segunda pessoa ou Terceira pessoa. Em seguida, quanto ao Tipo de
Sujeito: Responsvel, Distante Impessoal e Distante no-responsvel, e por ltimo,
quanto Pressuposio do Sujeito: Recuperado explcito, Recuperado implcito e
No recupervel.
A anlise de oraes do portugus brasileiro, enfoca o sistema de
SUJEITABILIDADE, tem sua relevncia no que diz respeito ao papel que o Sujeito
tem para realizar gramaticalmente uma funo discursiva nas interaes lingusticas:

O Sujeito uma funo gramatical em portugus brasileiro. Mais


especificamente, pode ser classificado como uma funo estrutural. Com
isto, o contedo semntico que esta funo gramaticaliza (a responsabilidade
modal) depende tanto de um elemento gramatical operando na ordem da
orao quanto de sua posio na estrutura. A partir da noo de funo
estrutural, pode-se dizer que o Sujeito em portugus brasileiro se estrutura de
forma prosdica (FIGUEREDO, 2011, p. 181).

A fim de se explorar o fenmeno da SUJEITABILIDADE, escolheu-se


analisar oraes extradas da lngua falada, conforme gravadas em um vdeo. E
para automatizar esta anlise foi utilizado o software ELAN, que embora concebido
8

para a anlise da lngua de sinais, permite analisar qualquer tipo de linguagem


verbal e no verbal. Com o software foi possvel classificar todas as oraes e extrair
todos os dados em arquivos de tabulao no formato [.txt], o que permite uma
melhor manipulao dos dados em programas de edio de planilhas como
Microsoft Excel ou no software R (R Core Team, 2014) e tambm de softwares
concordanciadores e de alinhamento, como AntConc (ANTHONY, 2014) e
WordSmith Tools (SCOTT, 2015).
Portanto, esta pesquisa busca explorar o sistema de SUJEITABILIDADE
em portugus brasileiro e, por meio do software ELAN, demonstrar a possibilidade
de se trabalhar com falas, narrativas ou qualquer outro tipo de expresso verbal e
no verbal de forma integrada e organizada, armazenando-se as anotaes e
extraindo-se dados que podem ser exportados para os outros softwares para a
obteno de resultados.
Esta monografia constituda por 5 sees, alm desta Introduo. A
segunda seo apresenta uma reviso terica, com os conceitos tericos utilizados
nesta pesquisa. A terceira seo destinada metodologia deste estudo; nela
explicitado de forma detalhada como foi conduzida a pesquisa e quais ferramentas
foram utilizadas. A quarta seo apresenta a anlise e discusso dos resultados. A
quinta e ltima seo encerra este estudo com as consideraes finais e sugestes
para estudos futuros. Complementam esta monografia, as referncias bibliogrficas
e o Apndice, onde possvel encontrar o guia bsico de utilizao do ELAN
complementar seo de metodologia.
9

2. REVISO TERICA

Esta pesquisa recorre a conceitos da lingustica sistmico funcional e foi


embasada no sistema de tipo de MODO proposto por Figueiredo (2011) que se
utiliza do sistema de SUJEITABILIDADE e suas subdivises Responsabilidade e
Pressuposio para classificar as 54 oraes utilizadas neste estudo. Por isso,
esses conceitos sero detalhados a seguir e fomentados com as prprias oraes
utilizadas neste estudo, isso explica a numerao dada aos exemplos abaixo, os
quais as 54 oraes foram numeradas de Orao 01 a Orao 54. A lista com essas
oraes pode ser conferida no Apndice B deste trabalho.

2.1. Modo das oraes

Segundo o sistema de tipo de MODO em Figueredo (2011), o Modo


indicativo compreende as oraes declarativas e interrogativas e se relacionam ao
ponto do tempo correspondente ao agora, isto , ao momento da enunciao e
justamente isso que o difere do Modo imperativo. O Modo imperativo, entretanto,
tambm possui as chamadas opes mais delicadas as quais configuram o Modo
sugestivo e jussivo. O primeiro caracterizado pela incluso do falante no comando
e o segundo no apresenta esta possibilidade. importante ressaltar que esta
pesquisa no leva em considerao essas formas mais delicadas de MODO.

2.2. Sistema de SUJEITABILIDADE

Segundo o sistema de SUJEITABILIDADE do portugus brasileiro


proposto por Figueredo :
A seleo dos termos que geram o Sujeito faz parte do sistema de
SUJEITABILIDADE. Seus dois termos menos delicados so
+SUJEITABILIDADE, realizado pelo Sujeito; ou - SUJEITABILIDADE,
quando no h qualquer elemento capaz de realizar a funo de
Sujeito (FIGUEREDO, 2011, p. 20).

Para a segunda classificao temos um nico caso onde no possvel


a realizao do Sujeito no PB que ocorre nas chamadas oraes meteorolgicas.
Vide exemplo:
10

Orao (04):

Comeou a chover.

Na orao acima extrada da transcrio do vdeo utilizado neste estudo,


percebe-se uma certa dificuldade de imputar modalidade ao Sujeito e at mesmo em
sua realizao. Entretanto na orao seguinte o Sujeito realizado.

Orao (10):

E eles saram correndo.

Quando h SUJEITABILIDADE, a realizao do Sujeito ou se d de forma


direta, isto , um grupo nominal se referindo ao Ente, ou atravs de elipse. No caso
acima se d atravs de um grupo nominal: Ele.

2.2.1. Responsabilidade do Sujeito

Segundo Figueredo, o Sujeito:


pode ser responsvel ou distante. Se for distante, pode ser
impessoal, realizado por pronomes indeterminados ou genricos (se,
voc, a gente, ns); ou no-responsvel, realizado pela no
explicitao do Sujeito e pela falta de concordncia do Finito, quando
se emprega a morfologia da terceira pessoa do singular ao verbo
finito. (FIGUEREDO,2011,p.186).

2.2.2. Sujeito Responsvel

Segundo Matthiessen (2008, p.162- 163 apud FIGUEREDO,2011, p.184):


um Sujeito responsvel o elemento sobre o qual recai a responsabilidade modal
pela proposio ou proposta realizada pela orao. J por responsabilidade modal
entende-se por um elemento sobre o qual a proposio pode ser confirmada ou
negada: Halliday e Matthiessen( 2004, p. 117 apud FIGUEREDO 2011,p.184).
Para ilustrar estes conceitos, seguem alguns exemplos tambm retirados
da narrativa utilizada nesta pesquisa:

Orao 01:
11

O Vincius foi ao zoolgico com o pai dele.

Orao 19:

Eu no estou vendo.

Nas oraes 01 e 19 o Sujeito claramente expresso e realizado por um


grupo nominal que possui concordncia do finito. Alm disso, possvel perceber
claramente a imputao de responsabilidade modal que ambos exercem na orao.
Portanto, estas oraes tm o seu Sujeito classificado como responsvel.

2.2.3. Sujeito Distante

O Sujeito distante pode ser Distante Impessoal ou Distante no responsvel. O


primeiro pode ser realizado por pronomes genricos, tais como se, ns, a gente,
voc,etc. O segundo ocorre quando no possvel ser explicitado, quando no h
concordncia com o finito e tambm nos casos em que a morfologia da terceira
pessoa do singular utilizada junto ao verbo finito.

2.2.3.1. Sujeito Distante Impessoal

Das oraes analisadas neste estudo no foram encontradas nenhuma


com o seu Sujeito classificado por Distante impessoal. Isto se deu pelo fato de todos
os Sujeitos da narrativa terem sido realizados como Responsvel.

2.2.3.2. Sujeito Distante No Responsvel

Para a classificao de Sujeito Distante foi classificado apenas uma


orao

Orao 07
Se no com essa chuva no vai dar tempo

Na orao 07, o trecho no vai dar tempo pode ser classificado como
Sujeito no responsvel, pois foi empregada morfologia da terceira pessoa do
singular e utilizada junto ao verbo finito, vai dar tempo. No possvel, neste caso,
imputar responsabilidade modal, pois o Sujeito aqui no responsvel.
12

2.3. Pressuposio do Sujeito

Em uma dada anlise lingustica,


quando um Sujeito pode ser inferido pelos interlocutores, ento diz-
se que este pode ser recuperado. Esta recuperao pode ser de dois
tipos: explcita, quando a inferncia a um Sujeito se d por
referncia, substituio ou coeso lexical; ou implcita, quando o
Sujeito entendido atravs da elipse. (FIGUEREDO,2011,p.189).

Em outras palavras, mesmo quando o Sujeito no est claramente


expresso este pode ser recuperado atravs de elipse, por referncia, substituio ou
coeso lexical. Abaixo possvel verificar essa classificao nas oraes que se
seguem:

Orao 02 :

O Vincius um menino muito pequeno.

Orao 06:
Vincius, vamos andar rpido.
Orao 17:
Aonde, pai, eu no estou conseguindo ver.
Orao 30 :
S conseguiu ver a juba.

Na orao 02 o Sujeito pode ser claramente recuperado e est explcito,


pois sua realizao se d por um grupo nominal: Vincius.
Na orao 06 o Sujeito pode ser recuperado pela concordncia do verbo,
entretanto se d de maneira implcita (ns).
Na orao 17 o Sujeito recuperado explicito, pois se realiza pelo
pronome Eu. No ltimo caso, orao 30, o Sujeito pode ser recuperado se
recorrermos ao dilogo completo, entretanto realizado de forma implcita, ou seja,
se d por elipse do pronome Ele.
importante ressaltar nos casos de Sujeito classificado como no
responsvel pode ser possvel recuperar o Sujeito, entretanto no ser possvel
13

atribuir responsabilidade modal, visto que no h concordncia com o finito, como j


visto na orao 07
Quanto aos casos em que o Sujeito no pode ser recuperado, foi
identificado apenas um caso, e este pode ser verificado na orao 07:

Orao 07
Se no com essa chuva no vai dar tempo.

Nesta orao, o Sujeito alm de ser Distante No Responsvel no


recupervel, no possvel voltar ao texto e identific-lo com clareza.

Por fim, a seguir apresentado a Figura 1 com o sistema de


SUJEITABILIDADE, retirada de Figueredo (2011). Nela, nota-se claramente os tipos
de Sujeito, responsabilidade e Pressuposio.

Figura 1- A rede de sistema de SUJEITABILIDADE

Fonte: Figueredo (2011,p.194)


14

3. METODOLOGIA

Para a realizao deste trabalho foi escolhida uma narrativa gravada no


vdeo intitulado Zoolgico, do quadro Contadores de Histrias, com dois contadores
de histria, um homem e uma mulher, que se utilizavam de objetos simples para
representar os personagens e o cenrio da histria narrada. Este quadro fez parte
do programa televisivo R-Tim- bum1. A narrativa construda de falas em terceira
pessoa utilizadas pelo narrador para se referir aos personagens -- Vincius e seu pai
-- e de primeira e segunda pessoa para representarem o dilogo entres os dois
personagens da histria.
Para este estudo foi utilizado um vdeo com durao de 1min e 59s, com
resoluo de 640x480p e no formato [.mp4]. Primeiramente, foi feito o download do
vdeo da internet no formato [.flv] e depois convertido para [.mp4]. O prximo passo
foi importar o vdeo para o software ELAN e criar as primeiras trilhas de anotao
Oracoes e oracao_transcricao. A primeira foi criada com objetivo principal de
etiquetar as oraes a serem transcritas utilizando-se para isso das abreviaes
O01(Orao 1), O02(Orao 2), e assim por diante. Para esta trilha, foi atribudo o
tipo lingustico padro (default-it), isto , sem nenhuma associao a esteretipos ou
vocabulrio controlado. A segunda trilha foi criada com o objetivo de transcrever as
falas dos vdeos em oraes e teve como trilha me a trilha Oracoes.
Em seguida, foi criado o tipo lingustico transcricao com esteretipo
symbolic association. Este tipo lingustico foi criado para ser associado trilha
Oracao_transcricao e traduo, criada posteriormente e com objetivo de se

1 R-Tim-Bum foi um programa infantil de grande sucesso produzido e exibido pela TV Cultura de 5
de fevereiro de 1990 a 26 de maro de 1994. (ZOLGICO, R-Tim-Bum, So Paulo, TV
Cultura,1994, Programa de TV disponvel:< em
https://www.youtube.com/watch?v=csoM2cVgKWQ/>Acesso em: 16 de outubro. 2015)
15

conter a traduo das oraes anotadas para o ingls. Com as duas trilhas
principais j criadas, o vdeo foi reproduzido e foram transcritas de suas falas 54
oraes todas anotadas na trilha oracao_transcricao e etiquetadas de O01 A
O54 na trilha oraes. J na terceira trilha, foi feita a traduo dessas oraes para
o ingls. importante ressaltar que os nomes das trilhas foram criados
desconsiderando acentuao ou espaos para os nomes compostos, este
procedimento foi adotado para evitar problemas de compatibilidade com outros
softwares leitores de arquivos de tabulao.
Para facilitar a classificao lingustica das oraes de acordo com os
estudos de Figueredo (2011) quanto SUJEITABILIDADE, Pressuposio do
Sujeito e Modo das oraes, foi necessrio criar 4 vocabulrios controlados. Foram
eles: Pressuposio, Modo,Tipos_de_Sujeito e Narrativa. O primeiro contm
uma lista com as possveis pressuposies do Sujeito segundo Figueredo (2011):
Recuperado Implcito, Recuperado Explcito, No recupervel e a opo
SUJEITABILIDADE (sem SUJEITABILIDADE) foi adicionada para a nica orao
que no possui SUJEITABILIDADE*. O segundo contm a lista com o Modo das
oraes: Imperativo, Declarativo e Interrogativo . O terceiro: Responsvel,
Distante impessoal, Distante no responsvel e SUJEITABILIDADE. E por
ltimo, uma lista apenas com a classificao das pessoas da narrativa: Primeira
pessoa, Segunda pessoa e Terceira pessoa.
Os vocabulrios controlados s podem ser utilizados se associados a um
tipo lingustico e estes associados a alguma trilha. Sendo assim, para a criao das
trilhas restantes Modo_da_narracao, Modo_das_oracoes, SUJEITABILIDADE e
Pressuposicao foi necessrio a criao de mais 4 tipos lingusticos, so eles:
Modo, SUJEITABILIDADE,Narrativa e Pressuposio. Todos esses tipos
utilizaram o esteretipo Symbolic Association e foram associados respectivamente
aos vocabulrios controlados Modo, Tipos_de_Sujeito,Narrativa e
Pressuposio. Quanto aos atributos das novas trilhas, a primeira foi associada ao
tipo lingustico narrativa e teve como trilha me a trilha Oracao_transcricao. A
segunda teve a mesma trilha me da primeira e associao ao tipo lingustico
Modo. A terceira tambm teve a mesma trilha me das anteriores e sua associao
foi com o tipo SUJEITABILIDADE. A ltima trilha a ser criada teve como trilha me
a trilha SUJEITABILIDADE e foi associada ao tipo lingustico Pressuposio.
16

Alm disso, a classificao das oraes seguindo os critrios de


Figueredo (2011) foi feita apenas para as oraes dadas em portugus brasileiro, a
traduo dessas oraes para o ingls foi realizada com o objetivo de se gerar um
arquivo de legendas para o vdeo utilizado.
Na Figura 2, possvel visualizar como as trilhas criadas para este estudo
foram relacionadas em nveis hierrquicos.

Figura 2- Tela capturada do software ELAN mostrando hierarquia de trilhas da anotao

O Quadro 1 ilustra a relao das trilhas criadas com suas respectivas


trilhas mes e a qual tipo lingustico foram associadas.

Quadro 1 Relao de trilhas com respectivo tipo lingustico

Trilha Trilha Me Tipo lnguistico


Oracoes - Default-it
Oracao_transcricao Oracoes Transcrio
Modo_da_narracao Oracao_transcricao Narrativa
Modo_das_oracoes Oracao_transcricao Modo
Traducao Oracao_transcricao Transcrio
SUJEITABILIDADE Oracao_transcricao SUJEITABILIDADE
Pressuposio SUJEITABILIDADE Pressuposio
17

Aps este processo, foram feitas as anotaes nas trilhas criadas e em


seguida os dados foram exportados utilizando a opo exportar>lista de palavras
com frequncia. O arquivo [.txt] gerado nesta exportao foi aberto no Excel, onde
foram criados grficos e tabelas que podero ser melhor apresentados na prxima
seo.
18

4. RESULTADOS E DISCUSSO

Nesta seo, sero apresentados os resultados que foram obtidos pela


fundamentao terica e pela metodologia apresentada nas sees anteriores.
Ao exportar no ELAN utilizando o tipo lista de palavras com frequncia,
obteve-se a Tabela 1 abaixo:

Tabela 1- Frquencia absoluta de ocorrncia das categorias anotadas

Tokens Ocorrncias
Responsvel 52
Terceira pessoa 42
Declarativo 38
Recuperado explicito 33
Recuperado implcito 19
Imperativo 8
Interrogativo 8
Primeira pessoa 8
Segunda pessoa 4
Distante no responsvel 1
Sem SUJEITABILIDADE 1
Distante Impessoal 0
Total 214

O passo seguinte foi separar os resultados em categorias semelhantes s


trilhas de anotao: Pressuposio, Modo da orao, Modo da narrativa e
SUJEITABILIDADE e gerar tabelas a fim de verificar a frequncia em que ocorreram
na anotao. Os resultados das ocorrncias podem ser conferidos nas tabelas
abaixo:
19

Tabela 2 - Nmero de ocorrncias do Modo da orao

Modo da orao

Declarativo 38

Imperativo 8

Interrogativo 8

Total 54

Tabela 3 - Nmero de ocorrncias para o Modo da narrativa

Modo da narrativa

Terceira pessoa 42
Primeira pessoa 8
Segunda pessoa 4

Total 54
20

Tabela 4 - Nmero de ocorrncias para Pressuposio do Sujeito

Pressuposio do Sujeito

Recuperado explcito 33
Recuperado implcito 19
Sem SUJEITABILIDADE 1
No recupervel 1

Total 54

Tabela 5 - Nmero de ocorrncias para os tipos de Sujeito

Tipos de Sujeito
Responsvel 52
Distante no-responsvel 1
Sem SUJEITABILIDADE 1
Distante impessoal 0
Total 54

Como os dados provenientes das tabelas acima, foram gerados grficos


para ilustrao dos resultados obtidos. Os grficos gerados foram os seguintes:
21

MODO DA NARRATIVA
45
40
35
30
25
20
15
10
5
0
Terceira pessoa Primeira pessoa Segunda pessoa

Grfico 1 Tipos e Sujeito segundo Modo da narrativa

Verificou-se para o Grfico 1, Modo da narrativa, que a terceira pessoa foi


mais utilizada na narrao da histria do que a primeira e a segunda pessoa. Este
resultado pode ser explicado pelo fato de se tratar de uma narrativa a qual o
narrador apresenta os personagens em terceira pessoa e estes dialogam entre si em
primeira e segunda pessoa. Esta situao pode ser observada nas oraes abaixo
extradas da prpria narrativa:

Orao 09: Vamos correr. (Primeira pessoa)

Orao 10:

E eles saram correndo. (Terceira pessoa)

Orao 11:

E nessa correria, do elefante o Vincius s viu as patas. (Terceira pessoa)

Orao 12:

Continuaram a correr. (Terceira pessoa)

Orao 13:

Vamos, pai, vamos correr. (Primeira pessoa)


22

Alm da ocorrncia de terceira pessoa associada aos momentos da


narrativa em que o narrador introduz as aes dos personagens, tambm muito
comum a ocorrncia entre os personagens em oraes interrogativas como as que
ocorrem abaixo:

Orao 16: Pai, mas onde que est? (Terceira pessoa)

Orao 36: Pai, qu que aquilo? (Terceira pessoa)

MODO DAS ORAES


40

35

30

25

20

15

10

0
Declarativo Imperativo Interrogativo

Grfico 2 - Tipos e Sujeito segundo Modo das oraes

No Grfico 2, constatou-se que o Modo mais utilizado na narrativa foi o


declarativo sendo os modos Interrogativo e Interrogativos com o mesmo nmero de
ocorrncia. Estes resultados podem ser explicados se levarmos em considerao
que o narrador utiliza sentenas declarativas para descrever os personagens (vide
exemplos abaixo) e importante notar que o Modo interrogativo o qual
caracterizado em sua maioria pelas perguntas que o Vinicius faz ao seu pai sobre os
bichos do zoolgico geram sentenas declarativas (respostas).

Vide exemplos:
23

Modo declarativo proferido pelo narrador:

Orao 01:

O Vincius foi ao zoolgico com o pai dele.

Orao 02:

O Vincius um menino muito pequeno.

Modo interrogativo utilizado pelos personagens ( Vinicius):

Orao 24:

Pai, que bicho aquele?

Modo declarativo utilizado pelos personagens (Pai do Vinicius)

Orao 27:

Ah, aquele l, aquele l a girafa.

Modo declarativo proferido pelo narrador:

Orao 28:

E da girafa ele s viu o pescoo.


24

SUJEITABILIDADE
60

50

40

30

20

10

0
Responsvel Distante no- Sem SUJEITABILIDADE Distante impessoal
responsvel

Grfico 3 - Tipos e Sujeito segundo SUJEITABILIDADE

No Grfico 3, constatou-se que a maior ocorrncia foi para o Sujeito


responsvel, ou seja, aquele que claramente expresso. No houve ocorrncia para
Sujeito distante impessoal e apenas 1 ocorrncia para o Modo Sem
SUJEITABILIDADE que se deu pela nica orao meteorolgica presente na
narrativa(Orao 4). J para o Sujeito Distante No Responsvel tivemos tambm
apenas uma nica ocorrncia. Vide oraes abaixo:

Sujeito Responsvel

Orao 39:

O Vincius viu uma coisa linda.

Orao 46:

Eles chegaram em casa.

Orao 48:

A me do Vinicius veio e perguntou.


25

Sem SUJEITABILIDADE

Orao 4:

Comeou a chover.

Distante no responsvel

Orao 07:

Se no com essa chuva no vai dar tempo

PRESSUPOSIO DO SUJEITO
35

30

25

20

15

10

0
Recuperado explcito Recuperado implcito Sem SUJEITABILIDADE No recupervel

Grfico 4 - Tipos e Sujeito segundo Pressuposio

Por ltimo, temos os resultados do Grfico 4 que mostra que na narrativa


analisada neste estudo predomina-se o Sujeito recupervel explcito, isto , aquele
que pode ser recuperado e que facilmente identificado por um grupo nominal, por
exemplo. A segunda ocorrncia mais frequente foi para o Sujeito Recupervel
implcito. Como as oraes foram extradas de uma narrativa de uma histria que
contada com ilustraes, a maioria dos Sujeitos foram passiveis de recuperao
sendo apenas um deles impossvel de se recuperar, que foi o caso j demonstrado
da orao 07. J o exemplo de sem SUJEITABILIDADE foi identificado apenas na
26

orao 4 que meteorolgica no sendo possvel imputar responsabilidade modal


ao Sujeito, visto que este no pode ser identificado.

5. CONSIDERAES FINAIS
27

Esta pesquisa buscou analisar dados textuais por meio de anotao de


arquivos de udio e vdeo atravs da utilizao do software ELAN e de seus
recursos.
Quanto aos resultados obtidos, constatou-se que o sistema de
SUJEITABILIDADE de Figueredo (2011) permite classificar as oraes extradas de
uma narrativa gravada em vdeo. Foi possvel corroborar a hiptese de Figueredo de
que para toda orao no portugus brasileiro, com exceo das meteorolgicas,
possvel identificar o Sujeito, sendo ele implcito ou explcito; responsvel ou
distante.
Alm da aplicao da pesquisa de Figueredo (2011) nesta anlise, ainda
foi possvel com esta pesquisa a elaborao de um tutorial bsico das funes do
ELAN que poder ser utilizado por pesquisadores no futuro em pesquisas sobre o
tema.
Conclui-se, dessa forma, que os objetivos deste trabalho no que
corresponde a como o software ELAN pode ser aplicado para se analisar dados
lingusticos foram cumpridos e seus resultados foram explicitados. Cabe agora
explorar novos temas relacionados a mais dimenses do sistema lingustico. Como
exemplo, deixo como sugesto a utilizao do ELAN para a perfilao gramatical
sistmica baseada em corpora oral de uma lngua, onde o sistema de
SUJEITABILIDADE poderia ter os seus nveis de delicadeza numerados sendo
representados por categorias com a possibilidade de elaborao de mapa
topolgico. Estudo deste tipo j realizado encontrado em Figueredo (2014) onde
esse processo de numerao feito manualmente; neste caso, sugere-se aqui que
seja utilizado o ELAN para a perfilaao e manipulao de dados.

REFERNCIAS
28

ANTHONY, L. (2014). AntConc (Version 3.4.3) [Computer Software]. Tokyo, Japan:


Waseda University. disponvel em http://www.laurenceanthony.net/.
BICKFORD, Albert. (2005). Using ELAN: A getting-started guide for use with sign
languages. Disponvel em:
.http://www.und.edu/dept/linguistics/textbooks/UsingElan.pdf
FIGUEREDO, G. P. Introduo ao perfil metafuncional do portugus brasileiro:
contribuies para estudos multilngues. Belo Horizonte: Faculdade de Letras da
UFMG / PosLin, 2011. (Tese, Doutorado em Lingustica Aplicada).
HOCHGESANG, Julie. (2012). ELAN: A quick guide to the multimedia annotator.
Disponvel em:https://www.academia.edu/5510439/ELAN_guide.
MATTHIESSEN, C. Lexicogrammatical cartography: English systems. Tokyo:
International Language Science Publishers, 1995.
MAX PLANCK INSTITUTE FOR PSYCHO-LINGUISTICS. ELAN Linguistic
Annotator. nijmegen: The Language Archive, 2015.
R CORE TEAM. R: A Language and Envi-ronment for Statistical Computing. Vienna:
R Foundation for Statistical Computing, 2015.
SCOTT, M., <2015>, WordSmith Tools. Liverpool: Lexical Analysis Software.
SLOETJES, Han (Org.). ELAN: Multimedia Annotation Tool,. 2009. Disponvel em:
<http://pubman.mpdl.mpg.de/pubman/item/escidoc:131150:5/component/escidoc:135
959/ELAN_Augsburg.pdf>. Acesso em: 30 out. 2015.
TACCHETTI, MADDALENA. (2013). User Guide for ELAN Linguistic Annotator.
disponvel em:http://tla.mpi.nl/tools/tla-tools/elan/.
ZOLGICO, R-Tim-Bum, So Paulo, TV Cultura,1994, Programa de TV.
29
30

APNDICE A

APNDICE A - GUIA PRTICO DE UTILIZAO DO ELAN

1. INICIANDO O ELAN

Depois de definido o arquivo a ser trabalhado, que para este estudo ser um
vdeo, basta abrir o programa e clicar em Arquivo >Novo e na janela que se abrir,
basta selecionar o arquivo ou os arquivos para se comear a trabalhar. Esta seleo
possvel atravs do navegador de arquivos, localizado ao lado esquerdo. Em
seguida clique no boto [>>] para adicion-los lista de arquivos selecionados para
anotao ("Arquivos Selecionados:"). Para finalizar, clique em "OK".(Figura 3).

Figura 3- Selecionando arquivos para anotao


31

1.1. Organizando os arquivos

O ELAN organiza seus arquivos nos chamados "projetos". Cada um desses


projetos possui, pelo menos, dois arquivos sendo um arquivo de anotao com a
extenso [.eaf] quando criado no ELAN. Entretanto outros formatos de transcrio
tambm podem ser importados e abertos no ELAN).

O ELAN cria uma correspondncia entre os arquivos de anotao com seus


respectivos arquivos de vdeo e udio, ele tambm salva essa correspondncia no
arquivo de anotao. Isto significa que toda vez que voc abrir um Arquivo do ELAN,
ele ir procurar automaticamente o arquivo de som/vdeo pertencente a seu arquivo
de transcrio. Se o ELAN no puder encontrar este arquivo no local especificado
(por exemplo, se voc estiver abrindo o arquivo em um computador diferente
daquele em que voc fez a transcrio original, ou ainda se foi movido para um novo
local no HD), ele ir perguntar a localizao correta do arquivo de som./vdeo para
que voc o indique o endereo correto do arquivo.

2. PREPARAAO DO VDEO

No ELAN pode-se trabalhar com arquivos de vdeo ou de udio, mas este


trabalho utilizar um vdeo para conduo deste estudo. importante ressaltar que o
ELAN suportar apenas os formatos que o computador do usurio suporta, sejam
eles de vdeo ou de udio, ele ir buscar pelos codecs que o computador possui
instalado para reproduzir os seus arquivos. Em outras palavras o ELAN utiliza a
biblioteca de codecs do computado do usurio. Logo, se o computador no possuir
um codec instalado para o formato [.mp4], por exemplo, o ELAN no ser capaz de
reproduzir este arquivo.
O software no possui restries quanto ao tamanho e resoluo dos
arquivos a serem reproduzidos, entretanto, aconselha-se trabalhar com arquivos
mais leves, isto , no maiores do que 1gb, com durao abaixo de 30 minutos e
com resolues mais baixas (abaixo de 720p). Arquivos com caractersticas maiores
do que essas iro ser reproduzidas pelo software sem restries, entretanto
32

travamentos e dificuldades de processamentos so passveis de ocorrerem nesses


casos. Desta forma, indicado se trabalhar com arquivos curtos e em formatos mais
leves, como [.mp4] e utilizar apenas os trechos do vdeo que sero trabalhados, para
isto pode ser necessrio cortar o vdeo ou dividi-lo em trechos.

3. ABRINDO UMA ANOTAO EXISTENTE

Para abrir uma anotao existente, selecione Arquivo> Abrir ou use o atalho
no teclado [CTRL] + [O]. Indique o arquivo [.eaf] que voc deseja abrir. Se o ELAN
conseguir localizar o arquivo de som correspondente, ento ele ser aberto em uma
nova janela, juntamente com a transcrio salva no arquivo .[.eaf.] caso contrrio, o
ELAN solicitar primeiro a indicao do local do arquivo de mdia.

4. Salvando arquivos

Para salvar o seu trabalho, v em Arquivo> Salvar ou pressione [CTRL] +


[S].
33

5. Viso geral das principais funes do ELAN

Figura 4-Viso geral principais funes do ELAN

A fim de facilitar o entendimento da tela inicial do ELAN, a imagem 4 foi


dividida em 8 sees que sero explicitadas logo abaixo:
1.Visualizador de vdeo: o local onde o usurio ter contato com o vdeo
trabalhado, podendo utilizar-se dos recursos da seo 3 para sua reproduo.
2.Abas: So elas Grade, Texto, Legenda, Lexicon, Comments,
Reconhecedores, Metadados e Controles. Por questes de relevncia
para este estudo, sero dadas as definies apenas das abas abaixo:
Grade: Mostra todas as trilhas no formato de uma lista tabular com todas as
anotaes e trilhas e tambm com o tempo de durao de cada uma delas.
34

Figura 5-Aba grade

Texto: Aps selecionada a trilha desejada, exibir as anotaes em um texto


nico.

Figura 6-Aba texto

Legenda: Esta aba permite as trilhas selecionadas serem exibidas como


legendas de um filme medida em que o vdeo reproduzido. No exemplo da
imagem abaixo apenas 2 trilhas foram selecionadas, mas este nmero no o
mximo permitido pelo programa.

Figura 7- Aba legenda


35

Controles: Possui duas barras de controle deslizantes: Volume e Velocidade.


A primeira controla o volume do udio/vdeo que est sendo reproduzindo e a
segunda a sua velocidade de reproduo.

Esta seo apresenta uma breve descrio das funes dos controles
localizados na parte superior da janela principal do ELAN.

Figura 8- Aba controles


36

3.Controles de reproduo: controlam a reproduo do vdeo. Ver Figura 9

Figura 9-Controles de reproduo e suas funes

4 e 5: Vide imagem
37

Figura 10-Botes de controle da anotao

6. Controle de velocidade: J exemplificado na sesso 2, abas, trata-se do controle


da velocidade de reproduo.

7. Disposio das trilhas: o local onde possvel visualizar todas as trilhas


criadas e sua hierarquia.

8. Linha do tempo: mostra todas as anotaes e o tempo correspondente no vdeo.

9.Visualizador de densidade: situa-se abaixo dos botes de controle e fornece


uma viso geral de quanto j foi transcrito e anotado de um arquivo at aquele
momento. Pequenos retngulos cinzentos escuros na metade inferior da barra
indicam regies do arquivo anotado que contm unidades de anotaes, de Modo
que voc possa ver em apenas uma pgina quais partes do arquivo j foram
transcritas.
38

6. Conceitos gerais

Trilha: trata-se de vrias anotaes agrupadas seguindo um mesmo critrio,


sendo este uma traduo, uma etiqueta ou transcrio.
As trilhas podem ser independentes ou dependentes. A primeira aquela que
associada e alinhada diretamente com a linha do tempo e a segunda pode ser
associada a outra trilha, criando dessa forma uma hierarquia entre elas. As trilhas
dependentes tambm podem ser chamadas de filhas.

Anotao: um texto digitado dentro de uma trilha que automaticamente


associado ao intervalo de tempo do arquivo em reproduo. Exemplos de anotao:
uma orao, traduo de uma orao, transcrio fontica, dentre outros.

7. Criando novas trilhas

Para criar uma nova trilha, v em "Trilha > "Adicionar Nova Trilha.".
Uma nova janela ir abrir com uma lista de trilhas e vrias guias de controle e
campos ao meio. A guia Adicionar ficar destacada e ela contm os seguintes
campos:

7.1. "Nome da Trilha":

Aqui voc deve inserir o nome da trilha sobre o que voc deseja anotar. Por
exemplo, se voc estiver trabalhando com uma transcrio de linguagem de sinais,
um bom nome para a primeira trilha seria transcrio ou traduo.

7.2. "Participante":

Em Participantes inserem-se os falantes envolvidos no processo de anotao.


Como por exemplo, um entrevistado.

7.3. "Anotador":
39

Introduza o nome de quem estiver fazendo as anotaes, por exemplo, o seu


prprio nome.
Depois de ter definido os campos para todos os participantes, voc poder
excluir a trilha padro. Para isso, clique na aba Apagar e selecione a trilha default
para ser apagada. Finalmente, clique em fechar para retornar a pgina inicial de
anotaes.

7.4. Trilha me

No campo trilha me possvel tornar uma trilha dependente, isto , filha de


uma outra trilha principal. Importante: no possvel alterar a trilha me de uma
trilha filha posteriormente, portanto sugere-se que um plano de hierarquia seja feito
anteriormente ao processo de anotao.

7.5. Tipo lingustico

Tipo lingustico uma forma de se restringir um contedo de uma trilha e suas


anotaes. Ao se definir um tipo lingustico e aplic-lo a uma trilha estamos
delimitando o contedo que aquela trilha poder conter. Por exemplo, uma trilha
criada para fins de uma transcrio receber apenas texto. J uma criada para
transcrio fontica receber caracteres especiais. O papel do tipo lingustico, dessa
forma, restringir o contedo de uma trilha em relao s demais.

8. Esteretipos

8.1. Time Subdivision (Subdiviso temporal):


40

A anotao da trilha me pode ser dividida em unidades menores que so


associadas linha do tempo e no pode haver espaos entre as anotaes da trilha
filha.
Exemplo: Se assemelha com Included in, porm no permitido espaos, pode ser
usado na diviso de uma fala quando no se tem por objetivo identificar pausas e
hesitaes.

Figura 11-Time subdivision

8.2. Included In (Includo):

A anotao da trilha me pode ser dividida em unidades menores que so


associadas linha do tempo. Pode conter espaos entre as anotaes da trilha filha.
Exemplo: Included in: Como este esteretipo permite espao entre as anotaes,
um bom exemplo seria a anlise de uma fala no qual no interessante para o
usurio anotar os momentos de pausas e hesitaes.

Figura 12-Included in

8.3. Symbolic Association (Associao simblica):

Insero de uma anotao relacionada de maneira 1x1 com a anotao


da trilha me.
41

Exemplo: Symbolic Association: Caso haja uma trilha me com um trecho de um


texto anotado e uma filha contendo a traduo da primeira, indica-se a utilizao do
esteretipo Symbolic Association, pois a relao de um trecho e sua traduo 1x1.

Figura 13-Symbolic Subdivision

8.4. Symbolic Subdivision:(Subdiviso simblica)

A anotao da trilha me pode ser dividida em unidades menores que


no so associadas linha do tempo. No pode haver espaos entre as anotaes
da trilha filha.
Exemplos: uma trilha chamada palavra e uma outra chamada morfema, neste
caso a segunda trilha poder ser dividida em unidades menores no podendo haver
espaos. Neste caso, a trilha filha ser segmentada baseando-se no contedo de
sua trilha me sem considerar o intervalo de tempo.

Figura 14-Symbolic Subdivision

9. Vocabulrio controlado:

uma forma de automatizar o processo de anotao criando listas pr-


definidas de palavras. Por exemplo, se o objetivo da anotao for classificar oraes
no portugus brasileiro quando ao Modo Indicativo, imperativo ou interrogativo,
basta criar um vocabulrio com essas palavras e elas aparecero em sua anotao
na forma de uma lista suspensa. Vide imagem:
42

Figura 15-Vocabulrio controlado

9.1. Criando um vocabulrio controlado

Para criar um vocabulrio controlado, v at o menu EDITAR> EDITAR


VOCABULRIOS CONTROLADOS. No campo NOME DO VC digite o nome
vocabulrio desejado. Para inserir as palavras do vocabulrio, preencha o campo
valor da entrada e clique em adicionar. Terminado a criao do vocabulrio
controlado, agora j possvel associ-lo a um tipo lingusticos.
43

Figura 16-Janela de edio do vocabulrio controlado

10. Criando e modificando anotaes.

Para criar uma nova anotao em uma trilha, selecione primeiro a trilha
desejada e faa-a ficar ativa clicando duas vezes em seu nome.
Selecione a parte do arquivo que voc deseja anotar e v para "Anotao">
"Nova Anotao Aqui", ou use a tecla de atalho [CTRL] + [N]). Uma caixa pequena
de edio ir aparecer na trilha ativa e voc poder iniciar sua anotao. Aps
inserir sua anotao, pressione [Enter] para salvar suas alteraes e sair da caixa de
linha de edio. Voc ver a nova unidade de anotao na trilha selecionada e com
uma parte do texto digitado.
44

Para modificar o texto de uma unidade de anotao existente, selecione a


unidade, clicando sobre ela, ou usando o [Alt.] e as setas do teclado. Uma janela de
edio ser aberta e voc poder modificar o texto de sua transcrio.
Para excluir o texto inserido em uma unidade de anotao, v para
"Anotao"> "Remover o Valor da Anotao" (ou usar [Alt.] + [Delete].
Para apagar toda a unidade de anotao, v para "Anotao"> "Excluir
Anotao "(ou use [Alt] + [D].).

Figura 17-Editando uma anotao


45

10.1. Modos de anotao

10.2. Segmentation Mode:

O Modo de segmentao projetado para criao rpida de apenas


segmentaes: ele no fornece os meios para inserir texto em anotaes. As
anotaes no so criadas com base em uma seleo de tempo (como no Modo de
anotao), mas so criadas por marcao de incio e de trmino de intervalos dentro
de uma trilha. Esses intervalos so selecionados pelo pressionamento da tecla
ENTER. Isso pode ser feito tanto quando o reprodutor de mdia est tocando e
quando est em pausa.
Para comear a anotar utilizando os intervalos criados atravs deste Modo, a
trilha que contem a segmentao deve ser selecionada, ficando dessa forma ativa.
Para saltar de uma trilha editvel a outra, deve-se usar as setas de navegao do
teclado, todo o procedimento pode ser feito sem a necessidade de parar

Figura 18-Janela opes de segmentao


46

Seguindo a Figura 18, so encontradas as seguintes opes:

Dois toques na tela por anotao: nesta opo, basta pressionar a tecla
ENTER para marcar o incio de uma anotao e ENTER novamente para
marcar o fim.

Um toque na tela por anotao: o tempo final de uma anotao ser o tempo de
incio da prxima. Dessa forma, ser criada uma cadeia de anotaes adjacentes.

Um toque na tela por anotao, durao fixa: , cada anotao seria definida pelo
usurio, durao fixa. Ao pressionar a tecla escolhida para segmentao, essa
marcaria tanto o incio quanto o fim de uma anotao.

One keystroke per annotation, press to mark start, release to mark end: O
que medir o tamanho do trecho selecionado ser o tempo em que a tecla
ENTER ficar pressionada pelo usurio.

Ateno: Para utilizar este Modo de anotao, necessrio j haver uma anotao
na trilha me.

10.3. Modo de transcrio:

Aps segmentar todo o vdeo nas trilhas que sero anotadas, a melhor forma
de se iniciar a anotao atravs do Transcription Mode (Modo de transcrio), pois
nele as trilhas dependentes so organizadas em uma tabela. Para acess-lo, v em
OPES > Transcription Mode. O prximo passo selecionar o tamanho da fonte
(no obrigatrio) e o nmero de colunas que sero exibidas sendo que cada coluna
representa uma trilha. Aps anotar uma trilha, basta pressionar a tecla ENTER para
passar para a prxima anotao.
47

Figura 19-Janela Modo de transcrio

Nota: as anotaes j realizadas podem ser melhor visualizadas nas abas texto ou
grade, pois nesses Modos, basta selecionar a trilha desejada e visualizar as
anotaes feitas de forma organizada. Vide figura anterior.

10.4. Teclas de atalho

Sempre que puder, escolha utilizar mais o teclado do que o mouse, pois essa
opo pode trazer mais eficincia no trabalho com o ELAN. Para este efeito, voc
pode utilizar-se das teclas de atalho. Dentro do ELAN, no menu
VISUALIZAR>ATALHOS, possvel imprimir uma lista de teclas de atalho no ELAN.

10.5. Alterando o padro das teclas de atalho

O ELAN vem com uma infinidade de combinaes de teclas, algumas das


quais no so muito intuitivas.
48

No entanto, voc pode alterar qualquer uma das combinaes de teclas para
qualquer combinao que voc achar mais fcil para trabalhar.

V em Editar> Preferncias> Editar Atalhos. Uma nova janela ser aberta,


nela selecione "Categoria, a partir do menu de rolagem na parte inferior da janela
para ordenar os diferentes atalhos de acordo com sua funo. Selecione um atalho
para editar, clicando sobre ele, em seguida, clique em "Editar atalho.
Digite a combinao de teclas que deseja alterar para o atalho, depois clique
em "OK". Uma vez que voc fez todas as mudanas desejadas, clique em "Salvar"
na janela de atalhos.

10.6. Sugesto de combinaes mais utilizadas

Ctrl+T Adicionar nova trilha


Ctrl+Alt+T Apagar trilha
Ctrl+Shift+T Adicionar novo tipo lingustico
Ctrl+N Novo documento
Ctrl+O Abrir documento
Ctrl+S Salvar documento
Ctrl+Shift+S Salvar documento como
Ctrl+Alt+Shift+S Salvar modelo como
Shift+Abaixo Ativar prxima janela
Shift+Acima Ativar janela anterior
Ctrl+W Fechar a janela do documento
Ctrl+Q Sair do aplicativo
Ctrl+Z Desfazer
Ctrl+Y Refazer
Ctrl+F Encontrar
Ctrl+Shift+F Buscar em mltiplos arquivos eaf
Ctrl+Alt+Shift+F Busca estruturada em mltiplos arquivos eaf
Ctrl+Alt+L Editar os arquivos vinculados
Ctrl+Shift+C Editar vocabulrios controlados
49

Ctrl+H Contedos da Ajuda...


Alt+N Nova anotao aqui
Ctrl+Shift+N Nova anotao antes da anotao ativa
Alt+Shift+N Nova anotao aps a anotao ativa
Shift+Enter Marcar o tempo atual como tempo inicial ou final de uma nova anotao
Ctrl+C Copiar Anotao
Ctrl+Alt+C Copiar grupo de anotao
Ctrl+V Colar Anotao
Ctrl+Shift+V Colar Anotao aqui
Ctrl+Alt+V Colar Grupo de Anotao
Ctrl+Alt+Shift+V Colar grupo de anotao aqui
Ctrl+D Duplicar anotao
Ctrl+Shift+D Copiar para a prxima anotao
Ctrl+Enter Modificar tempo da anotao
Alt+Shift+M Modificar a categoria de dados de anotao
Alt+Delete Remover o valor da anotao
Alt+D Apagar Anotao
Ctrl+Shift+Enter Trocar anotao ativa
Ctrl+Shift+E Abre a caixa de edio para a trilha ativa

10.7. Exportando suas transcries

possvel no ELAN exportar as suas anotaes de diversas formas, no s


apenas para visualizao dos resultados mas como tambm para outros softwares
de transcrio e de anlise de dados lingusticos, como o Toolbox e o Praat. Neste
guia, ser detalhado apenas algumas das vrias opes de exportao.
50

10.8. IMAGEM DE TIRAS DE FILMES

Nesta opo de exportao, possvel ser exportado um frame do vdeo,


para isso basta clicar com o boto direito do mouse na janela de visualizao do
vdeo.

Figura 20-Exportando imagem de tiras de filmes

Tambm possvel exportar uma sequencia de frames. Para isso basta


acessar ARQUIVO>EXPORTAR COMO> IMAGEM DE TIRAS DE FILMES. Vide
Figura 21

Figura 21-Janela com opes de exportao no Modo de tiras


51

10.9. TEXTO DELIMITADO POR TABULADOR

As anotaes feitas no ELAN podem ser organizadas em formato de tabela e


ainda abertas no EXCEL para melhor tratamento e anlise dos dados. Entretanto,
para que seja possvel que elas sejam abertas em um programa de planilhas
eletrnicas e de forma organizada preciso que seus dados sejam exportados em
[.txt] atravs da opo ARQUIVO > EXPORTAR COMO > TEXTO DELIMITADO
POR TABULADOR e alm disso a opo SEPARAR UMA COLUNA PARA CADA
TRILHA deve ser marcada, caso contrrio os dados sero organizados em colunas
desalinhadas. Voc poder escolher quais trilhas o seu arquivo ir conter. Confira
na Figura 22 a janela que ser aberta:

Figura 22-Janela de exportao texto delimitado por tabulador


52

Aps exportados os dados em [.txt], para visualiz-los no EXCEL, basta abrir


o arquivo no programa. Um outro caminho , no Excel, ir em DADOS > DE TEXTO.

O arquivo exportado [.txt] ficar da seguinte forma:

Figura 23-Arquivo exportado como texto delimitado por tabulador e sua aparncia no
bloco de notas
53

Ao abrir o arquivo [.txt] no EXCEL, a seguinte janela aparecer:

Figura 24-Assistente de importao de texto no excel


54

Para o tipo de campo a ser selecionado, basta deixar a primeira opo


selecionada. J no campo ORIGEM DO ARQUIVO, a imagem acima mostra, por
padro, o tipo WINDOWS (ANSI), entretanto, o tipo utilizado pelo ELAN UTF-8,
portanto o texto pode ficar desconfigurado para os caracteres C cedilha ou acentos.
Para corrigir estre problema, na lista do Excel selecione a opo 65001: UNICODE
[UTF-8].
Na prxima janela, VIDE FIGURA ABAIXO, ser exibida configuraes
relacionadas ao tipo de tabulao, ou seja, como os dados sero separados entre
suas colunas.

Figura 25-Assistente de importao de texto do excel Etapa 2

Basta deixar a opo TABULAO marcada. Voc pode testar cada opo e checa-
las no campo VISUALIZAO DOS DADOS, logo abaixo, pois esta opo fornece
uma prvia do arquivo que est sendo exportado.
55

O resultado pode ser conferido a seguir:

Figura 26-Resultado final de exportao como texto delimitado por tabulador no


excel
56

10.10. Lista de palavras

Uma outra forma de exportao muito til a EXPORTAR LISTA DE


PALAVRAS. Esta opo ir gerar uma lista de palavras das trilhas selecionadas pelo
usurio, entretanto s ter maior utilidade se a opo CONTAR OCORRENCIAS
estiver marcada, pois dessa forma o programa alm de gerar essas listas, ainda
contar o nmero de palavras. importante predefinir um caractere delimitador para
que as palavras compostas como Sujeito responsvel seja contada como uma
palavra s e no como duas. A vantagem desta opo a possibilidade de criao
de grficos para demonstrao de resultados.

Figura 27-Janela de exportao como listas de palavras


57

10.11. Texto de legenda

Tambm possvel exportar suas anotaes no formato de legenda [.srt] e


depois utiliz-lo como legenda em seu vdeo. Para isso, basta ir em
ARQUIVO>EXPORTAR COMO> TEXTO DA LEGENDA. Na janela que ir abrir,
selecionar apenas a trilha em que conter a legenda, geralmente a trilha
TRADUO. Veja a Figura 28:
Figura 28-Janela de exportao de texto como legenda
58

Aps obter um arquivo com extenso [.srt] basta renome-lo com o mesmo
nome do vdeo e colocar ambos em uma mesma pasta e o resultado pode ser
conferido abaixo na Figura 29:

Figura 29-Legenda sendo reproduzida em vdeo com arquivo de texto exportado


pelo ELAN
59

APNDICE B LISTA DE ORAES TRANSCRITAS

1 O Vincius foi ao zoolgico com o pai dele.


2 O Vincius um menino muito pequeno
3 E logo que eles chegaram no zoolgico
4 Comeou a chover
5 A, o pai disse assim
6 Vincius, vamos andar rpido
7 Se no com essa chuva no vai dar tempo
8 De a gente ver nada
9 Vamos correr
10 E eles saram correndo
11 E nessa correria, do elefante o Vincius s viu as patas.
12 Continuaram a correr
13 Vamos, pai, vamos correr,
14 Vamos, meu filho, vamos ver outras coisas
15 Olha l o jacar
16 Olha l o jacar
17 Aonde, pai, eu no estou conseguindo ver
18 Pai, mas onde que est
19 Eu no estou vendo
20 Eu no estou vendo
21 E na correria, do jacar ele s viu o corpo
22 Continuaram a correr
23 E l pra diante o Vincius perguntou pro pai dele
24 Pai, que bicho aquele?
25 Qual, meu filho?
26 Aquele-- aquele ali que s tem pescoo
27 Ah, aquele l, aquele l a girafa
28 E da girafa ele s viu o pescoo
29 E nessa correria toda ele ti-- do leo, ele s viu a juba
30 S conseguiu ver a juba
31 E do rinoceronte, ele s conseguiu ver o chifre
32 A, mais pra diante o pai dele falou assim
33 Olha, Vincius, olha l o camelo
34 Olha o camelo
35 Como bonito
36 Mas como a cerca era um pouco alta
37 O Vincius do camelo s conseguiu ver a corcova
38 E j no finzinho do passeio, quando j estava quase terminando
39 O Vincius viu uma coisa linda
60

40 Pai, qu que aquilo?


41 Que coisa linda (coisa)
42 Ah, o rabo do pavo
43 bonito mesmo, no ?
44 Nossa muito bonito pai, que lindo que lindo
45 E assim, j terminada a correria
46 Eles chegaram em casa.
47 Quando eles chegaram
48 A me do Vinicius veio e perguntou
49 E ento, Vincius, gostou do passeio no zoolgico?
50 Ah, eu gostei muito
51 E como que so os bichos do zoolgico?
52 E foi isso aqui
53 Que ele contou para a me dele.
54 Bonito, n?

Vous aimerez peut-être aussi