Académique Documents
Professionnel Documents
Culture Documents
Nilolaus P. Himmelmann
Definición de la documentación lingüística: un campo por derecho propio dentro la
investigación y la práctica lingüísticas, dedicado(…)a compilar y preservar datos lingüísticos
primarios y a crear interfaces entre estos datos primarios y varios tipos de análisis basados
en ellos…
la amenaza de extinción de las lenguas es la principal motivación, fortalece las bases
empíricas de aquellas ramas de la lingüística y de otras disciplinas afines que utilizan datos
de comunidades de habla poco conocidas…mejoran significativamente la verificabilidad y
economizan los recursos de investigación.
Datos primarios: grabaciones en audio o video hasta notas tomadas durante una sesión de
elicitación o genealogías escritas por hablantes nativos alfabetizados.
Se estructuran en un corpus estructurado y se hacen accesibles mediante un aparato:
varios tipos de anotaciones y comentarios agrupados.
Documentación lingüística: registro duradero y multifuncional de una lengua
Registro de una lengua→lengua: fenómenos diferentes pero interrelacionados: lengua vs
dialecto; lengua como campo de investigación científica; lengua como facultad cognitiva del
ser humano; etc.→buscar un acercamiento práctico…
La documentación lingüística debe incluir variados registros…con el fin de cubrir…los
aspectos del conjunto de fenómenos interrelacionados: lengua…podría tener una gran
variedad de usos: la toma de decisiones para la planificación lingüística, la preparación de
material educativo o el análisis de un grupo de problemas en teoría sintáctica, etc.
Usuarios de un acervo documental multifuncional: la propia comunidad de habla, las
agencias nacionales e internacionales…investigadores de varias disciplinas, etc.
Duradero: largo plazo…un registro para generaciones y grupos de usuarios
futuros…buscarán problemas no planteados.
Registro duradero y multifuncional de una lengua: es posible y útil compilar una base de
datos para un tema definido muy ampliamente (una lengua), sin tener claro un problema
teórico o práctico específico que se resolvería con ayuda de esta base de datos.
Documentación lingüística: “el objetivo es crear un registro de una lengua en forma
de un corpus exhaustivo de datos primarios que no excluya nada que pudieran
necesitar las generaciones futuras al explorar cualquier aspecto de la lengua en
cuestión”.
Límites y metas de la D.L.: el marco teórico…debe permitir la participación activa de
hablantes nativos…los aspectos específicos de la documentación suelen establecerse
interactivamente entre las comunidades de habla y los equipos de investigación…definir
previamente un conjunto de metas y objetivos básicos.
Sus preocupaciones teóricas se concentran en los métodos utilizados para registrar,
procesar y preservar los datos lingüísticos primarios…garantizar que las colecciones de
datos primarios(…)sirvan para abordar un espectro amplio de objetivos teóricos y
aplicados…debe ofrecer pautas para determinar los objetivos en proyectos de
documentación específicos…desarrollar medios sustentados e intersubjetivos para evaluar
la calidad de una documentación sin importar las circunstancias específicas de su
compilación.
Interfaz dentro del ámbito interdisciplinario: tipo y formato de datos primarios de un
procedimiento analítico particular deben determinarse en base a la investigación y la
evaluación detalladas de los procedimientos de cada disciplina.
¿para qué sirve la D.L.?
1. El peligro de extinción…mediante la creación de bases documentales duraderas y
multifuncionales. Los acervos generados son almacenes de datos para la
investigación científica y recursos para respaldar la conservación de las
lenguas…en conjuntos completos de datos en acervos abiertos…en proyectos
diferentes…para la verificabilidad de los análisis.
2. La necesidad de aprovechar al máximo los recursos asignados a la investigación
3. La verificabilidad de los datos y explicaciones
Formato básico para la D.L.
Datos primarios:
debe contener un conjunto de datos primarios que representen la o las lenguas utilizadas
en un momento determinado en una comunidad específica.
Comportamiento lingüístico observable: los ejemplos de cómo la gente se comunica entre
sí en la realidad…se debería registrar el mayor número de eventos comunicativos que
ocurran habitualmente en la comunidad de habla y dentro de un rango tan amplio como sea
posible…en función de los objetivos del proyecto específico…en sociolingüística el marco
conocido como etnografía de la comunicación.
Conocimiento metalingüístico: capacidad de los hablantes nativos para ofrecer
interpretaciones y sistematizaciones de unidades y eventos lingüísticos…palabras tabú,
evento de habla x precede al evento de habla y, alterar la secuencia del orden de elementos
es inadecuado o imposible, taxonomías de base lingüística: sistemas de parentesco,
taxonomías populares para plantas, animales, instrumentos musicales; los estilos
musicales, las expresiones para números y medidas o paradigmas morfológicos.
La documentación del conocimiento metalingüístico…no es directamente
accesible…ejemplo: en el pueblo X dicen “da” pero nosotros decimos “de”.
La documentación del conocimiento metalingüístico…incluye gran parte de la información
básica necesaria para escribir gramáticas descriptivas y diccionarios. Comprende todo tipo
de datos elicitados sobre la gramaticalidad o aceptabilidad de estructuras fonológicas o
morfosintácticas y el significado, uso y nivel de relación de los elementos léxicos…las reglas
gramaticales y las entradas de un diccionario son formatos analíticos para el conocimiento
metalingüístico.
En el caso del comportamiento lingüístico observable, el evento comunicativo implica la
interacción de hablantes nativos entre sí, mientras que para el conocimiento
metalingüístico, implica la interacción entre hablantes e investigadores…el comportamiento
lingüístico observable se suele grabar, mientras que en la elicitación del conocimiento
metalingüístico es más común tomar notas.
Corpus de datos primarios=corpus de registros de comportamiento lingüístico observable y
conocimiento metalingüístico.
Programa DoBeS (Dokumentation Bedroheter Sprachen) “Documentación de Lenguas
Amenazadas” es común de valerse de: los registros de eventos comunicativos individuales
y bases de datos léxicos, para estructurar los datos primarios.
Los registros individuales de eventos comunicativos se llaman sesiones (documento, texto
o grupo de recursos son términos alternativos); en IMDI una sesión se define como “una
unidad significativa de análisis, en general…un dato que tiene el mismo contenido global,
el mismo grupo de participantes, y la misma ubicación y tiempo…las sesiones se asignan
a distintos grupos definidos según parámetros como el medio (escrito o hablado), el género
(monólogo, diálogo, histórico, conversacional, etc.) el nivel de naturalidad (espontáneo,
escenificado, elicitado, etc.) y otros.
Aparato:
Para ser accesibles a un amplio rango de usuarios… los datos primarios deben ir
acompañados de información de varios tipos, que en conjunto-siguiendo la tradición
filológica-podría denominarse aparato.
Los metadatos se requieren en dos niveles: 1º la documentación en su conjunto requiere
de metadatos sobre el proyecto durante el cual se compilaron los datos, incluida la
información sobre el equipo que trabajó en el proyecto y el objeto de la documentación
(¿Cuál es la variedad de la lengua?, ¿Dónde se habla?, número y tipo de registros, etc.);
2º, cada sesión (segmento de datos primarios) debe ir acompañada por:
* nombre único para la sesión
* lugar y fecha de grabación
* quién fue grabado y quién más estaba
* quién hizo la grabación y qué equipo de grabación utilizó
* calidad de los datos según parámetros
* quién tiene acceso a los datos contenidos en la sesión
* breve caracterización del contenido de la sesión, tema, tipo de evento comunicativo
* ligas entre los diferentes archivos de la sesión
Los metadatos: facilitan el acceso a una documentación o a un registro específico…al
ofrecer información clave de acceso en un formato estandarizado…funcionan como el
catálogo de una biblioteca, por lo que podemos hablar de una función catalogadora…y
tienen una función organizativa: definen la estructura del corpus que, ofrece las bases para
distintos procedimientos, como búsqueda, copiado o filtrado…existen dos estándares de
metadatos: OLAC (Open Archives Community), “Comunidad de acervos lingüísticos
abiertos”). El estándar IMDI.
En el nivel de las sesiones individuales, la información adicional se llama anotación…un
esquema de anotación mínimos consiste en una transcripción y una traducción libre que
deben acompañar todos los segmentos de datos primarios; los esquemas de anotación más
elaborados incluyen varios niveles de glosa interlineal, exhaustivas posible entre las
distintas sesiones y recursos compilados en una documentación dada.
Recursos de acceso general (la documentación en su conjunto)-comprenden:
* una introducción general con información sobre los antecedentes de la comunidad
del habla y la lengua, el entorno de trabajo de campo, los métodos utilizados para
registrar los datos primarios, un resumen de contenidos, la estructura y el alcance
del corpus de datos primarios y su calidad.
* Esbozos breves de las principales características etnográficas y gramaticales
* Explicación de las distintas convenciones que se utilizan
* Índices para las lenguas/variedades, conceptos analíticos, etc.
* Ligas y referencias a otras fuentes
Formato básico de la documentación lingüística
La diferencia entre ambos formatos radica en los análisis descriptivos exhaustivos a varios
niveles del segundo formato, que sustituyen los esbozos correspondientes (esbozo
gramatical, esbozo etnográfico) en el rubro “recurso de acceso general” del formato básico.
El problema teórico del formato radica en que no está del todo claro cómo debe ser
exactamente la gramática descriptiva (o la etnografía o el diccionario)…existen diferentes
tipos de gramáticas y gramáticas descriptivas…no existe una única gramática descriptiva
que capture correcta y ampliamente el sistema de una lengua…o bien se especifica un tipo
particular de gramática descriptiva como el mas adecuado para los propósitos de
documentación lingüística; o se permite la inclusión de una multitud de gramáticas
descriptivas en la documentación y análisis distintos del sistema de la lengua como parte
de la documentación general…la viabilidad práctica plantea el problema de financiamiento
de la investigación…los recursos destinados a la documentación no deberían
desperdiciarse escribiendo una gramática, sino que deben invertirse en ampliar el corpus
de datos primarios, aumentar la cantidad y/o calidad de las anotaciones o bien, movilizar
los datos.
La diferencia entre los formatos básico y ampliado es una diferencia de formato o “estilo”
para incluir elementos analíticos en una documentación. En el formato básico, los análisis
se incluyen en forma de anotaciones distribuidas a lo largo del corpus y de referencias
cruzadas entre sesiones. En el formato ampliado, los análisis se presentan como tales en
su totalidad, es decir, como exposiciones descriptivas sobre el sistema de la lengua, por lo
general acompañadas de ejemplos relevantes o ligas a estos ejemplos.
La estructura del libro
2 al 4 capítulo abordan cuestiones éticas y prácticas generales…desde las primeras etapas
de la planificación hasta el término de un proyecto de documentación…las preocupaciones
centrales son cómo interactuar con las comunidades de habla y los propios hablantes y
como registrar, almacenar y procesar los datos relevantes.
Los siguientes 8 capítulos se concentran en la grabación y el procesamiento de los datos
lingüísticos primarios desde una perspectiva antropológica y lingüística…los primeros tres
se concentran sobre todo en la cuestión de como y qué documentar, teniendo en mente el
objetivo de crear un registro duradero y multifuncional de una lengua…el capítulo 5 ofrece
una introducción a la comprensión cultural y etnográfica de la lengua…el capítulo 6 aborda
la cuestión de cómo acceder al conocimiento metalingüístico y representarlo, concentrando
sobre todo en el conocimiento léxico…el capítulo 8 aborda el tema de las anotaciones y
comentarios etnográficamente relevantes…del 9 al 12 tratan del procesamiento necesario
para hacer los datos primarios útiles y accesibles para una amplia gama de usuarios…el
capítulo 10 aborda la transcripción: la necesidad de segmentar el flujo constante del habla
en unidades menores, en particular en palabras y unidades de entonación…el capitulo 11,
el diseño de una ortografía práctica que pueda usarse para la representación escrita de las
grabaciones…el capitulo 15 se concentra en las comunidades de habla como usuarios
potenciales y argumenta que existe una necesidad de conceptos elaborados y creativos
para movilizar los datos primarios.
La formación en documentación lingüística incluye conocimientos básicos de una amplia
gama de subdisciplinas lingüísticas y otras disciplinas afines. La formación en lingüística
descriptiva y antropología es indispensable.