Informe MFNT Cursada 2007

Nueva materia del plan de estudios de Letras
Orientación en Lingüística
Modelos Formales
No Transformacionales MFNT
Por Daniel Romero y Fernando Balbachan
En realidad este artículo no trata de una nueva materia en sí -sepan ustedes disculpar nuestro artero
recurso retórico de la captatio benevolentiae- sino, más bien, de un nuevo rumbo para una materia ya
contemplada en el plan de estudios de la carrera de Letras.
La orientación en Lingüística Formal de la carrera de Letras abarca cuatro materias: Teoría Léxica,
Lingüística Chomskyana, Lógica y Modelos Formales No Transformacionales (MFNT). Históricamente,
esta última materia –MFNT– ha venido apareciendo muy intermitentemente en la oferta de cursos. Es
gracias a los esfuerzos del Departamento de Letras y de la nueva composición de la cátedra que a partir
del segundo cuatrimestre de 2007 la materia vuelve a surgir con un nuevo rumbo, el cual apunta a una
estrecha relación con una transdiciplina absolutamente novedosa en Argentina: la lingüística
computacional.
Ahora bien, muchos de ustedes se preguntarán qué es la lingüística computacional. Ensayemos una
respuesta provisoria. La lingüística computacional es una disciplina que se ocupa de desarrollar ingenios
o mecanismos informáticos para el Procesamiento de Lenguaje Natural (Natural Language
Processing NLP en inglés). Como corolario de esta última afirmación, podemos inferir que se trata de
una transdisciplina entre la lingüística y la informática. Desgraciadamente -y no tomen a mal la
modalidad de este adverbio-, esta transdisciplina está dominada por informáticos en todo el mundo y por
ahora existen pocos lingüistas en Argentina interesados en ella.
¿Alguna vez se preguntaron qué procesos formales hay detrás del lenguaje? ¿Conocen la interesante
colaboración mutua que prestan lingüistas e informáticos?
Cuando ustedes ingresan una búsqueda en Google y reciben 1.250.654 páginas en las que figuran las
palabras ‘hot’ y ‘Paris Hilton’, cuando el programa Word les subraya en rojo todas las palabras de su
documento sugiriéndoles que el idioma en el que están escribiendo es bengalí, -aunque hubiesen
intentado escribir en el más cervantino castellano-, cuando el Babel Fish les traduce automáticamente su
versión de Shakespeare al navajo, haciendo que Macbeth parezca el guión de un chicle Bazooka, todo
eso son logros de la lingüística computacional.
No hacemos lingüística anti-chomskyana sino post-chomskyana

En la tradición de la lingüística formal, se le reconoce a la obra de Chomsky Estructuras Sintácticas
(1957) un rol fundacional. Una de las principales tesis del modelo del ’57 se refiere a la complejidad de
los lenguajes naturales, cuyas propiedades formales determinan una jerarquía de gramáticas en virtud de
su poder expresivo.
La irrupción de la Gramática Generativo-Transformacional del ’57 marcó un cambio de paradigma en la

investigación lingüística. Sin embargo, a partir de la aproximación formal a las propiedades de los
lenguajes naturales, han surgido diversas propuestas superadoras de la postura chomskyana inicial –el
mismo Chomsky habría de dejar de lado el componente transformacional en sus modelos posteriores del
’81 (Principios y Parámetros) y ’90 (Programa Minimalista). Con la consolidación de la teoría estándar
(década del ’60) la hegemonía chomskyana parecía indiscutible, pero en la década del ’70 surgen
escisiones dentro del paradigma generativista que se focalizan más en las propiedades matemáticas y
formales del lenguaje antes que en el problema chomskyano de la adquisición.
El objetivo fundamental de este curso es centrarse en el relevamiento minucioso de las teorías

gramaticales NO transformacionales que evolucionaron a partir de las primeras teorías chomskyanas y
que representan una importante línea de investigación en Procesamiento de Lenguaje Natural, poniendo
especial énfasis en las propiedades formales, poder expresivo y limitaciones de cada modelo en el estado
del arte. Asimismo, se trabaja experimentando con las implementaciones de dichas gramáticas bajo la
forma de parsers (analizadores) sintácticos, demostrando aplicaciones prácticas en español de los
modelos teóricos y desarrollos adoptados por la industria.
Mucha gente avezada en el campo de la lingüística puede sentir algún prurito al oír “NO
transformacionales”. Y es que podrían considerar, con cierta suspicacia, que una materia como la nuestra
presenta un punto de vista anti-chomskyano, lo cual acarrearía las diatribas y maldiciones de los acólitos
del generativsmo, los cuales acecharían agazapados y diseminados por doquier. Craso error. De hecho, la
orientación que la cátedra le ha impartido a la materia haría revolcar de alegría en su tumba al
mismísimo Noam –¡Ah, cierto! perdón por la licencia poética: Noam Chomsky está vivito y coleando.
Para aclarar sucintamente los tantos, digamos que en lingüística computacional existen tres grandes
paradigmas de investigación: modelos conexionistas, modelos estadísticos y modelos simbólicos. El
paradigma conexionista adscribe a un procesamiento paralelo e indiferenciado de datos a través de redes
neuronales. Esto hace que se ubique epistemológicamente muy cerca de las ciencias cognitivas, aunque
sus logros en el campo son limitados. Los modelos estadísticos parten del concepto de tabula rasa y de
grandes corpora para analizar patrones de ocurrencia de eventos estadísticamente significativos y lograr
así que la computadora “aprenda” (aprendizaje de máquina). Esto hace que su agenda resulte muy
atractiva para la inteligencia artificial. Finalmente, el paradigma simbólico parte de una estructura
apriorística de una gramática (dato) para procesar lenguaje mediante manipulación de símbolos. Es por
eso que este paradigma representa una evolución de la concepción de Chomsky de las Gramáticas
Independientes de Contexto (Context Free Grammar CFG en inglés).
Entonces, puesto que en el programa de MFNT trabajamos principalmente con los modelos simbólicos,
aunque también con los estadísticos, afirmamos rotundamente que nosotros no hacemos lingüística anti-
chomskyana sino post-chomskyana.
Dale, hablale a la máquina

Pero claro, no todo en la materia tiene que ver exclusivamente con sintaxis. En realidad, para la
lingüística computacional, procesar lenguaje natural tiene más que ver, según los últimos modelos
relacionales, con información modular disponible en forma temprana y un acceso intermodular
compartido con procesamiento paralelo. Incluso, en el paradigma estadístico se habla de boostrapping y
cues (pistas) como fenómeno de catalización de información típicamente pertinente a un nivel
lingüístico en virtud de evidencia proveniente de otro nivel; todo lo cual nos habla de una integración de
niveles no compartimentados. Por ejemplo, un modelo relacional en lingüística computacional para un
agente comunicativo involucraría una disposición integrada de información intermodular, tal como se
aprecia en la figura 2:
Así pues, este enfoque escapa al tradicional esquema de análisis por niveles, tan difundido por el
estructuralismo, y propicia el interés por fenómenos más allá de la preeminencia de la sintaxis. Tal como
se ve en la figura 3, la lingüística computacional extiende su campo de estudio más allá de las fronteras
epistemológicas de la lingüística teorética, adentrándose en terrenos considerados tradicionalmente
“extralingüísticos” como la representación de la información y el conocimiento de mundo.
El programa de MFNT contempla un interesante recorrido por la agenda actual de la lingüística
computacional, tomando contacto con las problemáticas de la traducción automática y de la extracción
de la información, campos de tecnología aplicada que exceden el mero procesamiento sintáctico y que
necesariamente postulan modelos de lenguaje relacionales e integrados –no niveles “estamentales” al
estilo estructuralista tradicional.
Una cursada también innovadora
Para estar a la altura de tanta innovación tecnológica, la cátedra se planteó la mejor forma de organizar
una cursada amena, atractiva y que a la vez aprovechara al máximo todos los recursos tecnológicos que
el campo de la lingüística computacional ofrece. Es así como dimos con una plataforma educativa web
que propicia la interacción con el alumnado: el campus virtual de la facultad. Implementado en el año
2005, el campus virtual ofrece un espacio accesible a través de Internet para alojar contenidos para las
clases, implementar foros de discusión con los alumnos y llevar a cabo un proceso pedagógico más
personalizado y eficiente. En particular, nuestra materia requiere mucha interacción con los alumnos, de
modo tal que juzgamos necesario e imprescindible el uso del campus virtual para MFNT.
web site de la materia en el Campus Virtual de filo http://campus.filo.uba.ar/course/view.php?id=138
Entrar como Invitado
El campus virtual de MFNT ofrece:

1) Dictado íntegro de la materia en el laboratorio de computación de la Facultad de Filosofía y
Letras
2) Contenidos específicos y pormenorizados para el seguimiento de cada clase, disponibles con
anterioridad (presentaciones powerpoint)
3) Planificación con temario y bibliografía detallada para cada clase
4) Bibliografía en versión electrónica
5) Realización de trabajos prácticos grupales on-line
6) Seguimiento de la evolución de la calificación final por parte de cada alumno, actualizada al
instante luego de cada instancia de evaluación y resguardando la privacidad de la información
7) Foros de discusión grupales para fomentar la participación activa de los alumnos
8) Canales de comunicación permanente entre docentes y alumnos para evacuar dudas y difundir
novedades de la cursada
9) Material complementario y links a recursos relacionados con el campo de la lingüística
computacional
10) Encuesta anónima on-line acerca de la materia (a ser completada por los alumnos
al final de la cursada)
Acerca de la representatividad de la encuesta, cabe mencionar el rotundo éxito que esta materia ha
significado en cuanto a matrícula, tomando en cuenta que se trata de una materia del último tramo de la
orientación en Lingüística Formal. La primera camada de “lingüistas computacionales junior” de la
cursada 2007 así lo atestigua:
Inscriptos en Alumnos Asistentes a 1º Finalizaron la Promocionados Encuestados

actas Oyentes clase cursada
49 5 34 28 24 24
Las preguntas que constituyeron la Encuesta Anónima de MFNT fueron cuidadosamente diseñadas a los
fines de abarcar cada aspecto del proceso didáctico-pedagógico. A continuación se presentan la encuesta
y el análisis cuantitativo de los resultados.
Encuesta anónima para MFNT – Análisis cuantitativo de la cursada 2007
1. En términos generales cómo describirías la cursada

Respuesta Porcentajes TOTAL
Me pareció interesante 37.5% 9
Me pareció muy interesante

25.0% 6
y aprendí mucho
No fue lo que yo esperaba

33.3% 8
de esta materia
Realmente un bodrio 4.2% 1
3. Acerca de los contenidos y la dinámica de clase

Aunque complejos, fueron

realmente bien explicados en 25.0% 6
clase
Estuvieron al nivel de lo que

4.2% 1
yo esperaba para la materia
Fueron muy complejos y no

25.0% 6
fueron bien explicados
Ninguna opción me
representa (voy a escribir un 45.8% 11
comentario)
5. Acerca de los profesores (podés seleccionar más de una opción)

Lograron una cursada muy

interesante y un clima ameno de 33.3% 8
trabajo
Me incentivaron a aprender más del

50.0% 12
campo
Ninguna opción me representa (voy

25.0% 6
a escribir un comentario)
No estuvieron a la altura de lo que

esperaba para una materia de la 16.7% 4
especialización
7. Acerca de las prácticas de laboratorio

Me aburrieron 4.2% 1
Me entusiasmó mucho poder

ver implementaciones
70.8% 17
prácticas de los contenidos
teóricos
Ninguna opción me
representa (voy a escribir un 25.0% 6
comentario)
Confiamos en que la valoración de la opinión de los alumnos y los buenos resultados obtenidos para la
primera cursada de la materia puedan afianzar la continuidad de la misma y su lugar dentro del plan de
estudios de la carrera de Letras.
Por último, nos gustaría destacar que el programa de la materia está pensado como una introducción al
campo de la lingüística computacional, por lo que no es necesario ningún conocimiento previo en
informática.
Si estos sesudos planteos acerca del lenguaje han captado su atención, les dejamos las direcciones de
correo electrónico de los responsables de la materia, para que en caso de que tengan alguna inquietud
nos escriban.
Acerca de los autores de la nota
Daniel Romero es Profesor (1979) y Licenciado en Letras (1985) por la Universidad de Buenos Aires
UBA. Se desempeña como Profesor Asociado de la Facultad de Filosofía y Letras de la Universidad de
Buenos Aires UBA, a cargo de las cátedras de Lingüística Chomskyana, Modelos Formales No
Transformacionales y Semántica y Pragmática y Profesor Titular de la Cátedra de Semiología del CBC
de la UBA. Actualmente también lleva a cabo actividad docente en la Facultad de Humanidades y
Ciencias de la Educación de la Universidad Nacional de La Plata UNLP, siendo Profesor Titular de las
materias Lengua I, Lengua II y Lingüística General.
E-mail: daniel.dromakd@gmail.com
Fernando Balbachan es Licenciado en Letras con orientación en Lingüística por la Universidad de

Buenos Aires UBA (1999) y Magíster en Lingüística Computacional por Indiana University (2006). Se
ha desempeñado como docente auxiliar en las cátedras de Lingüística General (FFyL-UBA) y
Semiología (CBC-UBA). Ha trabajado en empresas de desarrollo de software en el ámbito privado
desde 2000. Actualmente dicta clases en la cátedra de Modelos Formales No Transformacionales de la
orientación en Lingüística en la Carrera de Letras de la Facultad de Filosofía y Letras (UBA).
E-mail: fernando_balbachan@yahoo.com.ar

Informe MFNT Cursada 2007

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Informe MFNT Cursada 2007

Transféré par

Droits d'auteur :

Formats disponibles

Nueva materia del plan de estudios de Letras

No hacemos lingüística anti-chomskyana sino post-chomskyana

La irrupción de la Gramática Generativo-Transformacional del ’57 marcó un cambio de paradigma en la

El objetivo fundamental de este curso es centrarse en el relevamiento minucioso de las teorías

Dale, hablale a la máquina

Una cursada también innovadora

web site de la materia en el Campus Virtual de filo http://campus.filo.uba.ar/course/view.php?id=138

Entrar como Invitado

El campus virtual de MFNT ofrece:

Inscriptos en Alumnos Asistentes a 1º Finalizaron la Promocionados Encuestados

1. En términos generales cómo describirías la cursada

Me pareció interesante 37.5% 9

Me pareció muy interesante

No fue lo que yo esperaba

Realmente un bodrio 4.2% 1

3. Acerca de los contenidos y la dinámica de clase

Aunque complejos, fueron

Estuvieron al nivel de lo que

Fueron muy complejos y no

5. Acerca de los profesores (podés seleccionar más de una opción)

Lograron una cursada muy

Me incentivaron a aprender más del

Ninguna opción me representa (voy

No estuvieron a la altura de lo que

7. Acerca de las prácticas de laboratorio

Me entusiasmó mucho poder

Acerca de los autores de la nota

Fernando Balbachan es Licenciado en Letras con orientación en Lingüística por la Universidad de

Vous aimerez peut-être aussi