Vous êtes sur la page 1sur 90

INTELIGENCIA ARTIFICIAL LENGUAJE NATURAL

Profesora: Evelia Daniel

Objetivos

Comprender qu es el procesamiento del lenguaje natural (PLN) y su aplicacin a las necesidades de la sociedad actual.
Asimilar los fundamentos tericos del procesamiento automtico de las lenguas(la ambigedad). Conocer los mdulos que componen cualquier aplicacin del PLN: anlisis lxico, sintctico, semntico y pragmtico. Conocer y analizar las aplicaciones del PLN ms importantes en la actualidad.

Resumen Histrico
Se

suele considerar el Estructuralismo (Saussure,1916) como el primer intento serio de introducir la Lingstica como disciplina con un contenido cientfco. El Estructuralismo, por otra parte, trascenda de lo puramente lingstico para incorporar contenidos filosficos y antropolgicos.

Resumen Histrico

Primeros tiempos (1950-65)


Traduccin automtica => ALPAC Gramtica transformativa (Chomsky)

Recuperacin de informacin

Ampliacin de perspectivas (1960-70)


Sistemas de respuesta a preguntas (BASEBALL) Resolucin de problemas (STUDENT) Consulta (ELIZA)

Resumen Histrico

Desarrollo de formalismos (1965-70)


Augmented Transition Network, ATN (1960) Gramtica de casos (1975)

Dependencia conceptual (1972)


Semntica procedimental (1968) Red semntica (1968)

Hitos de los 70
SHRDLU (1972) LUNAR (1972)

Resumen Histrico

Expansin de dominios de aplicacin (1970-85)


Interfaces a BDs (LADDER/LIFER, 1977)

Aprendizaje asistido por computadora (SCHOLAR,

1970) Automatizacin de oficinas (SCHED, 1978) Programacin automtica (NLPQ, 1976) Procesamiento de textos cientficos

Resumen Histrico

Tendencias actuales (1985-)


Implementaciones independientes del dominio Resurgimiento de la traduccin automtica

METEO (1977)
Comercializacin del PLN

ROBOT/INTELLECT (1977) INQUERY (1990), Oracle ConText Cartridge (1997) BABYLON (1997) VIAVOICE (1998)

Resumen Histrico

Tendencias actuales (1985-)


Proliferacin de formalismos (1970-)

Sintaxis (gramticas basadas en restricciones) Semntica (gramtica de Montague)

Intensificacin del empiricismo

Aplicacin del aprendizaje automtico

Nuevos dominios de aplicacin

Internet/Web => traduccin automtica, recuperacin de informacin Bibliotecas digitales

Historia

Las primeras aplicaciones del PLN se dieron durante el perodo de 1940-1960, teniendo como inters fundamental la traduccin automtica. Los experimentos en este sector, basados en la substitucin de palabra por palabra, obtuvieron resultados rudimentarios.
El hito fundamental, sin embargo, en el nacimiento de la lingstica computacional fue la aportacin de Chomsky que en 1965 (Aspects) sent las bases de la Gramtica Transformacional Generativa. La Gramtica Generativa especifica, en forma precisa, qu combinacin de los elementos bsicos son permisibles (gramaticales) para cada uno de los niveles de descripcin lingstica.

Historia

En los aos sesenta los intereses se desplazan hacia la comprensin del lenguaje. La mayor parte del trabajo realizado en este perodo se centr en tcnicas de anlisis sintctico. Hacia los setenta la influencia de los trabajos en inteligencia artificial fue decisiva, centrando su inters en la representacin del significado. Como resultado se construy el primer sistema de preguntas-respuestas basado en lenguaje natural.
De esta poca es Eliza, que reproduca las habilidades conversacionales de un psiclogo. Para ello recoga patrones de informacin de las respuestas del cliente y elaboraba preguntas que simulaban una entrevista.

Historia

Las limitaciones de la Teora Estndar en su aplicacin prctica, especialmente el limitar la interpretacin semntica a la estructura profunda, condujeron a Chomsky a una reformulacin de su teora y a proponer en 1970 la llamada Teora Estndar Extendida

Historia

Tambin de principios de los 70 es la Semntica Generativa (Lako , Fillmore). El propio Fillmore cre las Gramticas de Casos, origen de las Redes Semnticas, que tanto xito han tenido en I.A. como mecanismo de Representacin del Conocimiento.

Historia

Entre los aos 70 y 80, ya superados los primeros experimentos, se hacen intentos de construir programas ms fiables. Aparecen numerosas gramticas orientadas a un tratamiento computacional, y experimenta notable crecimiento la tendencia hacia la programacin lgica.
En el campo de la Sintaxis hay que acudir nuevamente a Chomsky que en 1983 propuso su teora de la Reaccin y Ligadura

Historia

En Europa surgen intereses en la elaboracin de programas para la traduccin automtica. Se crea el proyecto de investigacin Eurotra, que tena como finalidad la traduccin multilinge. En Japn aparecen equipos dedicados a la creacin de productos de traduccin para su distribucin comercial.

Historia

Los ltimos aos se caracterizan por la incorporacin de tcnicas estadsticas y se desarrollan formalismos adecuados para el tratamiento de la informacin lxica. Se introducen nuevas tcnicas de representacin del conocimiento cercanas a la inteligencia artificial, y las tcnicas de procesamiento utilizadas por investigadores procedentes del rea de la lingstica e informtica son cada vez ms prximas. Surgen as mismo intereses en la aplicacin de estos avances en sistemas de recuperacin de informacin con el objetivo de mejorar los resultados en consultas a texto completo.

La inteligencia humana abarca muchas habilidades, incluyendo la habilidad para percibir y analizar escenas visuales y la habilidad pare entender o generar lenguaje
Lenguaje: Sistema de signos complejos y estructurados.

Qu es el Lenguaje

Un lenguaje es un conjunto de oraciones, que usualmente es infinito y se forma con combinaciones de palabras. Es necesario que esas combinaciones sean correctas (sintxis) y tengan sentido (semntica) Un lenguaje es la funcin que expresa pensamientos y comunicaciones entre la gente. Esta funcin es llevada a cabo por seales y vocales (voz) y posiblemente por signos escritos (escritura)

Concepto de procesamiento del lenguaje natural

El PLN se concibe como el reconocimiento y utilizacin de la informacin expresada en lenguaje humano a travs del uso de sistemas informticos. El Procesamiento del Lenguaje Natural (PLN) es una parte esencial de la Inteligencia Artificial que investiga y formula mecanismos computacionalmente efectivos que faciliten la interrelacin hombre-maquina y permitan una comunicacin mucho ms fluida y menos rgida que los lenguajes formales y sistemas de mens utilizados tradicionalmente.

Procesador Lingstico: traduce del Lenguaje Natural (LN) a una representacin formal equivalente.
Existen volmenes inmensos de informacin en LN Se realizan operaciones sobre la informacin tales como bsqueda, comparacin, traduccin,

Los computadores son ms capaces de procesar la informacin que las personas, pero, son capaces de entenderla?

En su estudio intervienen diferentes disciplinas tales como lingstica, ingeniera informtica, filosofa, matemticas y psicologa. Debido a las diferentes reas del conocimiento que participan, la aproximacin al lenguaje en esta perspectiva es tambin estudiada desde la llamada ciencia cognitiva.

La razn bsica para incluir el T.L.N. dentro de la I.A. es el que la comprensin del lenguaje natural se considera una forma clara de comportamiento inteligente.
A medida que las exigencias de calidad en el T.L.N. han aumentado, la necesidad de utilizar Fuentes de Conocimiento extensas y complejas y de emplear tratamientos no estrictamente algortmicos ha dado lugar a una utilizacin creciente de la I.A Tanto desde un enfoque computacional como lingstico se utilizan tcnicas de inteligencia artificial

Todo sistema de Procesamiento del Lenguaje Natural intenta simular un comportamiento lingstico humano; para ello debe tomar conciencia tanto de las estructuras propias del lenguaje, como de un conocimiento general acerca del universo de discurso.
De esta forma, una persona que participe en un dialogo sabe como pueden combinar las palabras para formar una oracin, conoce los significados de las mismas, sabe cmo stas afectan el significado global de la oracin y poseen un conocimiento del mundo en general que permite participar de la conversacin. As el problema principal del Lenguaje Natural se puede resumir en una palabra: Ambigedad.

Herramientas de la I.A. en el T.L.N.


1.

Sistemas de Representacin del Conocimiento tanto basados en Lgica (usados en los niveles sintctico y lgico), como en Redes Semnticas (Modelos de actantes, Gramticas de casos) o en Modelos de Objetos Estructurados, Frames (Modelos de Representacin conceptual y lxica, formas complejas de inferencia, herencia, etc ).

2. Sistemas de Planificacin (Planificacin de dilogos, generacin en lenguaje natural a partir de planes, generacin de explicaciones, etc ).

3. Sistemas de Bsqueda Heurstica (Estrategias de anlisis sintctico, cooperacin sintaxis/semntica, etc ).


4. Sistemas de Razonamiento (Bsqueda de referentes, resolucin de anforas, determinacin del mbito de los cuanticadores, etc ). Sistemas de representacin y razonamiento aproximado e incierto (cuanticadores difusos, informacin incierta, lgica de modalidades, analizadores probabilsticos, etc). 6. Lenguajes de Programacin Declarativos y estructuras de datos
5.

Para comprender el lenguaje natural es necesario analizarlo desde la comprensin y representacin de los siguientes componentes. El PLN tiene una serie de fases o niveles de anlisis:

Anlisis morfolgico-lexico Anlisis sintctico

Anlisis semntico
Anlisis contextual o funcin pragmtica:

Siendo los dos ltimos los ms difciles de representar, ya que no vasta con un simple automatismo, sino que, adems, se requiere de conocimientos. La mayor complejidad radica en la interpretacin de la oracin dentro de un contexto, ya que una misma oracin puede tener diferentes interpretaciones en dependencia del contexto y aqu juega un papel importante no slo el poder de anlisis sino tambin el escurridizo y travieso sentido comn, con quien tantas veces han tenido que vrselas los investigadores de la IA, sin mucho xito.

Anlisis morfolgico-lexico
Transforma

la secuencia de caracteres de entrada en una secuencia de unidades significativas haciendo uso del diccionario y reglas morfolgicas. La palabra bien escrita.

NIVEL LEXICO (Morfologa)

Estudia las palabras de forma independiente:


cmo reconocerlas y producirlas. no tiene en cuenta estructuras ni como aparecen en la

frase.

Palabras: elementos constructivos bsicos de todos los lenguajes tanto escritos como hablados. Objetivo: determinacin de los tipos de palabras, componentes de las palabras y cmo se produce la construccin de palabras.

Anlisis morfolgico-lexico

Diccionarios: lista de palabras de una lengua, junto con diversas informaciones: morfologa, definicin, etimologa, estadsticas,

Lexicn: forma tpica de la entrada de los diccionarios que contiene informacin fonolgica, morfolgica, sintctica y semntica Formalismo de representacin para codificar los datos

Ejemplos: los bilinges o multilinges recogen la correspondencia entre distintas lenguas

Anlisis morfolgico-lexico

Diccionarios electrnicos:
Elementales: Lxico desplegado (inmanejable) Lengua de expresin compleja: el lexicn

proporciona la raz y la informacin gramatical asociada, y un componente morfolgico genera las posibles formas (ayuda a inferir funciones sintcticas)

Anlisis sintctico
Anlisis

sintctico: Analiza la secuencia de unidades lxicas y produce una representacin de su estructura (rbol, red, ...). El orden correcto de la oracin.

Anlisis sintctico
NIVEL SINTCTICO (Sintaxis)

Estudia como se relacionan entre s las palabras y como se estructuran (estudia las relaciones entre palabras).

Uso de modelos computacionales (gramticas formales) y algoritmos de anlisis.

Anlisis sintctico

Las estructuras sintcticas se construyen con una gramtica, una especificacin mediante reglas de reescritura de las estructuras permitidas en el lenguaje. El tipo ms comn de gramticas son las de contexto libre (CFGs) CFG: es una cudrupla (N,T,R,S)

N = conjunto de smbolos No-Terminales T =conjunto de smbolos Terminales R= conjunto de Reglas de la forma S = axioma (No-Terminal)

Anlisis semntico
A

partir de la estructura generada por el proceso sintctico genera otra estructura o forma lgica asociada que representa el significado o sentido de la sentencia. El significado de la oracin.

Anlisis semntico

Las herramientas bsicas para el desarrollo de teoras semnticas proceden de la lgica y de las reglas de inferencia que se construyan, igualmente de la representacin del conocimiento (informacin). La semntica estudia el significado del texto y desarrolla los mtodos para formar este significado a travs de una serie de representaciones sintcticas de las oraciones.

Anlisis semntico
NIVEL SEMNTICO (Semntica)

Estudia las relaciones funcionales entre las estructuras sintcticas (qu funcin realizan: sujeto, objeto directo, ...) y trata de dotarlas de significado. Dos visiones:
significado de las palabras componentes (semntica lxica). significado de la combinacin de esos componentes (semntica

composicional).

En resumen: Estructura de la Sentencia + Significado de las Palabras Significado de la Sentencia. Uso de tcnicas de representacin del conocimiento.

Anlisis contextual o funcin pragmtica


Utiliza

la forma lgica o estructura semntica de la fase anterior para desarrollar la interpretacin final de la oracin, en funcin de las circunstancias de contexto. La dependencia del contexto.

Anlisis contextual o funcin pragmtica


NIVEL PRAGMTICO Y DE DISCURSO

Estudia como interpretar las estructuras semnticas en relacin al contexto. Necesidad de conocimiento de sentencias anteriores y de resolucin de referencias. Necesidad de conocimiento de mundos (dominios de discurso, entornos).

Anlisis contextual o funcin pragmtica

La pragmtica estudia cmo las intenciones del autor del texto estn expresadas en el texto, es decir, en un contexto dado

Anlisis lxico o Morfolgico

Anlisis Sintctico

Anlisis Semntico

Anlisis pragmtico o contextual

Problemas Generales
Ambigedad: Lxica, sintctica, Conocimiento lingstico: conocimiento lxico y conocimiento general Conocimiento extralingstico: informacin obvia omitida

Diccionarios de relaciones entre objetos y de

escenarios de las relaciones tpicas Mtodos de aprendizaje semiautomtico

Problemas Generales

Variabilidad de los lenguajes


Hay conceptos tericos vlidos en unos idiomas y en otros

no. Se deben diferenciar dentro de un mismo idioma a) dialectos y b) formas escritas vs formas orales.

coste computacional
algoritmos y tcnicas complejas computacionalmente. dificulta aplicaciones prcticas.

Problemas Generales

Escasez de recursos lxicos


necesidad de conocimiento lingstico (colecciones de textos,

gramticas, muestras de voz...). ausencia de estndares. en especial para espaol/gallego.

Alta dependencia del dominio


desarrollos especficos para una aplicacin (ej no es lo mismo

extraer informacin de un peridico que de un boletin oficial). difcil extrapolar resultados.

Carcter interdisciplinar (distinta visin e intereses).

Fuentes de ambigedad

Ambiguo: que admite distintas interpretaciones. Homonimia: dos palabras con misma forma que tienen distintos significados.
Homografa: capital, banco,
Homofona: Ola/Hola, As/Has, Cocer/Coser.

Polisemia: una palabra con mltiples significados.


El hombre desciende del mono y el mono desciende del

rbol.

Ambigedad: polisemia y homonimia.

Una expresin lingstica es ambigua cuando puede significar cosas distintas. La ambigedad es una caracterstica tpica de los lenguajes naturales.
La ambigedad en el lenguaje escrito ocurre cuando varias palabras, o expresiones, que mantienen significados diferentes se expresan con los mismos signos grficos. Por ejemplo la palabra "banco", que puede referirse a un mueble para sentarse o a un establecimiento financiero. En el lenguaje oral sera cuando se da el mismo sonido para distintos significados.

Ambigedad: polisemia y homonimia

La ambigedad puede denominarse homonimia o polisemia.


Se dice que hay homonimia cuando las palabras con idntica grafa pero diferente significado no tienen ninguna relacin de significado entre s. Ejemplo de homonimia es el que se da entre las palabras "nada", como forma verbal del verbo nadar, y "nada" como palabra que designa la ausencia de algo. En cambio la ambigedad se denomina polisemia cuando las palabras que mantienen la misma grafa, aunque distinto significado, s tiene una relacin significativa entre si. Ejemplo de polisemia sera el que se establece entre las palabras "pico" referido al pjaro, o "pico" referido a la cima de la montaa. Ambas significan distinto pero mantienen una relacin comn de significado: la prolongacin alargada en forma de cono.

Ambigedad: polisemia y homonimia.

Ya sea debido a la homonimia, o a la polisemia, podemos encontrarnos que ciertas expresiones del lenguaje natural son ambiguas.

Respecto al tipo de expresiones la ambigedad se divide en equivocidad y anfibologa. Cuando el segmento lingstico ambiguo es una sola palabra hablamos de equivocidad.
Por ejemplo el trmino "hombre" puede designar al ser humano en general o al subconjunto de los varones. O la palabra "gato" puede querer referirse al animal o una herramienta para levantar pesos. Si el segmento lingstico ambiguo es una oracin se denomina anfibologa: Por ejemplo, la oracin "El libro de Torrente Ballester es rojo" puede querer designar un libro escrito por Torrente Ballester, o un libro de su propiedad. Otro ejemplo podra ser "El perro de Paulov es muy listo", que puede estar refirindose a un perro cuyo propietario sea Paulov, o bien estar llamando a Paulov "perro".

Ambigedad: polisemia y homonimia.

La ambigedad que permite el lenguaje natural puede provocar que argumentos incorrectos pasen por correctos. Un ejemplo de esto es el argumento del encubierto. Ese argumento dice lo siguiente: "t no conoces a esa persona cubierta por un velo, pero esa persona es tu padre; luego t no conoces a tu padre." Ese argumento es un caso de anfibologa que se basa en que la oracin "t no conoces a esa persona cubierta por un velo" puede significar dos cosas: a. T no conoces a esa persona por estar cubierta por un velo b. T no conoces a esa persona independientemente de que lleve o no velo.

Cuando se nos dice "t no conoces a esa persona cubierta por un velo" entendemos que esa premisa es verdadera porque estamos entendiendo el significado a., pero cuando se concluye: "luego t no conoces a tu padre" se est concluyendo a partir del significado b.El lenguaje natural, al permitir las expresiones ambiguas ya sean polismicas u homnimas, oscurece la forma lgica de los argumentos pudiendo llevarnos a error.

Sinonimia.

Inicialmente podra afirmarse que la sinonimia no debiera ser un factor que distorsione de forma grave las argumentaciones, aunque es claro que introduce una redundancia que contribuye a la oscuridad del lenguaje. El principal problema de la sinonimia quiz se encuentre en las dificultades que presenta precisar con claridad su significado. Lo primero sera distinguir las expresiones sinnimas de aquellas expresiones que meramente se estn refiriendo a las mismas cosas. Para que dos expresiones sean sinnimas deben de estar refirindose a las mismas cosas o hechos, pero aunque eso es necesario que ocurra, an no es suficiente Por ejemplo, la expresin "el autor de las Novelas Ejemplares" y la expresin "el autor del Quijote" designan al mismo individuo Cervantes. Pero que ambas expresiones se refieran al mismo sujeto no las hace sinnimas; es decir, las expresiones significan cosas distintas, slo que, casualmente, designan al mismo sujeto. Durante siglos se consider que el primer lucero que se poda ver en el cielo por las maanas lucero matutino era un astro distinto del primer lucero de la tarde lucero vespertino, con el tiempo se comprob que ambas expresiones se referan al mismo objeto Venus aunque cada una signifique algo distinto.

Ambigedad en los niveles de anlisis


Ambigedad a nivel semntico

La perra de mi vecina me ladr. a) mi vecina realmente tiene una perra b) no tengo un buen trato con mi vecina

Ambigedad en los niveles de anlisis


Ambigedad a nivel pragmtico Llego a las ocho. Esperame.

Ambigedad a nivel de discurso

Tom el alfajor del escritorio y lo com. a) Tom el alfajor que estaba en el escritorio y com el alfajor. b) Tom el alfajor que estaba en el escritorio y com el escritorio.

Ambigedad lxica:

1. Se sent en el banco 2. Entr en el banco y fue a la ventanilla 3. El avin localiz el banco y comunic su posicin. Qu tipo de conocimiento hay que utilizar y cmo debemos utilizarlo para conjeturar que (probablemente) la aparicin de banco.en (1) se refiere a un mueble que eventualmente sirve para sentarse, mientras que la aparicin en (2) se refiere a una oficina en la que una entidad financiera realiza operaciones a travs de una ventanilla y la aparicin en (3) se refiere, una vez examinado el contexto, a un banco de pesca...?

Ambigedad sintctica:

La vendedora de peridicos del barrio


Queremos indicar aqu que la vendedora es del

barrio o bien son los peridicos los que son del barrio?

Pedro vi al hombre en lo alto de la montaa con unos prismticos


Era el hombre o Pedro (o ambos) quien estaba

en la montaa? Quin llevaba (o usaba) los prismticos?

Ambigedad semntica:

Pedro di un pastel a los nios


Uno para todos? Uno a cada uno?

A lo mejor depende del tamao (del pastel, no de Pedro ni de los nios)

Se puede resolver la ambigedad?

Juan mat al carpincho con la escopeta.


No puede ser el carpincho quien lleve la

escopeta.

Puse la camisa en la lavadora y la lav.


Las lavadoras lavan. La ropa se lava.

Se requiere conocimiento del mundo.

Modelos

Algoritmos

Bsquedas en espacios de estados:


buscar en un espacio de posibles secuencias fonolgicas

la correcta para una entrada dada buscar en un espacio de rboles de anlisis sintctico el correcto para una entrada dada

Programacin dinmica:
convertir un autmata finito en una expresin regular

equivalente

FORTALEZAS Y DEBILIDADES

Ahorro de dinero, al no tener que pagarle a un traductor bilinge. [Rusell] Un traductor humano puede acelerar su trabajo de traduccin de dos a cuatro veces. [Rusell] Escritos resultantes ms claros y legibles. [Rusell] Existen considerables costos de arranque en todo proyecto de traduccin automatizada. [Rusell] La traduccin es difcil, porque se requiere un profundo conocimiento del texto, y para ello es necesario un profundo conocimiento de la situacin que se esta comunicando. [Rusell] Muchas veces el usuario nunca podr saber qu frase de una consulta es correcta y cul no es de la incumbencia del sistema. Uno de los grandes problemas del PLN se produce cuando una expresin en LN posee ms de una interpretacin, es decir, cuando en el lenguaje de destino se le pueden asignar dos o ms expresiones distintas.

Aplicaciones

Comprensin del lenguaje Ayuda en preparacin de texto Bsqueda y minera de texto Interfaces en LN Traduccin automtica Procesamiento de voz Generacin de texto Conduccin del dilogo

Ms aplicaciones

Recuperacin de informacin. Verificadores de gramtica y estilo. Categorizacin de documentos. Respuesta a preguntas. ...

Traduccin Automtica
Inters hacia fines aos 40 y aos 50 En particular del Ruso al Ingls (Guerra Fra). Famosa leyenda urbana:

(Original) "The spirit is willing, but the flesh is weak."

(El espritu es fuerte pero la carne es dbil) (Doble traduccin) "The vodka is strong, but the meat is rotten." (El vodka est bueno pero la carne es muy mala)

Traduccin Automtica

Actualmente? (Original) El da que las vacas vuelen. (Doble Traduccin - Babelfish de Altavista) El da que las vacas vuelan. (Doble Traduccin - Google) El da que las vacas lo vuelan. Ofrecen gist translation (traduccin de lo esencial) Tasa de error entre 20% y 30% Aplicaciones comerciales: un traductor profesional cobra 20 U$S la hora para mejorar el sistema.

Resumen Automtico

Idea central: "condensacin del contenido de la informacin de un documento para el beneficio de un lector" (Mani 2001). Primeros trabajos de Luhn (1958) y Edmunson (1960):
Basados en mtodos estadsticos. Extraen las oraciones ms importantes. Frecuencia de trminos. Peso de oraciones.

Los trabajos en el rea resurgen a fines de los aos 90

Extraccin de Informacin

Objetivo: mapear una coleccin de documentos a una base de datos estructurados. Motivaciones:
Permitir bsquedas complejas: quiero trabajos en

restauracin en Manchester que paguen por lo menos 1200 al mes. Permitir consultas estadsticas: el nmero de trabajos en restauracin creci en los ltimos cinco aos? Sistemas de Vigilia.

Extraccin de Informacin

Aplicaciones
Procesamiento de texto escrito.

Ayudas a la produccin de texto.

correctores ortogrficos y gramaticales (por ej. de estilo) y OCR.

Traduccin automtica de textos. Extraccin de informacin desde informes, etc...

generacin de resmenes.

Clasificacin, recuperacin y filtrado de documentos y mensajes.


buscadores WEB. filtros de correo.

Generacin de informes textuales a partir de bases de datos estndar.


En los tres ltimos casos, muchas de estas aplicaciones pueden realizarse (y de hecho es normal) sin usar tcnicas de PLN.

Aplicaciones
2. Interaccin Hombre-Mquina.

Interfaces en lenguaje natural.


para BBDD. aplicaciones educativas.

Reconocimiento y sntesis de voz.


servicios de atencin a clientes. control de mquinas por la voz. interfaces para discapacitados.

Hemos de tener en cuenta, por otra parte, que buena parte de las aplicaciones del T.L.N. actan como interfaz de Sistemas Inteligentes en los cuales se integran.
Buena parte de los sistemas de representacin de conocimiento e informacin que se utilizan al tratar el lenguaje natural deben tener en cuenta esta doble funcin.

Dos son las grandes reas de aplicacin de los Sistemas de T.L.N: las aplicaciones basadas en dilogos y las basadas en el tratamiento masivo de informacin textual. La razn de ello es, obviamente, econmica: la interaccin persona/mquina se ha convertido en el punto fundamental de la mayora de las aplicaciones informticas. El desarrollo de formas cada vez ms sosticadas de dispositivos de interaccin (los llamados multimedia) y el acceso a la informtica de una gama cada vez mayor de usuarios abundan en este inters.
Los volmenes de informacin textual que se manejan estn creciendo en forma exponencial planteando problemas cada vez mayores de tratamiento. Las necesidades de traduccin, formateo, resumen, indiciacin, correccin, etc de cantidades ingentes de textos, con niveles de exigencia de calidad crecientes, ha hecho que se haya vuelto la vista hacia el lenguaje natural como fuente (parcial) de soluciones.

CADA TIPO DE APLICACIN ANALIZA HASTA UN NIVEL DISTINTO

Recuperacin de Informacin: lxico y algo de sintctico. Extraccin de Informacin: Sintctico (no profundo) y Semntico. Traduccin Automtica: Sintctico y/o Semntico.

Conclusin

El lenguaje es un aspecto humano fundamental, Relacionado con la inteligencia, Medio de Comunicacin, Almacenamiento del conocimiento humano

Conclusin

Surgi por tanto la necesidad de resolver ambigedades sintcticas y semnticas, y asimismo la consideracin de informacin contextual. La carencia de un orden de la estructura oracional en algunas lenguas, y la dificultad para obtener una representacin tanto sintctica como semntica, fueron los problemas ms relevantes. Afrontndolos se dio paso a una concepcin ms realista del lenguaje en la que era necesario contemplar las transformaciones que se producen en la estructura de la frase durante el proceso de traduccin.

Conclusin

El procesamiento del lenguaje natural (PLN), rea de investigacin en continuo desarrollo, se aplica en la actualidad en diferentes actividades como son la traduccin automtica, sistemas de recuperacin de informacin, elaboracin automtica de resmenes, interfaces en lenguaje natural, etc. Si bien en los ltimos aos se han realizado avances espectaculares, los fundamentos tericos del PLN se encuentran todava en estado de desarrollo.

Conclusin

Conjunto de mtodos y tcnicas eficientes desde un punto de vista computacional para la comprensin y generacin de lenguaje natural.

Conclusin

PLN = Lingstica Computacional (LC)


LC:
campo multidisciplinario de la lingstica y de la

computacin. estudio cientfico del lenguaje con el fin de elaborar modelos de ste o de ciertos fenmenos especficos. involucra a lingistas, informticos, lgicos, psiclogos

cognitivos

Conclusin

Por ejemplo, con la creacin de interfaces inteligentes el usuario dispondra de la facilidad para interactuar con el ordenador en lenguaje natural. Asimismo, el uso de tcnicas de PLN puede tener un alto impacto en la gestin documental y en los sistemas de traduccin automtica.
No obstante, la complejidad implcita en el tratamiento del lenguaje comporta limitaciones en los resultados y, por tanto, aplicaciones en reas de conocimiento concretas y con un uso restringido del lenguaje.

Conclusin

El estudio del lenguaje natural se estructura normalmente en 4 niveles de anlisis: morfolgico, sintctico, semntico y pragmtico. Adems se pueden incluir otros niveles de conocimiento como es la informacin fonolgica, referente a la relacin de las palabras con el sonido asociado a su pronunciacin; el anlisis del discurso, que estudia cmo la informacin precedente puede ser relevante para la comprensin de otra informacin; y, finalmente, lo que se denomina conocimiento del mundo, referente al conocimiento general que los hablantes han de tener sobre la estructura del mundo para mantener una conversacin.

Conclusin

En vista a conocer estas tcnicas de representacin y procesamiento, es necesario tener en cuenta una doble dimensin: se trata por una parte de un problema de representacin lingstica, y por otra de un problema de tratamiento mediante recursos informticos.

El uso de tcnicas computacionales procedentes especialmente de la inteligencia artificial no aportara soluciones adecuadas sin una concepcin profunda del fenmeno lingstico. Por otra parte, las gramticas utilizadas para el tratamiento del lenguaje han evolucionado hacia modelos ms adecuados para un tratamiento computacional.

Conclusin

An siendo evidente que los obstculos a superar en el estudio del tratamiento del lenguaje son considerables, los resultados obtenidos y la evolucin en los ltimos aos sitan al PLN en posicin para liderar una nueva dimensin en las aplicaciones informticas del futuro: los medios de comunicacin del usuario con el ordenador pueden ser ms flexibles y el acceso a la informacin almacenada ms eficiente.

El Lenguaje como Codificador-Descodificador

Vous aimerez peut-être aussi