Vous êtes sur la page 1sur 26

Procesamiento de

lenguaje natural
Conceptos bsicos

El procesamiento del lenguaje natural es el


campo que combina las tecnologas de la ciencia
computacional (como la inteligencia artificial, el
aprendizaje automtico o la inferencia estadstica)
con la lingstica aplicada, con el objetivo de hacer
posible la comprensin y el procesamiento asistidos
por ordenador de informacin expresada en
lenguaje humano para determinadas tareas, como
la traduccin automtica, los sistemas de dilogo
interactivos, el anlisis de opiniones, etc.
El logro que una computadora aprenda a interpretar
el lenguaje natural se debe a dos caminos, uno
epistemolgico y otro heurstico:

Epistemolgico: Define el espacio de conceptos


que el programa puede aprender.

Heurstico: Define los algoritmos para el


aprendizaje.
El estudio, evolucin y madurez del PNL tiene dos
objetivos fundamentales que son:

Facilitar la comunicacin con la mquina para que


puedan acceder diferentes usuarios desde aquel
que posee mnimos conocimientos de consulta
hasta el que es avanzado.

Modelar los procesos cognoscitivos que entran en


juego en la comprensin del lenguaje natural para
disear sistemas que realicen tareas lengusticas
complejas.
Herramientas

Formalismos gramaticales
Algoritmos
Estructuras de datos
Mecanismos de razonamiento
Niveles de anlisis

Sintctico
Semntico
Pragmtico
Morfolgico
Morfolgico

Su funcin consiste en detectar la relacin que se


establece entre las unidades mnimas que forman
una palabra, como puede ser el reconocimiento de
sufijos o prefijos. Este nivel de anlisis mantiene
una estrecha relacin con el lxico.
Sintctico

Tiene como funcin etiquetar cada uno de los


componentes sintcticos que aparecen en la
oracin y analizar cmo las palabras se combinan
para formar construcciones gramaticalmente
correctas. El resultado de este proceso consiste en
generar la estructura correspondiente a las
categoras sintcticas formadas por cada una de las
unidades lxicas que aparecen en la oracin.
Semntico

La semntica hace referencia a lo que significan las


palabras por s mismas sin considerar el uso en un
tema determinado.
Pragmtico

Aade informacin adicional al anlisis del


significado de la frase en funcin del contexto
donde aparece. Se trata de uno de los niveles de
anlisis ms complejos, la finalidad del cual es
incorporar al anlisis semntico la aportacin
significativa que pueden hacer los participantes, la
evolucin del discurso o informacin presupuesta.

Incorpora as mismo informacin sobre las


relaciones que se dan entre los hechos que forman
el contexto y entre diferentes entidades.
En el lxico se incluye la informacin morfolgica, la
categora gramatical, irregularidades sintcticas y
representacin del significado.

Normalmente el lxico slo contiene la raz de las


palabras con formas regulares, siendo el analizador
morfolgico el que se encarga de determinar si el
gnero, nmero o flexin que componen el resto de
la palabra son adecuados.
Campos de investigacin

El anlisis de opiniones y de sentimientos es


una parte importante del PLN que se ocupa del
anlisis computacional de textos producidos por
seres humanos, con el objetivo de procesar y
extraer unos niveles cuantificables de opiniones y
sentimientos conexos.
La traduccin automtica se centra en la
traduccin de textos asistida por ordenador, de
un idioma humano a otro.

El reconocimiento y la clasificacin de
entidades con nombre constituye un importante
subcampo de la extraccin de informacin que
se ocupa de la localizacin, la identificacin y la
clasificacin de elementos atmicos individuales
denominados entidades con nombre en textos,
como sustantivos, expresiones relacionadas con
fechas, porcentajes, nmeros, etc.
Los sistemas de dilogo proporcionan a las
personas una va de interaccin con un sistema
computacional (por ejemplo, utilizar una aplicacin
informtica) usando dilogos escritos (e incluso
orales), similares a los que entablan entre s los
seres humanos sobre un asunto concreto.
Los clasificadores y otras tecnologas de
reconocimiento de patrones permiten la clasificacin
de la informacin segn unos criterios
predefinidos.La informacin puede ser de
naturaleza diversa:visual, textual, acstica, etc.
Aplicaciones
Reconocimiento de voz

El reconocimiento automtico del


habla (RAH) o reconocimiento automtico
de voz es una disciplina de la
inteligencia artificial que tiene como
objetivo permitir la comunicacin hablada
entre seres humanos y computadoras.

Un sistema de reconocimiento de voz es


una herramienta computacional capaz de
procesar la seal de voz emitida por el ser
humano y reconocer la informacin
contenida en sta, convirtindola en texto
o emitiendo rdenes que actan sobre un
proceso.
SIRI Apple Inc.

Siri es una aplicacin con funciones de asistente


personal a veces con su propia personalidad
para iOS. Esta aplicacin utiliza procesamiento del
lenguaje natural para responder preguntas, hacer
recomendaciones y realizar acciones mediante la
delegacin de solicitudes hacia un conjunto
de servicios web que ha ido aumentando con el
tiempo.

Siri fue creada en diciembre de 2007 por Dag


Kittlaus (CEO), Adam Cheyer (VP Engineering) y
Tom Gruber (CTO/VP Design) junto a Norman
Winarsky del grupo SRI venture group. El 13 de
octubre de 2008 se anunci que Siri haba recogido
8,5 millones de dlares de financiacin en capitales
de riesgo tan solo en la primera ronda de
financiacin, llevada a cabo por Menlo
Ventures y Morgenthaler Ventures.
Google Traductor
Traductor de Google (del ingls Google Translate) es un servicio
libre multilinge de traduccin automtica estadstica
proporcionada por Google para traducir texto, voz, imgenes o
video en tiempo real de un idioma a otro. Ofrece una interfaz
web, interfaces mviles para iOS y Android, y una API que los
desarrolladores pueden utilizar para construir las extensiones
del navegador, las aplicaciones y otro software.

SimSimi
Es un popular inteligencia artificial programa de conversacin
creado en 2002 por ISMaker. [1] La solicitud haya dado lugar a
la controversia y las protestas en Tailandia para algunas de sus
respuestas que contengan malas palabras y las crticas de los
lderes polticos. [2]Es lo que va creciendo en su artificial da a
da la inteligencia, asistido por una caracterstica que permite a
los usuarios ensean a responder correctamente. SimSimi,
pronunciado como "cuas-shimi", es de una palabra
coreana simsim ( ) que significa "aburrido". [ Cita
requerida ] Tiene una aplicacin diseada para Android ,
para Windows Phone y iOS .
Desarrollos actuales
Traduccin automtica: se refiere ms que nada a la
traduccin correcta de un lenguaje a otro, tomando en cuenta lo
que se quiere expresar en cada oracin, y no solo palabra por
palabra

Recuperacin de la informacin: un claro ejemplo seria el


siguiente: Una persona llega a la computadora y le dice que es lo
que busca, esta busca y le dice que es lo que tiene referente al
tema.
Extraccin de Informacin y Resmenes: Los nuevos
programas, deben tener la capacidad de crear un resumen de un
documento basndose en los datos proporcionados, realizando
un anlisis detallado del contenido y no solo la truncando las
primeras Lneas de los prrafos.

Resolucin cooperativa de problemas: La computadora debe


tener la capacidad de cooperar con los humanos para la solucin
de problemas complejos, proporcionando datos e informacin,
incluyendo tambin, la demanda de informacin por parte del
ordenador al usuario, debiendo existir una excelente
interactividad entre el usuario y el ordenador.
Tutores inteligentes: se refiere a la enseanza asistida por
computadora, debiendo esta ser aprox. en un 99%, al tener esta
la capacidad de evaluar al educando y tener la capacidad de
adaptndose a cada tipo de alumnos.

Reconocimiento de Voz: Esta es una aplicacin que ms xito


ha obtenido en la actualidad, ya que las computadoras de hoy ya
tienen esta caracterstica, el reconocimiento de voz puede tener
dos posibles usos: para identificar al usuario o para procesar lo
que el usuario dicte, existiendo ya programas comerciales, que
son accesibles por la mayora de los usuarios.
Sntesis de habla
Es la produccin artificial del habla. El sistema computarizado que
es usado con este propsito es llamado computadora de
habla o sintetizador de voz y puede ser implementado en
productos software o hardware. Un sistema text-to-speech
(TTS) convierte el lenguaje de texto normal en habla; otros
sistemas recrean la representacin simblica lingstica como
transcripciones fonticas en habla.
Stephen Hawking es una de las personas ms famosas en
emplear un sintetizador de voz para comunicarse.
Preguntas

Qu es el PNL?
Cules son los objetivos del PNL?
Cules son los niveles de anlisis empleados en el PNL?
Cul es la funcin del anlisis morfolgico?
Qu es el sistema de reconocimiento de voz?

Vous aimerez peut-être aussi