Académique Documents
Professionnel Documents
Culture Documents
Cynthia Fresno
ndice:
1) 2) 3) 4) 5) 6)
7)
8) 9)
Qu es el question answering?. Sistema de question answering. TREC vs. CBC. Acontecimientos de respuesta por cada pregunta. Funciones de puntuacin en las respuestas candidatas. Limites en funciones que utilizan el traslapo de palabras. Apariciones de multiples respuestas en una frase. Conclusiones del anlisis. Aplicar Q/A a la web.
Cynthia Fresno 2
Qu es question answering?
Tcnicas IR: Eficaces para localizar informacin en grandes colecciones de datos. Cundo necesitamos respuestas especficas? De resolver esto se encarga el sistema de question answering.
Cynthia Fresno
Sistema de Q/A
SISTEMA IDEALIZADO TCNICA TIPO DE ANLISIS
Coleccin de documentos
Recuperacin de documentos
Anlisis de caractersticas
Recuperacin de sentencias
3. Sets de traslapo
Realizacin de lmites
4. Confusin de respuestas
Cynthia Fresno
Se desarrollan cuatro tcnicas para poder llevar a cabo los tres tipos de anlisis: propiedades inherentes de los datos, anlisis de caractersticas y los limites.
Impacto de tener multiples respuestas para una pregunta. 2) Funciones de puntuacin que se utilizan para recuperar regiones de texto que se supone que obtendrn la respuesta. Recuperacin de informacin.
1)
Cynthia Fresno 5
Si un sistema asigna en el traslapo diferentes pesos a las palabras, que tal se desarrollar el sistema? 4) La extraccin de la respuesta corta. Habilidad del set de tipo de respuesta para discriminar entre diferentes tipos de respuestas.
3)
Cynthia Fresno
Cynthia Fresno
Cynthia Fresno
Cynthia Fresno
TREC
Respuestas por pregunta
CRC 1
26% 67
27% 50%
Cynthia Fresno
80% 6
----10
Cynthia Fresno
11
Cynthia Fresno 12
Traslapo de palabras: muy eficaz para clasificar respuestas. Cmo clasificar la absoluta cualidad de los candidatos? - En CRC y TREC no hay problema. - Tenemos que tener en cuenta que en el mundo real nos aparecern preguntas que no obtengan respuesta en determinados documentos.
Cynthia Fresno
13
Cynthia Fresno 14
CBC
Preguntas que pueden responderse correctamente Preguntas imposibles de contestar correctamente Mnimo de acierto de preguntas Mximo de acierto de preguntas
TRAC
65 % 35 % 10 % 48.8 %
15
79 % 21 % 24 % 72.7 %
Cynthia Fresno
En definitiva, el lmite superior es algo bajo y el lmite inferior algo alto. Se necesitan mtodos que amplen las caractersticas que se utilizan para puntuar las respuestas candidatas.
Cynthia Fresno
16
Cynthia Fresno 17
CBC
Acierto esperado
TRAC 59 %
61 %
Muestra las limitaciones del set de tipo de respuesta: Muchas frases tienen instancias del mismo tipo, como listas y rangos. Para mejor efectividad: los sistemas de Q/A necesitan utilizar caractersticas que precisen mejor la respuesta.
Cynthia Fresno 18
Cynthia Fresno
19
Pueden extenderse las tcnicas de Q/A a la web? Hoy en da hay ciertos sistemas que lo hacen:
MULDER es uno de ellos. Manda ciertas preguntas a google y utiliza la informacin que de ello obtiene para resolver la respuesta. AskJeeves
Cynthia Fresno
20
4)
Formar las preguntas correctas. Ruido (apartar las pginas que no digan nada). Evitar los engaos. Mejorar la limitacin de recursos.
Cynthia Fresno
21
Cynthia Fresno
22
ANALIZADOR DE PREGUNTAS: Determina la estructura sintctica de las preguntas. CLASIFICADOR DE PREGUNTAS: Permite a MULDER reducir el nmero de respuestas candidatas en la fase de extraccin. FORMULACIN DE QUERYS: Este mdulo convierte la pregunta en un grupo de querys de palabras clave que se mandarn a la mquina de bsqueda para una evaluacin paralela. - MULDER implementa unas cuantas estrategias de renombramiento: conversin de verbos, expansiones query
Cynthia Fresno 23
Mquina de bsqueda: Se han considerado diferentes motores de bsqueda pero el ms utilizado es google. Extraccin de respuestas: 2 pasos 1) Se extraen sumarios de los textos que supuestamente contendrn la informacin. 2) Analiza los sumarios y obtiene frases del tipo esperado de respuesta. Seleccin de respuestas: 1) Clasifica las respuestas en funcin de las palabras clave.
Cynthia Fresno 24
2) Hace una agrupacin entre similares respuestas. 3) Se hace una votacin a todas las agrupaciones y gana la que tiene ms puntos. El proceso de agrupacin de candidatos tiene varios efectos favorables: - Reduce el ruido. - Permite respuestas alternativas. - Separa hechos de la ficcin.
Cynthia Fresno
25