UNIDAD II: Lenguaje de Anlisis y Recuperacin de la informacin LARI
SI TIENES UNA BIBLIOTECA CON JARDN, LO TIENES TODO. Cicern.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Introduccin En esta segunda unidad se va a profundizar en el Lenguaje de Anlisis y Recuperacin de Informacin LARI. Este es un lenguaje controlado artificial destinado a describir o expresar los temas o materias centrales de los documentos y sus caractersticas formales, adems, describir el contenido de las solicitudes de informacin, que tiene como finalidad, localizar posteriormente los documentos necesarios para responder a esa solicitud. EL lenguaje de Anlisis y Recuperacin de Informacin (LARI) es de gran importancia para el anlisis y bsqueda de informacin ya que es el puente que comunica al usuario con el conocimiento que existe y es almacenado en algn lugar, llmese biblioteca o base de datos. El anlisis es un requisito previo para poner a disposicin de quien necesita la informacin que se genera. Este anlisis consiste en desglosar los documentos en sus partes indicando los aspectos ms importantes de ellos que merecen tenerse en cuenta y los cuales son de valor para su recuperacin posterior.
Objetivos
Conocer los presupuestos tericos sobre la utilizacin del Lenguaje de Anlisis y Recuperacin de Informacin LARI, orientada hacia la Ciencia de la Informacin y la Documentacin, Bibliotecologa y Archivstica. Analizar y recuperar informacin a partir de los LARI.
Contenido de la unidad:
Conceptualizacin bsica de los LARI. Clasificacin: Lenguaje Pre-Coordinado Lenguaje Post-Coordinado
Evaluacin: Favor tener en cuenta las siguientes observaciones.
Las actividades de la unidad dos (2) tienen un valor del 25% de la nota final.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Estas consisten en indizar (15%) textos teniendo en cuenta lo visto en la Unidad I y realizar una reflexin (10%) respecto a los LARI, tema que se desarrolla en la Unidad II. Se debe resaltar que son dos (2) notas independientes.
En esta unidad se obtendr un 25% de la nota final.
Tarea 2: la correspondiente a indizar tiene un valor del 15%
Tarea 3: la reflexin respecto a los LARI que vale el 10%
Todas las participaciones deben hacerse dentro de la fecha establecida, o sea entre el del 18 de agosto al 1 de septiembre de 2014.
Cronograma:
Recursos:
Plataforma MOODLE, gua de la unidad nmero dos (2), foros, skype, mensajera de plataforma, correo electrnico e internet.
UNIDAD II FECHA ACTIVIDADES
LARI
Del 18 de agosto al 1 de septiembre de 2014
Lectura de la Unidad dos (2).
Tarea 2: Indizar, con un valor del 15% Tarea 3: Reflexin referente a los LARI 10%
(Calificable. 25 % de la nota final).
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
1. Leer muy bien la gua para la unidad II "LARI" 2. Tarea dos (2): la correspondiente a indizar tiene un valor del 15% 3. Las inquietudes podrn resolverse por medio del foro cafeteria o los mensajes personales. Tarea 3: la reflexin respecto a los LARI que vale el 10%
Procedimiento para esta unidad:
Para tener en cuenta:
Aplicar los conocimientos adquiridos durante ste espacio de tiempo y tenerlos en cuenta en la realizacin de la tarea.
Hacer las preguntas necesarias a su tutor (Juan Guillermo Caicedo Quintero) en caso de dudas; la idea es realizar un buen trabajo y que ste sea guiado.
Consultar la bibliografa dada en la gua. Hacer consultas independientes en internet, libros, artculos y dems que apoyen el proceso de aprendizaje.
Si al dar clic sobre los enlaces que llevan a los contenidos estudiados no se obtiene resultado, es necesario copiar el vnculo y pegarlo directamente del navegador, lo cual permite acceder de inmediato a dicha informacin.
Enviar la tarea dentro de las fechas establecidas.
Recuerde que en el foro CAFETERA: usted podr manifestar sus inquietudes, dudas y aportes sobre el curso.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
LA CADENA DOCUMENTAL
UNIDAD II: Lenguaje de Anlisis y Recuperacin de la informacin
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
1. Conceptualizacin bsica de los LARI:
Los LARI permiten la recuperacin de la informacin, previamente almacenada, por medio de la realizacin de una serie de consultas a los documentos contenidos en la base de datos. Esta serie de preguntas o interrogaciones se conceptan como sentencias formales de expresin de necesidades de informacin, y suelen venir expresadas por medio de un lenguaje de interrogacin. La funcin del anlisis documental es la de facilitar la recuperacin de la informacin al usuario siguiendo unos pasos sencillos en los que se debe determinar:
Entre las funciones de los LARI estn: Transformar los documentos primarios en otros secundarios que permiten la identificacin, localizacin y difusin de los primeros.
Los documentos secundarios pueden ser consultados ms fcilmente que los primeros.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Eliminar la ambigedad.
Facilitar la labor de indizacin.
Mejorar la consistencia de la indizacin.
Servir de apoyo al proceso de bsqueda.
Los fines son los de orientacin cientfica e informativa.
2. Clasificacin de los LARI:
Ampliar informacin en: http://eprints.rclis.org/14817/1/lendoc.pdf Son sistemas artificiales creados con una doble finalidad: almacenar informacin y para recuperarla. En el primer caso se habla tambin de (LBI) Lenguas de Bsqueda Informativa. Los lenguajes documentales para recuperar informacin son de dos clases: Lenguajes precoordinados y lenguajes postcoordinados. Lenguajes Precoordinados: los que realizan la coordinacin antes de la indizacin. Lenguajes Postcoordinados: los que realizan la coordinacin de trminos en el momento de la bsqueda, es decir despus de la indizacin. Veamos un poco ms detallado cada uno de ellos.
2.1. Lenguajes Precoordinados: Se da cuando los trminos se combinan en el momento de la descripcin. CLASIFICACIONES JERRQUICAS: Se caracterizan porque cada clase o concepto se divide sucesivamente en subclases mutuamente excluyentes. Como resultado de esto, ocurre que entre las subdivisiones de esta clasificacin existen slo relaciones de jerarqua y coordinacin. 1
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Ejemplo: Recursos Web Usabilidad o Bitcoras Espaol Ingls o Portales Espaol Ingls o Listas de Correo Espaol Ingls Web Semntica o Bitcoras Espaol Ingls o Portales Espaol Ingls o Listas de Correo Espaol Las clasificaciones jerrquicas son predominantemente enumerativas, se hacen al desarrollar el vocabulario, es decir, se precoordina antes de la indizacin. Ejemplo: Tuberas Tuberas Circulares Tuberas De Plstico Tuberas Metlicas Tuberas No Circulares Tuberas Para Agua Tuberas Para Vapor
Las clasificaciones jerrquicas se elaboran partiendo del principio que establece la subdivisin de materias, en materias ms especficas, cuanto sea necesario. As se elabora una estructura jerrquica de tipo ramificada. Tener en cuenta: Si est conectad@ a Internet puede acceder directamente a estos vnculos de web encontrados a lo largo de la gua. Ubique el cursor sobre la direccin subrayada, con la tecla Ctrl + clic, o copie y pegue la direccin en su navegador.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Los aspectos fundamentales de las relaciones entre las subdivisiones de la clasificacin son la Jerarqua o Subordinacin y la Coordinacin. La Jerarqua es la relacin en que una clase es subclase de otra ms amplia. Ejemplo por jerarqua:
Entre las CLASIFICACIONES J ERRQUICAS ms conocidas tenemos: Ampliar informacin en: http://es.wikipedia.org/wiki/Clasificaci%C3%B3n_Decimal_Universal
La clasificacin Decimal Universal-CDU: La Clasificacin Decimal Universal o CDU propuesta por Melvil Dewey 2 es un sistema de clasificacin del conocimiento que nace de la necesidad de ordenar y catalogar las obras en las bibliotecas. Este sistema se basa en la ordenacin del conocimiento a travs de dgitos. A un grupo principal se le asigna un dgito, del 0 al 9, y a cada nivel que deba ser creado dentro del grupo se le aade un nuevo dgito. Un ejemplo de tres niveles es el siguiente: 3 - Ciencias sociales 34 - Derecho 341 - Derecho internacional.
La clasificacin Decimal Dewey (CDD)
2 Melvil Dewey: bibliotecario del Amherst College en Massachusetts, Estados Unidos, cre en 1876 el Sistema Dewey de clasificacin. Este sistema fue adaptado por Paul Otlet y Henri La Fontaine y publicado por primera vez en lengua francesa entre 1904 y 1907 con el nombre de Clasificacin Decimal Universal. Desde entonces ha sido continuamente revisado y desarrollado y ha demostrado ser un sistema muy flexible y efectivo para clasificar y ordenar fondos bibliogrficos. La ltima edicin es del ao 2004.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Tambin llamada el Sistema de Clasificacin Decimal de Dewey es un sistema de clasificacin de bibliotecas desarrollado por Melvil Dewey, bibliotecario del Amherst College en Massachusetts, EE. UU., en 1876 desde ese momento ha sido varias veces modificado y ampliado en sus 22 ediciones que han ocurrido hasta 2004. Durante este tiempo y desde 1894 tambin se han desarrollado 14 ediciones abreviadas, basadas en la Edicin mayor desarrollada generalmente un ao antes. La clasificacin Dewey se basa en un modelo jerrquico decimal que toma los temas ms amplios y los va subdividiendo hasta los ms concretos; l propone diez clases principales y divide a su vez en diez Divisiones y cada una de estas en diez secciones; As, cada nivel inferior estar subordinaciones al nivel superior, algo que se denomina Fuerza Jerrquica. 800 - Literatura 880 - Literatura eslava 882 - Literatura rusa As sucesivamente. Como puede observarse, cada nivel es una especialidad del anterior. La notacin que emplea est elaborada fundamentalmente en nmeros arbigos, aunque en varias partes del esquema se sugiera el uso de letras del alfabeto para la distincin en algunas temticas, como en el caso de la literatura. Las 10 grandes clases que lo conforman son (basadas en la Edicin 21): 000 - Obras generales. 100 - Filosofa y psicologa. 200 - Religin, teologa. 300 - Ciencias sociales, ciencias polticas. 400 - Lenguaje y Lingstica. 500 - Ciencias puras (Matemticas, ciencias naturales, etc) 600 - Ciencias aplicadas: medicina, tecnologa. 700 - Bellas artes, juegos, deportes. 800 - Literatura. 900 - Geografa, historia.
La clasificacin de la Biblioteca del Congreso de los Estados Unidos. LCC, Library of Congress Classification
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
La mayora de las bibliotecas de los Estados Unidos utilizan el sistema propuesto por la Biblioteca del Congreso de dicho pas. Inicialmente fue propuesta en 1897 por Hebert Putnam y Charles Ammi Cutter para ser usada en la Biblioteca del Congreso y reemplazar as la que haba propuesto Thomas Jefferson El sistema de clasificacin es de carcter enumerativo aunque divide algunas materias en categoras amplias. Proporciona una gua de los libros que estn realmente en la biblioteca, no una clasificacin universal. La clasificacin que propone este sistema es: A Obras generales B Filosofa. Psicologa. Religin C Ciencias Auxiliares de la Historia D Historia, General y Antigua E Historia: Estados Unidos F Historia Local de los Estados Unidos y de Amrica Inglesa, Holandesa, Francesa y Latina G Geografa. Antropologa. Recreo H Ciencias Sociales J Ciencia Poltica K Derecho L Educacin M Msica y Libros sobre Msica N Bellas Artes P Lengua y Literatura Q Ciencia R Medicina S Agricultura T Tecnologa U Ciencia Militar V Ciencia Naval Z Bibliografa. Biblioteconoma. Recursos Informativos (General) Las clases I, O, W, X e Y no son de uso estndar.
LISTAS ALFABTICAS DE MATERIA. Tambin llamadas LEM
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Este tipo de lista presenta los encabezamientos para representar el tema(s) de un documento a partir de un lenguaje documental cuyo vocabulario principal consta de un conjunto de palabras, combinaciones de palabras y frases organizadas en orden alfabtico y designa las materias de alguna rama de la ciencia. CLASIFICACIONES FACETADAS: Este tipo de clasificacin se usa para organizar conjuntos de objetos que pueden estar en un sitio web, productos, documentos, etc., que son lo suficientemente homogneos como para ser descritos por sus atributos o propiedades (facetas y categoras) y sus valores (pertenencia a categoras), en otras palabras, por un conjunto de metadatos facetados. Ejemplo: TUBERAS Por su forma (faceta) TUBERAS CIRCULARES TUBERAS NO CIRCULARES Por material (faceta) TUBERAS DE PLSTICO TUBERAS METLICAS Por su aplicacin (faceta) TUBERAS PARA AGUA TUBERAS PARA VAPOR
2.2. Lenguajes Postcoordinados:
Permiten yuxtaponer los conceptos en el momento del anlisis, de manera que se puedan coordinar despus del almacenamiento. Precisan la utilizacin de ficheros suplementarios, llamados inversos, como los uniterms; permite utilizar un gran nmero de vas de acceso al documento, teniendo como intermediarios a estos ficheros, que necesitan una bsqueda en dos tiempos: identificacin de documentos y su localizacin.
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Los lenguajes Postcoordinados son los sistemas que se construyen a la luz de una investigacin seria y un anlisis de la terminologa empleada para la indizacin. Su objetivo central est dirigido a obtencin de conceptos y no de materias. Segn Van Slype se presentan varios tipos de lenguajes: A. LENGUAJ ES LIBRES entre los que se cuentan: Lista de Palabras Claves: son una coleccin de trminos no estructurados ordenados alfabticamente de palabras significativas, extradas de los ttulos o de los resmenes de los textos originales.
Lista de Descriptores Libres: Son listas no estructuradas pero en las cuales se establecen conceptos destacados mediante un proceso intelectual. Generalmente se presentan por medio de palabras o expresiones.
B. LENGUAJES CONTROLADOS: entre ellos estn: Lenguajes de Autoridades: Es una coleccin de conceptos sin relaciones estructurales que se encargan de representar de forma unvoca el contenido de los documentos y de las preguntas de las bsquedas. Los conceptos son tomados de una lista finita a priori y controlada.
Tesauros: es una lista estructurada en las cuales se ve la presencia de relaciones sintcticas y semnticas. Representa los contenidos de los documentos y las consultas al sistema. Es el lenguaje ms controlado de todos ya que ofrece un alto grado de precisin y exhaustividad.
EJEMPLO:
TESAURO PARA LA INDIZACIN DE DOCUMENTACIN SOBRE PATRIMONIO CULTURAL Tesauro HEREIN (Documentacin sobre patrimonio cultural). Multilinge (actualmente disponible en 10 lenguas de la Unin Europea): http://www.europeanheritage.net Ejemplo de Lenguaje Postcoordinado. Objetos: Manzanas Naranjas Peras
CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN, BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)
Procesos: Envasado Distribucin Recoleccin
Bibliografa
http://www.bibliociencias.cu/gsdl/collect/eventos/index/assoc/HASH01e6.dir/doc.pdf Sobre Clasificaciones Jerrquicas.
http://www.nosolousabilidad.com/articulos/clas_facetadas1.htm Sobre Clasificacin Facetadas.
http://docupo.pbworks.com/w/page/18009107/lenguajes-precoordinados-y- postcoordinados Sobre Lenguajes Post-coordinados.
http://www.inqnable.es/temario/especifico/documentacion/Lenguajes%20documentales%2 0postcoordinados%20.pdf/view?searchterm=None Sobre Lenguajes Post-coordinados.
MATERIAL COMPLEMENTARIO Veamos con mayor profundidad lo propuesto en el documento: http://www3.unileon.es/dp/abd/tesauro/pagina/conceptos/tipoleng.html