Académique Documents
Professionnel Documents
Culture Documents
Metadatos (del griego , meta, 'despus de, ms all de'1 y latn datum, 'lo que se da',
dato2 ), literalmente sobre datos, son datos que describen otros datos. En general, un
grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de
un objeto al que se denomina recurso3 . El concepto de metadatos es anlogo al uso
de ndices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan
fichas que especifican autores, ttulos, casas editoriales y lugares para buscar libros. As, los
metadatos ayudan a ubicar datos.4
Para varios campos de la informtica, como la recuperacin de informacin o la web
semntica, los metadatos en etiquetas son un enfoque importante para construir un puente
sobre el intervalo semntico, ya que cualquier recurso tiene, cuando est almacenado
conjuntamente con otros, la necesidad de ser descrito para facilitar las bsquedas que
pudieran tratar de encontrarlo a partir de sus caractersticas distintivas. Esto es cierto para
cualquier tipo de recurso, tanto para un vdeo como para un libro en una biblioteca o para un
hueso en el armario de un paleontlogo.
El concepto de metadatos es anterior a Internet y a la web, si bien es cierto que las nuevas
necesidades de bsqueda de informacin han suscitado un inters por las normas y prcticas
de metadatos hasta entonces desconocido.
ndice
[ocultar]
1Definiciones
o
2Objetivos
3Clasificacin
4Ciclo de vida
o
4.1Creacin
4.2Manipulacin
4.3Destruccin
5Metadatos en la informtica
6Almacenamiento
o
6.1Codificacin
7Vocabularios controlados y ontologas
9Paradatos
o
9.1Almacenamiento de paradatos
11Formatos y estndares
12Vase tambin
13Referencias
14Enlaces externos
Definiciones[editar]
El trmino metadatos no tiene una definicin nica. Segn la definicin ms difundida de
metadatos es que son datos sobre datos. Tambin hay muchas declaraciones como
informaciones sobre datos,5 datos sobre informaciones6 e informaciones sobre
informaciones.7
Otra clase de definiciones trata de precisar el trmino como descripciones estructuradas y
opcionales que estn disponibles de forma pblica para ayudar a localizar objetos 8o datos
estructurados y codificados que describen caractersticas de instancias conteniendo
informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias
descritas.9 Esta clase surgi de la crtica de que las declaraciones ms simples son tan
difusas y generales que dificultarn la tarea de acordar estndares, pero estas definiciones no
son muy comunes.
Podemos tambin considerar los metadatos, en las reas de telecomunicaciones e
informtica, como informacin no relevante para el usuario final pero s de suma importancia
para el sistema que maneja los datos. Los metadatos son enviados junto a la informacin
cuando se realiza alguna peticin o actualizacin de la misma.
En el campo biolgico los metadatos se han convertido en una herramienta fundamental para
el descubrimiento de datos e informacin. En este contexto se pueden definir los metadatos
como una descripcin estandarizada de las caractersticas de un conjunto de datos con
esto se incluye la descripcin del contexto en el cual los datos fueron coleccionados y adems
se refiere al uso de estndares para describirlos [1].
ser muy tiles. Por ejemplo, fusionando dos imgenes y sus metadatos distintos puede ser
muy importante deducir cul es el origen de cada grupo de metadatos, registrando ello en
metadatos sobre los metadatos.
Objetivos[editar]
El uso de los metadatos mencionado ms frecuentemente es la refinacin de consultas
a buscadores. Usando informacin adicional los resultados son ms precisos, y el usuario se
ahorra filtraciones manuales complementarias.
El intervalo semntico plantea el problema de que el usuario y el ordenador no se entiendan
porque este ltimo no comprenda el significado de los datos. Es posible que los metadatos
posibiliten la comunicacin declarando cmo estn relacionados los datos. Por eso
la representacin del conocimiento usa metadatos para categorizar informaciones. La misma
idea facilita la inteligencia artificial al deducir conclusiones automticamente.
Los metadatos facilitan el flujo de trabajo convirtiendo datos automticamente de un formato a
otro. Para eso es necesario que los metadatos describan contenido y estructura de los datos. 10
Algunos metadatos hacen posible una compresin de datos ms eficaz. Por ejemplo, si en un
vdeo el software sabe distinguir el primer plano del fondo puede usar algoritmos de
compresin diferentes y as mejorar la cuota de compresin. 11
Otra idea de aplicacin es la presentacin variable de datos. Si hay metadatos sealando los
detalles ms importantes, un programa puede seleccionar la forma de presentacin ms
adecuada. Por ejemplo, si un telfono mvil sabe dnde est localizada una persona en una
imagen, tiene la posibilidad de reducirlo a las dimensiones de su pantalla. Del mismo modo un
navegador puede decidir presentar un diagrama a su usuario ciego en forma tctil o leda. 12
Clasificacin[editar]
Los metadatos se clasifican usando tres criterios:
Contenido
Subdividir metadatos por su contenido es lo ms comn. Se puede separar los
metadatos que describen el recurso mismo de los que describen el contenido del
recurso. Es posible subdividir estos dos grupos ms veces, por ejemplo para separar
los metadatos que describen el sentido del contenido de los que describen
la estructura del contenido o los que describen el recurso mismo de los que describen
el ciclo vital del recurso.
Variabilidad
Segn la variabilidad se puede distinguir metadatos mutables e inmutables. Los
inmutables no cambian, no importa qu parte del recurso se vea, por ejemplo el
nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido
de un vdeo.13
Funcin
Los datos pueden ser parte de una de las tres capas de funciones: subsimblicos,
simblicos o lgicos. Los datos subsimblicos no contienen informacin sobre su
significado. Los simblicos describen datos subsimblicos, es decir aaden sentido.
Los datos lgicos describen cmo los datos simblicos pueden ser usados para
deducir conclusiones lgicas, es decir aaden comprensin.14
Ciclo de vida[editar]
Creacin[editar]
Se pueden crear
metadatos manualmente, semiautomticamente o automticamente. El proceso
manual puede ser muy laborioso, dependiente del formato usado y del volumen
deseado, hasta un grado en el que los seres humanos no puedan superarlo. Por
eso, el desarrollo de utillaje semiautomtico o automtico es ms que deseable.
En la produccin automtica el software adquiere las informaciones que necesita
sin ayuda externa. Aunque el desarrollo de algoritmos tan avanzados est siendo
objeto de investigacin actualmente, no es probable que la computadora vaya a
ser capaz de extraer todos los metadatos automticamente. En vez de ello, se
considera la produccin semiautomtica ms realista; aqu un servidor humano
sostiene algoritmos autnomos con la aclaracin de inseguridades o la
proposicin de informaciones que el software no puede extraer sin ayuda.
Hay muchos expertos que se encargan del diseo de herramientas para la
creacin de metadatos pero que ignoran cuestionar este proceso. Segn los que
no evitan el asunto, la generacin no debe comenzar despus de la terminacin
de un recurso sino que debe hacerse durante la fabricacin: hay que archivar los
metadatos tan pronto como se originan, con los conocimientos especiales del
productor, para evitar una laboriosa reconstruccin posterior. Por eso, se tiene
que integrar la produccin de metadatos en el procedimiento de fabricacin del
recurso.13
Manipulacin[editar]
Si los datos cambian, los metadatos tienen que cambiar tambin. Aqu se hace la
pregunta: quin va a adaptar los metadatos? Existen modificaciones que pueden
ser manejadas de forma sencilla y automtica, pero hay otras donde la
intervencin de un servidor humano es indispensable.
La metaproduccin, el reciclaje de partes de recursos para crear otros recursos,
demanda atencin particular. La fusin de los metadatos afiliados no es trivial,
especialmente si se trata de informacin con relevancia jurdica, como por
ejemplo la gestin digital de derechos.
Destruccin[editar]
Adems hay que investigar la destruccin de metadatos. En algunos casos es
conveniente eliminar los metadatos junto con sus recursos, en otros es razonable
conservar los metadatos, por ejemplo para supervisar cambios en un documento
de texto.
Metadatos en la informtica[editar]
Los metadatos han cobrado gran relevancia en el mundo de Internet, por la
necesidad de utilizar los metadatos para la clasificacin de la enorme cantidad de
datos. Adems de la clasificacin los metadatos pueden ayudar en las bsquedas.
Por ejemplo, si buscamos un artculo sobre vehculos, este dato tendr sus
correspondiente metadatos clave adjuntos, como 4 ruedas, motor, etc.
Otros ejemplos de usos de metadatos en la informtica:
Almacenamiento[editar]
Hay dos posibilidades para almacenar metadatos: depositarlos internamente, en
el mismo documento que los datos, o depositarlos externamente, en su mismo
recurso. Inicialmente, los metadatos se almacenaban internamente para facilitar la
administracin.
Hoy, por lo general, se considera mejor opcin la localizacin externa porque hace
posible la concentracin de metadatos para optimizar operaciones de bsqueda.
Por el contrario, existe el problema de cmo se liga un recurso con sus
metadatos. La mayora de los estndares usa URIs, la tcnica de localizar
documentos en la World Wide Web, pero este mtodo propone otras preguntas,
por ejemplo qu hacer con documentos que no tienen URI.
Codificacin[editar]
Los primeros y ms simples formatos de los metadatos usaron texto no cifrado o
la codificacin binaria para almacenar metadatos en ficheros.
Hoy, es comn codificar metadatos usando XML. As, son legibles tanto por seres
humanos como por computadoras. Adems este lenguaje tiene muchas
caractersticas a su favor, por ejemplo es muy simple integrarlo en la World Wide
Web. Pero tambin hay inconvenientes: los datos necesitan ms espacio de
memoria que en formato binario y no est claro cmo convertir la estructura
de rbol en una corriente de datos.
Por eso, muchos estndares incluyen utilidades para convertir XML en
codificacin binaria y viceversa, de forma que se unen las ventajas de los dos.
Un concepto muy similar a las ontologas son las folksonomas. Las ontologas
son definidas por expertos del campo que ordenan los trminos, pero las
folksonomas son definidas por los mismos usuarios.
Los metadatos son por tanto un elemento de valor fundamental. Un recurso digital
con un diseo pedaggico excelente no es per se un buen objeto de aprendizaje,
sino que lo ser en la medida en que los metadatos que lo describan sean
tambin de calidad.
Paradatos[editar]
Se conoce como paradatos [[1]] al conjunto de datos que se genera durante la
interaccin entre un usuario y un recurso o servicio de un escenario educativo (un
entorno virtual de aprendizaje, repositorio, red social, etctera). En funcin del
recurso o servicio accedido y las operaciones realizadas con el mismo, los
paradatos generados contendrn ms o menos informacin. Esta informacin se
puede almacenar para ser posteriormente analizada, con el objetivo de
comprender mejor cmo los usuarios interactan en dicho escenario educativo,
Almacenamiento de paradatos[editar]
Dado que la interaccin en un entorno virtual de aprendizaje suele realizarse
mediante el uso de un navegador web, un usuario que visita los espacios
ofrecidos por el mismo deja un rastro en forma de accesos a pginas web que
quedan recogidos en los ficheros de registro (en ingls, log files) de los servidores
web que soportan el sistema. Por lo tanto, parece factible analizar los ficheros de
registro para extraer la informacin relativa a la interaccin. El problema, no
obstante, es que estos ficheros contienen muchas ms entradas relativas a la
disposicin de los elementos que forman una pgina web, que realmente
relacionadas con el propio resultado de la interaccin de los usuarios, la cual debe
ser calculada a partir de la secuencia de saltos capturada en los ficheros de
registro. El coste computacional de analizar ficheros de registro es muy elevado
(contienen millones de lneas de registro) y no es sencillo cuando se trata de
sistemas complejos con mltiples servidores donde el rastro dejado por un
usuario puede estar fragmentado en diferentes ficheros.
Por lo tanto, si es necesario recoger paradatos para su anlisis posterior, es mejor
que el sistema sea diseado especficamente con un servicio de recogida
enfocado a almacenar solamente la informacin requerida para el anlisis,
reduciendo el tamao necesario as como el tiempo de proceso. En funcin del
objetivo del anlisis, los paradatos pueden almacenarse dentro de los metadatos
de un recurso, dentro del perfil del usuario o bien, lo ms habitual, en una tabla (o
base de datos, en funcin de su complejidad) separada.
Los metadatos dependen del punto de vista y del contexto. No hay dos
personas que aadan los mismos metadatos. Adems, los mismos datos
pueden ser interpretados de manera totalmente diferente, dependiendo del
contexto.
LOM permite utilizar otro vocabulario si se estima oportuno, por lo que una
cierta institucin podra simplificar el nmero de categoras a 3, ampliarlo a 10
para ofrecer una escala ms detallada, o elegir otra escala ms adecuada a
su contexto tal como por ejemplo: bsico / bsico-necesitaapoyo / imprescindible-apoyo-externo/ complejo.
Formatos y estndares[editar]
Hay dos grupos que impulsan el desarrollo de formatos de metadatos: la tcnica
multimedia y la web semntica. El destino de la tcnica multimedia es describir un
singular recurso de multimedia, el de la web semntica la descripcin de recursos
de cada tipo y adems el encadenamiento de los conocimientos. Los formatos
ms populares y grandes son:
ID3 hace posible la notacin de metadatos muy sencillos, tales como ttulo e
intrprete, en ficheros de audio MP3. El formato es muy popular y demuestra
que los metadatos pueden ser tiles.
MPEG-7
MPEG-21
TV-Anytime
EXIF
Dublin Core
LOM
RDF Schema
OWL
NewsML
SportsML