Vous êtes sur la page 1sur 142

Ps-Graduao em Cincia da Computao

MetaMdia Um Um Modelo de Metadados na Indexao e Recuperao de Objeto Multimdia

por

Maria Salete Marcon Gomes Vaz

Tese de Doutorado

Universidade Federal de Pernambuco posgraduacao@cin.ufpe.br http:www.cin.ufpe.br/~posgraduacao

RECIFE, DEZEMBRO/2000

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMTICA PS-GRADUAO EM CINCIA DA COMPUTAO

MARIA SALETE MARCON GOMES VAZ

METAMDIA UM MODELO DE METADADOS NA INDEXAO E RECUPERAO DE OBJETOS MULTIMDIA

ESTE TRABALHO FOI APRESENTADO PSGRADUAO EM CINCIA DA COMPUTAO DO CENTRO DE INFORMTICA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO COMO REQUISITO PARCIAL PARA OBTENO DO GRAU DE DOUTORA EM CINCIA DA COMPUTAO .

ORIENTADORES: Fernando da Fonseca de Souza Alexandre M. Lins de Vasconcelos Ana Carolina Salgado

RECIFE, DEZEMBRO/2000

Resumo
Um banco de dados convencional um repositrio de dados, que contm valores numricos, alfanumricos, booleanos e datas. Um banco de dados multim dia, adicionalmente, contm imagens grficas, clipes de vdeo, arquivos de som, textos, entre outros. O dado armazenado no banco de dados deve ser estruturado de tal modo que a informao desejada possa ser facilmente localizada e recuperada. A modelage m de dados o termo usado para determinar quais dados devem ser armazenados e refletir os relacionamentos entre eles. A representao dos dados convencionais feita essencialmente por atributos que descrevem objetos do mundo real, enquanto que dados mu ltimdia so objetos do mundo real que so mantidos no banco de dados. A dificuldade em descrever (indexar) objetos multimdia com o objetivo de recuper-los motivou o desenvolvimento desta tese. Um modelo de metadados proposto para descrever objetos multimdia e permitir a indexao e recuperao desses objetos. O uso de metadados na descrio de objetos multimdia justifica -se pela dificuldade em efetuar casamento exato de padres; dificuldade na pesquisa baseada em contedo, devido anlise em grande conjunto de dados; e quando a pesquisa baseada em contedo possvel de ser realizada, a mesma no pode ser feita de fato por razes de desempenho.

iii

A importncia, relevncia e originalidade desta proposta esto relacionadas aos seguintes itens: (i) integrao de dados de diferentes bases, com tratamento uniforme, atravs do uso de uma base de metadados descritivos; (ii) descrio de objetos multimdia, usando um modelo de metadados; (iii) compartilhamento de dados entre objetos, atravs do mecanismo de herana; e (iv) utilizao da composio de objetos para reduzir os resultados de pesquisas.

iv

Abstract
A database is a repository of data, that conventionally contains values of types numerical, alphanumeric, boolean and date. A multimedia database, additionally, contains graphical pictures, clips of video, archives of sound, texts, among others. The stored data inside a database must be structured in such a mode that the desired information can easily be located and retrieved. The modeling of data is the term used to determine which data must be stored and to reflect the relationships between the data. The representation of the conventional data is made essentially by attributes that describe objects of the real world, while multimedia data are objects of the real world that are kept in the database. The difficulty in describing (indexing) multimedia data with the objective of retrieval motivated the development of this thesis. A model of metadata is proposed to describe multimedia data and to allow the indexation and retrieval of these data. The use of metadata in the multimedia object description is ju stified due to the difficulty in doing pattern matching; difficulty in searching based on content due to the analysis in large; and also because when the search based even on content is possible to be carried through, it cannot be done due to performance l imitations.

The importance, relevance and originality of this proposal are related to items: (i) integration of data of different bases, with uniform treatment, through the use of a base of descriptive metadata; (ii) multimedia object description, using a model of metadata; (iii) sharing of data between objects, through the inheritance mechanism; e (iv) use of the object composition to reduce the results of search.

vi

Dedicatria

Dedico esta tese aos meus amigos Anjolina Grissi, lvaro Justus, Vanderlei Vilanova, Marilia Pimentel, Virgnia de Paula, Adeilva Tenrio, que sem eles tudo seria muito mais difcil. Vocs foram amigos acima de tudo! Obrigada!

Dedico a minha filha Rafaela e ao meu marido Gil por terem esperado a finalizao deste trabalho. Foram muitos momentos sem a minha presena. Obrigada pelo Amor e Compreenso!

vii

Agradecimentos
Ao professores Fernando Fonseca, Alexandre Vasconcelos e Ana Carolina Salgado, pelo apoio, orientao e estmulo recebido durante o desenvolvimento deste trabalho. Aos professores, componentes da banca examinadora, Jos Valdeni de Lima, Guido Lemos, Judith Kelner, Carlos Ferraz e Alexandre Vasconcelos pelas crticas e sugestes importantes para enriquecimento deste trabalho. Aos professores Alexandre Vasconcelos, Ktia Guimares e Fbio Silva pela orientao competente recebida durante o desenvolvimento dos exames de qualificao para o doutoramento. Obrigada!!! Ao amigo Vanderlei, por todos os momentos dispensados para o meu crescimento intelectual e cientfico. Pelas dicas, pelas crticas, pelo incentivo, pelo papo, pelo ombro, enfim por tudo. Obrigada! Ao Ricardo Czelusniak meu agradecimento especial pela dedicao e competncia na implementao do Prottipo MetaMdia. Muito Obrigada!!!! Ao Gil, por estar sempre ao meu lado; pela alegria, pelo incentivo, pelo apoio nos momentos mais difceis, pela fora e pelo amor. Obrigada!!! Luciana, minha fiel escudeira, que tratou a minha filha com amor e dedicao, tornando a minha caminhada menos rdua. Obrigada!!! A minha amiga Marilia, pelo apoio direto e indireto. Pela dedicao e ajuda durante todo o tempo. Obrigada pelo carinho e amizade!

viii

Aos meus amigos especiais lvaro, Anjolina, Celso, Virginia, Carla, que estavam sempre dando apoio e carinho. Muito agradecida ! Aos meus pais e meus irmos, pelo amor, incentivo e compreenso recebidos sempre. Aos meus colegas e amigos do CIN, obrigada pela fora. E tambm a todos que direta e indiretamente contriburam com carinho, amizade e incentivo. Obrigada!!! Ao Centro de Processamento de Dados da Universidade Estadual de Ponta Grossa e a prpria Universidade, pela oportunidade e apoio recebidos sempre. Obrigada!!!

ix

Contedo
1 INTRODUO...................................................................................................1 1.1 MOTIVAO ....................................................................................................1 1.2 OBJETIVOS .......................................................................................................3 1.3 ESTRUTURA .....................................................................................................5 2 MODELO DE METADADOS E BANCO DE DADOS MULTIMDIA .......... 7 2.1 INTRODUO ...................................................................................................7 2.2 CONCEITOS BSICOS .......................................................................................9 2.2.1 Multimdia.................................................................................................9 2.2.2 Dado e Informao..................................................................................13 2.2.3 Objeto Multimdia...................................................................................14 2.3 MODELO DE METADADOS ..............................................................................15 2.3.1 Classificao de Metadados..................................................................... 16 2.3.2 Metadados no Contexto Organizacional..................................................19 2.3.4 Gesto de Metadados...............................................................................21 2.4 INDEXAO DE INFORMAO ........................................................................23 2.5 RECUPERAO DE INFORMAO ................................................................... 26 2.5.1 Mtodos de Recuperao.........................................................................27 2.5.2 Algoritmos de Pesquisa...........................................................................30 2.6 ARMAZENAMENTO DE OBJETOS ..................................................................... 33

2.7 CONSIDERAES FINAIS ................................................................................36 3 METAMDIA UM MODELO DE METADADOS PARA OBJETOS MULTIMDIA ................................................................................................. 38 3.1 INTRODUO ................................................................................................. 38 3.2 MODELO DE METADADOS ..............................................................................39 3.2.1 Hierarquia de Metadados/Valores............................................................41 3.2.2 Meta-Objeto Multimdia..........................................................................44 3.2.3 Criao de Meta-Objeto Multimdia ........................................................46 3.2.4 Disjuno de Meta-Objetos Multimdia...................................................47 3.2.5 Conjuno de Meta-Objetos Multimdia..................................................49 3.2.6 Mecanismo de Herana entre Meta-Objetos Multimdia..........................51 3.3 INDEXAO DE OBJETOS MULTIMDIA E ANLISE DE DESEMPENHO ..............55 3.4 RECUPERAO DE OBJETOS MULTIMDIA ......................................................61 3.5 CONSIDERAES FINAIS ................................................................................63 4 PROTTIPO METAMDIA............................................................................ 66 4.1 INTRODUO ................................................................................................. 66 4.2 LINGUAGEM UML PARA DESCRIO DO MODELO METAMDIA ....................68 4.3 DIAGRAMA DE CASOS DE USO .......................................................................69 4.4 CENRIOS ......................................................................................................71 4.5 PROJETO DE INTERFACE HOMEM/MQUINA ...................................................73 4.6 DIAGRAMA DE CLASSES ................................................................................76

xi

4.7 CODIFICAO ................................................................................................80 4.8 CONSIDERAES FINAIS ................................................................................80 5 TRABALHOS RELACIONADOS................................................................... 82 5.1 INTRODUO ................................................................................................. 82 5.2 MODELOS E SISTEMAS ...................................................................................85 5.2.1 Sistema VIMSYS....................................................................................85 5.2.2 Sistema OVID.........................................................................................87 5.2.3 Sistema QBIC..........................................................................................90 5.2.4 Sistema CIARS .......................................................................................92 5.2.5 Sistema FIBSSR......................................................................................94 5.2.6 Sistema Piction........................................................................................96 5.2.7 Sistema MARS........................................................................................98 5.3 ANLISE COMPARATIVA ..............................................................................101 5.4 DO VIMSYS AO METAMDIA...................................................................... 104 5.5 CONSIDERAES FINAIS ..............................................................................107 6 CONCLUSES E TRABALHOS FUTUROS............................................... 108 6.1 ENFOQUE GERAL .........................................................................................108 6.2 OBJETIVOS ALCANADOS ............................................................................ 109 6.2.1 Descrio de Objetos Multimdia...........................................................109 6.2.2 Compartilhamento de Metadados..........................................................110 6.3 CONTRIBUIO PRINCIPAL .......................................................................... 111

xii

6.4 TRABALHOS FUTUROS .................................................................................112 6.4.1 Modelo de Indexao e Processo de Ensino/Aprendizagem...................113 6.4.2 Mtodo de Recuperao Baseado em Similaridade................................114 6.4.3 Mecanismo de Verses.......................................................................... 114 REFERNCIAS BIBLIOGRFICAS .............................................................. 116

xiii

Lista de Figuras
Figura 1: Dado e Informao..................................................................................13 Figura 2: De Dados a Conhecimento......................................................................15 Figura 3: Metadado para Representao de tipos de Mdia..................................... 17 Figura 4: Transformao de Dados em Informao................................................20 Figura 5: Hierarquia de Indexao Multimdia.......................................................24 Figura 6: Indexao de Informao Multimdia......................................................25 Figura 7: Arquitetura do Modelo de Metadados.....................................................41 Figura 8: Hierarquia de Metadados/Valores...........................................................43 Figura 9: Meta-Objeto Multimdia .........................................................................44 Figura 10: Criao de Meta-Objeto Multimdia......................................................46 Figura 11: Disjuno de Meta-Objetos Multimdia.................................................47 Figura 12: Conjuno de Meta-Objetos Multimdia................................................50 Figura 13: Herana Simples...................................................................................52 Figura 14: Herana Mltipla entre Meta_Objetos Multimdia ................................. 54 Figura 15: ndices de Clusters do Modelo MetaMdia ............................................56 Figura 16: ndices em uma Array Triangular..........................................................57 Figura 17: Fase de Pr-Processamento ................................................................... 60 Figura 18: Representao de Ator e Caso de Uso, em UML................................... 69 Figura 19: Diagrama de Casos de Uso do Modelo..................................................70

xiv

Figura 20: Tela Principal do Prottipo MetaMdia.................................................74 Figura 21: Tela com Criao de metadados/valores para imagens..........................74 Figura 22: Tela de Conjuno ou Disjuno...........................................................75 Figura 23: Tela de Pesquisa....................................................................................75 Figura 24: Diagrama de Classes do Prottipo.........................................................77 Figura 25: Herana de Incluso de Intervalos no OVID ..........................................89 Figura 26: Do VIMSYS ao MetaMdia................................................................. 105

xv

Lista de Tabelas
Tabela 1: Metadados Descritivos............................................................................42 Tabela 2: Metadados Estruturais ............................................................................45 Tabela 3: Anlise Comparativa dos Modelos/Sistema s......................................... 101

xvi

Lista de Definies
Definio 1: Meta-Objeto Multimdia .................................................................... 44 Definio 2: Disjuno de Meta-Objetos Multimdia..............................................48 Definio 3: Conjuno de Meta-Objetos Multimdia ............................................50 Definio 4: Herana Simples entre Meta-Objetos Multimdia...............................52 Definio 5: Herana Mltipla entre Meta-Objetos Multimdia..............................54 Definio 6: Clculo do nmero possvel de ndices..............................................57 Definio 7: Clculo da Quantidade de Clusters que so visitados........................59 Definio 8: Clculo da quantidade de clusters para todos oscasos possveis........59 Definio 9: Clculo da quantidade mxima de descries a serem pesquisadas.... 60 Definio 10: Clculo da quantidade mxima de elementos a serem pesquisados ... 61 Definio 11: Algoritmo Pesquisa e Recuperao de Objetos Multimdia..............62 Definio 12: Ordem de Complexidade do Algoritmo MetaMdia.........................62

xvii

Captulo 1 Introduo
Tempos difceis tm um valor cientfico. Eles so as oportunidades Que um bom aprendiz jamais perde. Ralph Waldo Emerson

Neste captulo apresentada a motivao para o desenvolvimento desta tese, onde so enfatizadas a importncia, originalidade e relevncia do trabalho. Os objetivos da tese so apresentados, bem como um resumo dos objetivos de cada captulo.

1.1 Motivao
Nos ltimos anos, muita nfase tem sido dada ao desenvolvimento de sistemas de banco de dados multimdia [Nar96, Gro97, HSHA98, GD98, KSC99, GCJ00], os quais fazem uso eficiente de tipos de dados complexos. Esses tipos de dados podem ser imagens, grficos, seqncias de vdeo, imagens de satlite e dados cientficos, entre outros.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

1 Introduo

O tratamento desses tipos de dados, em Sistemas de Banco de Dados tradicionais [Dat99, EN99, SKS99], tem sido problemtico devido complexidade de suas estruturas, anlise de grande conjunto de dados armazenados e ao baixo desempenho de recuperao quando a pesquisa baseada em contedo efetuada. Assim, a recuperao de informao baseada na descrio de conte do tem sido alvo de inmeras pesquisas [CC98,WS99,Gor00,HMM00]. A definio das informaes que devem ser fornecidas com o objetivo de efetuar futura recuperao, de forma fcil, rpida e correta, no uma tarefa trivial. Para tanto, em banco de dados multimdia, o processo de recuperao deve incluir os tipos de consultas conhecidos dos bancos de dados tradicionais, alm das funcionalidades de pesquisas efetuadas pelo campo da recuperao da informao [YN99]. Os usurios podem navegar atravs dos dados e construir consultas estruturadas baseadas na descrio do contedo dos objetos multimdia. No contexto desta tese, um objeto multimdia um objeto composto que referencia vrios tipos de objetos, tais como vdeo, texto, som, imagem, entre outros [LZ96,Y Y97,CSBB97]. Um modelo bsico de recuperao pressupe que o objeto armazenado para ser recuperado posteriormente. Para que o objeto seja armazenado necessrio index -lo (descrev-lo). Porm, a indexao [GFSC94,AS94,CC98,BSH00] uma atividade subjetiva que corresponde identificao e representao do contedo ou do assunto de um documento de forma a caracteriz-lo. Diferentes pessoas, embora treinadas de acordo com os mesmos critrios, podem indexar de forma diferente o mesmo objeto.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

1 Introduo

A indexao de objetos multimdia pode ser feita atravs de um conjunto de metadados[AS94, CC98], os quais podem ser atribudos aos objetos multimdia com interferncia do usurio (manual), sem essa interferncia (automtica) ou com alguma interferncia (semi-automtica). A recuperao pode depender da disponibilidade desses metadados introduzidos de forma automtica ou no pelos usurios. Esses metadados podem ser baseados em conhecimentos adicionais incorporados semntica dos dados e utilizados em uma aplicao particular. Algumas das principais razes que justificam o uso de metadados, em multimdia, so: dificuldade de efetuar casamento exato de padres; dificuldade de pesquisa baseada em contedo, visto que h necessidade de anlise em grande conjunto de dados; e, quando a pesquisa baseada em contedo efetuada, a mesma no pode ser feita freqentemente devido degradao no desempenho.

1.2 Objetivos
O objetivo principal desta tese apresentar um modelo de metadados na indexao e recuperao de objetos multimdia. Enquanto na modelagem de dados, um conjunto de ferramentas conceituais utilizado para a descrio de dados, relacionamentos entre eles, a semntica de dados e regras de consistncia, na modelagem de metadados, no contexto desta tese, definido e usado um conjunto de ferramentas para indexar e recuperar objetos multimdia. Para gesto de metadados, na indexao e recuperao multimdia, necessrio decidir quais metadados devem ser coletados e mantidos, e isso no umatarefa trivial.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

1 Introduo

Uma arquitetura de informao deve ser flexvel para permitir incluso ou excluso de metadados medida que novas necessidades apaream. Assim, existem alguns problemas relacionados gesto de metadados que devem ser atacados, tais como: (i) metadados tomam uma variedade de formas; (ii) novos conjuntos de metadados so criados; (iii) diferentes usurios podem propor diferentes tipos de metadados; (iv) existem muitos usurios de metadados; (v) adoo de diferentes vocabulrios de metadados significa aumento de buscas usando vocabulrios que no so familiares. Assim, estratgias para gesto de metadados devem ser estabelecidas. As tarefas para criar um ambiente de gesto de metadados so: definir requisitos para metadados que devem estar disponveis para os usurios, desenvolver a arquitetura de gesto de metadados e implementar um sistema de gesto de metadados. O fato que representar o contedo semntico de objetos multimdia no uma tarefa fcil, visto que um mesmo objeto pode ser descrito de vrias formas, tanto por usurios distintos quanto por um mesmo usurio, em momentos distintos. Assim, um modelo de metadados de objetos multimdia baseado na descrio do contedo necessita ter grande expressividade, permitindo flexibilidade de uso. O modelo de metadados proposto nesta tese permite a indexao e recuperao de objetos multimdia utilizando uma hierarquia de metadados/valores. Atravs da hierarquia possvel definir os tipos de metadados que so permitidos pelo modelo.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

1 Introduo

A hierarquia de metadados/valores corresponde a uma especificao de metadados. Essa hierarquia uma descrio dos objetos multimdia e dos relacionamentos que podem existir entre esses objetos, gerando assim os meta -objetos multimdia. A definio de meta-objetos multimdia feita a partir de operaes para criao, conjuno e disjuno. Essas operaes permitem as relaes de agregao, generalizao e especializao de metadados/valores entre meta-objetos multimdia. Na descrio de meta-objetos multimdia o mecanismo de herana permitido. Assim, os meta-objetos multimdia podem herdar metadados/valores de meta -objetos existentes. Esse mecanismo contribui para melhorar a produtividade no desenvolvimento de sistemas de banco de dados multimdia, visto que muitas descries no precisam ser dadas, uma vez que podem ser herdadas.

1.3 Estrutura
Alm deste captulo introdutrio, esta tese composta por mais cinco captulos. No Captulo 2, Modelo de Metadados e Banco de Dados Multimdia, so abordados a conceituao bsica e os aspectos relacionados ao desenvolvimento de modelo de metadados e Banco de Dados Multimdia, evidenciando a importncia desses conceitos para a tese. No Captulo 3, MetaMdia Um Modelo de Metadados para Objetos Multimdia, apresentada a parte central desta tese. Neste captulo, mostrado como representar objeto multimdia associado a metadados. Para tanto, um conjunto de

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

1 Introduo

definies ligado a meta-objetos multimdia, indexao, pesquisa e recuperao de informao multimdia apresentado. No Captulo 4, Prottipo MetaMdia, apresentada a especificao parcial, em UML, do prottipo do modelo de metadados na indexao e recuperao de informao multimdia. No Captulo 5, Trabalhos Relacionados, so discutidos alguns dos principais trabalhos relacionados e apresentada uma anlise comparativa entre os mesmos. Os pontos destacados na anlise so: as mdias abordadas na recuperao, modelo de indexao, os mtodos de recuperao e os algoritmos de pesquisa implementados. A nfase deste captulo est nos trabalhos que abordam modelo de metadados. No Captulo 6, Concluses e Trabalhos Futuros , a tese analisada como um todo, apresentando as principais dificuldades enfrentadas p ara o seu desenvolvimento, as principais contribuies e quais as perspectivas de trabalhos futuros.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Captulo 2 Modelo de Metadados e Banco de Dados Multimdia


O verdadeiro perigo no que os computadores comecem a pensar como seres humanos, mas que os seres humanos comecem a pensar como computadores.

Sydney J. Harris

Neste captulo so abordados os aspectos inerentes a modelo de metadados e banco de dados multimdia. As propriedades e caractersticas relacionadas ao tratamento da informao multimdia so discutidas.

2.1 Introduo
Os sistemas de banco de dados tradicionais [Dat99, EN99, SKS99] utilizam tipos de dados simples, tais como nmeros e strings, para representar e manipular informaes

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

textuais tais como registros de empregados ou dados cientficos. A formaliza o das consultas geralmente expressa atravs da lgebra relacional e os resultados requerem pouco mais que um terminal textual para a apresentao. Os sistemas de banco de dados multimdia [YY97,CSBB97,Gro97,GM98, Ass98,GD98,CNY98, KSC99,GCJ00] esto voltados para aplicaes que interagem com o usurio, fazendo uso simultneo de diversos tipos de mdia, tais como udio, imagens estticas, imagens em movimento, grficos, textos, entre outras. Esses sistemas, alm de suas caractersticas peculiares, tm que manter, tambm, as propriedades inerentes aos sistemas convencionais: consistncia de dados, segurana de dados, restries de integridade, consulta e recuperao de dados. Durante o processo de atualizao (criao, remoo ou modificao), a visualizao consistente dos dados tem que ser mantida, a fim de permitir que todos os usurios tenham a mesma viso desses dados. A inconsistncia entre duas entradas representando o mesmo fato um exemplo de perda de integridade. Procedimentos de validao so definidos para serem executados sempre que seja tentada uma operao de atualizao no banco de dados. Os sistemas devem garantir que a grande quantidade de informaes diferentes, que do entrada no banco de dados, possa ser consultada e recuperada de f orma segura e consistente. Para descrever os aspectos inerentes a Modelo de Metadados e Banco de Dados Multimdia, este captulo organizado como segue. Na Seo 2.2 so tratados os

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

conceitos bsicos para entendimento desta tese. As caractersticas ineren tes aos sistemas de banco de dados multimdia so descritas. Na Seo 2.3 so descritos os aspectos inerentes a modelos de metadados. Na Seo 2.4, a indexao de informao multimdia descrita. Na Seo 2.5, a recuperao de informao descrita, enfat izando os mtodos de recuperao e os algoritmos que os implementam. Na Seo 2.6, os aspectos para armazenamento de dados so abordados. Finalmente, na Seo 2.7, concludo o captulo com algumas consideraes gerais sobre o mesmo.

2.2 Conceitos Bsicos


Nesta seo so tratados os conceitos bsicos inerentes a banco de dados multimdia. Esses conceitos so: multimdia, dado, informao e objeto multimdia.
2.2.1 Multimdia

O termo Multimdia aplicado a sistemas de software ou hardware, que processam vrias formas de mdia eletrnica, tal como vdeo, imagem, grfico, animao e textos, entre outras. A multimdia descreve os tipos de dados que apresentam tanto contedo esttico como dinmico [SD99]. No contexto deste trabalho utilizado o termo multimdia tanto para dados dependentes de tempo (vdeo, por exemplo) quanto para os independentes de tempo (imagem esttica, por exemplo). O termo mdia pode ser associado a diferentes significados, como mostra a classificao [SL95] apresentada a seguir:

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

10

Mdia de Percepo Este tipo caracteriza-se pela maneira com que os usurios tomam conhecimento da informao contida no ambiente de computao. Essas informaes podem ser percebidas atravs das md ias visuais (por exemplo, imagem) e auditivas (por exemplo, discurso). Mdia de Representao Este tipo caracteriza-se pelo formato das mdias quando representadas no ambiente computacional. Por exemplo, as informaes do tipo texto podem ser representadas no formato ASCII, EBCDIC, entre outros. Mdia de Apresentao Este tipo refere-se s ferramentas e dispositivos para efetuar a entrada e sada de dados. Por exemplo, os formulrios, monitores de vdeo ou caixas de som so mdias usadas para pe rmitir a sada de informao para o usurio. J o teclado, mouse, cmara de vdeo e microfones so mdias de coleta de informao dos usurios. Mdia de Armazenamento Este tipo caracteriza-se pela forma como as informaes multimdia so armazenadas. Por exemplo, algumas informaes so armazenadas atravs de microfilmagem, em disco rgido ou CD -ROM. Mdia de Transmisso Este tipo caracteriza-se pelos meios fsicos de transmisso de dados contnuos de um local para outro. Por exempl o, dados podem ser transmitidos atravs de uma rede. Mdia de Intercmbio de Informao Este tipo caracteriza-se pelos dispositivos que so utilizados na troca de informao entre diferentes locais.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

11

Por exemplo, a informao pode passar por mdias de armazenamento, atravs da transmisso direta, via rede de computadores ou atravs do uso combinado de mdia de transmisso e armazenamento. Esta ltima corresponde tipicamente ao sistema de correio eletrnico. Os sistemas que permitem suporte especial para informaes multimdia tratam aspectos de armazenamento, transmisso, manipulao e apresentao de mdias. Esses aspectos tm avanado muito nos ltimos anos devido s tecnologias que se tornaram disponveis, tais como: discos ticos para armazenamento de informaes que fornecem grande espao de armazenamento, redes de alta velocidade para compartilhamento de recursos eficientemente, e estaes de trabalhos sofisticadas para processamento e apresentao de mdia. As aplicaes da vida real ficaram mais interessantes de serem abordadas atravs do uso da multimdia. Por exemplo, o uso de udio e vdeo em aplicaes educacionais permite melhor apresentao de informao aos usurios. Alm do mais, a multimdia tem maior impacto em aplicaes voltadas para usurios sem nenhum conhecimento de processamento de dados. Algumas dessas aplicaes esto relacionadas a: educao, automao de escritrio, rea mdica, bibliotecas, museus e turismo, entre outras. Na educao, as apresentaes possuem tipicamente pa lavras, figuras, vdeos e vozes; livros possuem palavras e figuras, mas no existem razes para que um livro eletrnico no possua tambm narraes e animaes.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

12

Em automao de escritrio, as aplicaes incluem ferramentas para criao e recuperao de documentos, manuteno de calendrios de compromisso, entre outras. Um banco de dados para sistemas de automao de escritrios deve permitir solicitaes pertencentes a agendas, documentos e contedo de documentos. As informaes podem ser representadas de vrias formas, alm de serem processadas/armazenadas de vrias maneiras diferentes. Por exemplo, mensagens de telefone, fax e documentos. Na rea mdica, os registros de pacientes podem consistir de histricos de casos, raios-X, anotaes de consultas, resultados de testes, etc. E ainda, vrias tcnicas recentes de processamento de imagens geram dados digitais ou vdeo, diretamente, tais como: tomografia computadorizada, ressonncia magntica e ultra -sonografia. Bibliotecas e museus possuem grandes quantidades de dados da literatura e artefatos arqueolgicos que podem, convencionalmente, ser recuperados atravs de ndices manualmente gerados. A recuperao pode ser feita, tambm, atravs de umtour multimdia, onde amostras (imagens estticas, som de instrum entos exibidos, etc.) do que o visitante encontrar em cada uma das galerias so mostrados. Assim, ao visitante permitido selecionar o roteiro atravs de uma tela sensvel ao toque, por exemplo. Em conferncias podem existir aplicaes para preparao derelatrios de viagens, de criao de documentos multimdia compostos de dados sobre despesas, documentos adicionais digitalizados (por exemplo, recibos de hotis e passagens), comentrios de voz sobre a conferncia e uma amostra de uma ou mais palestras, obtidas atravs da digitalizao de um vdeo.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

13

Em turismo podem existir aplicaes que permitam navegar virtualmente atravs de um museu, conhecer as principais obras, ter comentrios de voz das obras, vdeos mostrando a vida dos autores e assim por diante. Enfim, as aplicaes multimdia podem ser as mais diversas possveis e trazem benefcios a todas as reas do conhecimento e em todos os nveis sociais, econmicos e culturais.
2.2.2 Dado e Informao

Os dados so fatos relativos a pessoas, lugares, eventos ou outros objetos e conceitos. Esses dados so armazenados em algum dispositivo. Um dado uma abstrao, podendo ter valor e ser usado de diferentes formas. A um dado, em geral, so associadas as seguintes caractersticas : identificao, valor e tempo. O valor dos dados depende da habilidade dos usurios para inteligentemente acess-los, atravs de pesquisas baseadas em descrio de contedo, habilidade em determinar quais dados so teis, alm de estimar o tempo para recuperao mais eficiente. O dado corresponde a matria-prima originalmente obtida de uma ou mais fontes e informao corresponde ao resultado do processamento e/ou refinamento de um dado (Figura 1).
Dado Processamento Informao

Figura 1: Dado e Informao

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

14

A informao deve ser mostrada em um formato conveniente para fins de tomada de deciso ou para ser utilizada em outras atividades organizacionais. Em outras palavras, informao um dado com associao semntica.
2.2.3 Objeto Multimdia

Um objeto multimdia um objeto composto que referencia vrios tipos de objetos, tais como vdeo, texto, som, imagem, entre outros. Ele pode ser dividido em partes que contm textos, imagens, e assim por diante [LZ96,YY97,CSBB97]. Um modelo de objetos multimdia deve possibilitar a captura da estrutura de objeto, incluindo seus atributos, contedo, comportamento e funes. Os atributos e contedo dos mesmos esto diretamente relacionados. J o comportamento de um objeto definido como um conjunto de mensagens que ele entende e responde. As funes de um objeto so definies explcitas do mundo real, representadas no Sistema de Gerenciamento de Banco de Dados. Alm de capturar informaes a respeito dos objetos, um modelo deve capturar informaes a respeito dos relacionamentos entre os objetos. Agregao e herana so dois relacionamentos populares e largamente utilizados em modelos ps -relacionais. O relacionamento de agregao captura a noo de objetos complexos. O relacionamento de herana captura a hierarquia de classes bem como instancia um tipo de objeto. A definio de informaes a respeito de objetos multimdia pode ser feita atravs de modelos de metadados. Na seo seguinte este ponto abordado.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

15

2.3 Modelo de Metadados


Metadado, basicamente, corresponde a uma informao que descreve um dado [AS94, CC98]. Metadados so dados que descrevem atributos de um recurso. Eles do suporte a um nmero de funes: localizao, descoberta, avaliao, documentao, seleo, entre outras. Metadados so dados associados com objetos que ajudam usurios a conhecerem sua existncia ou caractersticas. Um Modelo de Metadados fornece o contexto para entender os dados atravs do tempo. Os metadados fornecem as ferramentas para transformao dos dados em conhecimento (Figura 2). No enfoque desta tese, o modelo de metadados permitir transformar objetos multimdia armazenados em conhecimento dos mesmos, atravs da indexao e recuperao.
Dados Multimdia

Metadados

Conhecimento

Figura 2: De Dados a Conhecimento

Os metadados provem uma descrio concisa a respeito do dado. O dado pode ser um documento, uma coleo de documentos, grficos, tabelas, etc. Por exemplo, a definio de uma classe, em orientao a objetos, um metadado. Os modelos so inerentemente metadados, visto que descrevem os ti pos sendo modelados. As aplicaes do mundo real, tais como catlogos e dicionrios, tm metadados. Implementaes de linguagens tambm utilizam metadados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

16

Em banco de dados, informaes a respeito dos dados so to importantes quanto os dados. Os Sistemas de Gerenciamento de Banco de Dados Relacionais [SKS99] tambm utilizam metadados. As tabelas no banco de dados so usadas para armazenar informaes. De forma similar, um Sistema de Gerenciamento de Banco de Dados Relacional tem vrias meta-tabelas que armazenam definies das tabelas. Assim, uma tabela de dados pode armazenar o fato de que a capital do Brasil Braslia, a capital da Inglaterra Londres e a Capital da Frana Paris. Uma meta -tabela armazenaria o fato que um pas tem uma cidade como capital.
2.3.1 Classificao de Metadados

No contexto multimdia, metadados podem corresponder a referncias a dados, as quais so utilizadas para facilitar a recuperao baseada em descrio de contedo. A seguir descrita uma classificao para metadados[BR94]. Metadado para Representao de Tipos de Mdia So informaes adicionais que so importantes para fins de representao de dados multimdia. Essas informaes podem ser utilizadas para apresentao desses dados. Exemplos deste tipo de metadado incluem formato de codificao e tcnicas aplicadas para compresso de dados. Na Figura 3, para cada tipo de mdia o metadado Formato pode assumir um valor. No caso de vdeo, que pode ser uma seqncia combinada de udio/vdeo, sua codificao pode ser em diferentes formatos, tais como PAL (Phase Alternating Line), SECAM (Sequential Coleur Avec Memoire) e NTSC (National Television Systems

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

17

Committee), e armazenados no computador usando um formato MPEG (Motion Picture Expert Group).
Vdeo Imagem Texto udio Formato: MPEG Formato: JPEG Formato: ASCII Formato: PCM

Figura 3: Metadado para Representao de tipos de Mdia

O metadado para formato de imagem pode ser o JPEG ( Joint Photographic Expert Group). No caso de texto, o formato pode ser o ASCII ou EBCDIC. O metadado para formato de udio pode ser o PCM ( Pulse Coded Modulation) Metadado para Descrio de Contedo Esse tipo de metadado descreve o contedo do objeto ou dos componentes do mesmo. A descrio pode ser feita manualmente, de forma automtica ou semi-automtica, dependendo do tipo de mdia tratada. Um exemplo tpico uma lista de pessoas ou instituies relacionadas ao contedo de um objeto multimdia. Essa lista de pessoas fornecida pelo usurio de forma manual. Vale ressaltar que o objetivo desta tese criar um modelo de metadados para descrio de contedo, com operaes que permitam o reuso de descries de objetos multimdia j efetuadas. Metadado para Classificao de Contedo A classificao de contedo consiste em informaes adicionais que podem ser derivadas do contedo do documento. Este tipo de metadado pode ser gerado de forma automt ica ou

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

18

semi-automtica. Por exemplo, a classificao pode ser feita pelo nvel de conhecimento do leitor sobre determinado tema. Metadado para Composio de Documentos Componentes lgicos de documentos multimdia tm certa semntica como parte do docu mento. Metadado para composio de documentos permite conhecimentos de caractersticas dos relacionamentos entre componentes de documentos. Este tipo de metadado s faz sentido para documentos multimdia e no para tipos de dados simples. Por exemplo, os modelos de hipermdia podem ter

metadados para descrever os componentes e os relacionamentos entre eles. Metadado para Histria de Documentos Em ambientes de publicaes multimdia comum registrar o status de dados multimdia. Este tipo de metadado serve tanto para um documento como para componentes individuais, tais como data da ltima atualizao de um determinado documento. Metadado desse tipo pode ser registrado automaticamente ou no. O nome do autor de documentos, data de autoria e os relacionamentos derivados em modelos de verses so exemplos desse tipo de metadado. Metadado para Localizao de Documentos Os objetos multimdia no so duplicados ou distribudos, desta forma so acessados de acordo com a necessidade de cada usurio. Metadados so utilizados para localizar documentos. A informao sobre a localizao de certos documentos e como esses podem ser acessados so exemplos desse tipo de metadado.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

19

Metadado Estatstico Este tipo de metadado quantifica a freqncia dos documentos ou componentes de documentos com certas caractersticas. Os aspectos de desempenho, acessos e freqncia de apresentao de documentos em determinado perodo de tempo tambm so exemplos de metadado estatstico.
2.3.2 Metadados no Contexto Organizacional

Inicialmente, os metadados eram incorporados aos programas de aplicao. Depois, os Sistemas de Gerenciamento de Banco de dados incluram metadados em seu dicionrio de dados e catlogos. Data Warehouse [Inm99,SKS99], por exemplo, pode possuir modelos de metadados que ajudam a mapear dados de diversas fontes e armazenar esses dados sob um esquema nico. Os metadados no contexto da organizao esto relacionados em duas categorias: tcnicos e de negcio. Metadado Tcnico a descrio dos dados necessria a vrias ferramentas que permitem o armazenamento, manipulao ou movimentao dos dados. Dentro dessa categoria esto todos os tipos de metadados classificados na Seo 2.3.1. Metadado de Negcio a descrio de dados necessria aos usurios de negcio para entender o contexto do negcio e o significado dos dados. Por exemplo, a descrio de sistemas de aplicaes financeiras.Muitas organizaes no fazem o melhor uso de seus dados porque os mesmos no so bem gerenciados. Uma das razes a falta de conhecimento do significado dos mesmos. A informao gerada no obedece s

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

20

mesmas leis econmicas de outros patrimnios. O valor da informao aumenta com o uso e diminui com o tempo. O valor da informao au menta quando combinada com outra informao. At hoje a transformao de dados em informao tem sido conduzida por tecnologia. Os avanos tecnolgicos esto sendo integrados pela organizao. Esta integrao ajuda a gerenciar no s a informao, mas tambm as formas nas quais as pessoas aprendero, influenciaro e compartilharo a informao com outros. Com isso, quando o dado somado com o contexto, o resultado a informao (Figura 4). Um modelo de metadados vai permitir definir o contexto onde os dad os so manipulados. Esse contexto envolve a representao da estrutura e o tempo aplicado a cada tipo de informao.

Dado + Contexto = Informao


Figura 4: Transformao de Dados em Informao

A tecnologia de metadados est surgindo em funo das necessidades das organizaes conhecerem melhor os dados que elas mantm e conhecer com mais detalhes os dados de outras organizaes. A catalogao dos dados propiciar a maior utilizao deles por usurios com mltiplos interesses. organizaes que no documentam seus dados, com o decorrer do tempo, ficamsujeitas superposio de esforos de coleta e manuteno de seus dados, vulnerveis a problemas de inconsistncia e pagaro um alto custo pelo no uso ou uso imprprio dessa informao.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia


2.3.4 Gesto de Metadados

21

Na estratgia de gerenciamento de metadados difcil decidir quais metadados devem ser coletados e mantidos. Em geral, uma arquitetura de informao deve ser f lexvel para permitir aumentar ou diminuir a quantidade de metadados medida que novas necessidades apaream. Alguns dos problemas relacionados gesto de metadados so: Os metadados tomam uma variedade de formas metadados podem ter a forma de atributos, funes, modelos, objetos, entre vrias outras. Novos conjuntos de metadados so criados cada modelo de metadados pode flexibilizar a criao de conjunto de metadados. Diferentes usurios ou comunidade de usurios podem querer novos conjuntos d e metadados. Diferentes usurios podem propor diferentes tipos de metadados similar criao de conjunto de metadados, um gerenciador de metadados deve tornar acessvel ao usurio a criao de vrios tipos de metadados. Porm, neste contexto deve existir a preocupao de criar metadados com mesma semntica. Por exemplo, migrar dados de diferentes fontes de dados para um data warehouse. Os usurios dessas diversas fontes podem criar diferentes tipos de metadados que pode no resultar integrao. Existem muitos usurios de metadados a grande quantidade de usurios gera grande quantidade de informaes que no so conhecidas por todos os usurios. Assim, no gerenciamento de metadados necessrio pensar em

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

22

como esses usurios podem compartilhar esses dados. Um modelo de metadados pode permitir o conhecimento dos dados existentes no ambiente. Adoo de diferentes vocabulrios de metadados - significa aumento de buscas usando vocabulrios que no so familiares. necessrio permitir que um modelo uniformize a gesto dos metadados e o vocabulrio usado pela comunidade de usurios. As tarefas para criar um ambiente de gesto de metadados so: definir requisitos para metadados que devem estar disponveis para os usurios; desenvolver a arquitetura de gesto de metadados; selecionar quais as ferramentas devem ser incorporadas na infraestrutura de gesto de metadados; desenvolver os programas que integram as ferramentas selecionadas para atender as necessidades especficas da organizao; desenvolver e executar um programa de treinamento para os usurios. Existem poucas organizaes que constroem suas prprias ferramentas de gesto de metadados. A Web e Data Warehouse, por exemplo, evidenciam a necessidade da gesto de metadados atravs da utilizao de padres internacionais e novas ferramentas de gerenciamento. MPEG-7 - Multimedia Content Description Interface [Mar01], constitui um padro para descrio de contedo de dados multimdia, o qual d suporte s interpretaes do significado das informaes. No contexto desta tese, um modelo de metadados proposto para indexao e recuperao de informao multimdia. Para tanto, nas sees seguintes so abordadas a indexao e recuperao de informao.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

23

2.4 Indexao de Informao


A indexao[GFSC94,AS94, Kow97,CC98,BSH00], originalmente chamada catalogao, a tcnica mais antiga para identificao do contedo de um dado para sua posterior recuperao. O objetivo da indexao permitir que uma coleo de dados possa ser recuperada posteriormente pelos usurios da informao. A indexao permite identificar e representar o contedo ou o assunto de um documento de forma a caracteriz-lo. Um documento deve ser indexado tendo-se em mente no apenas o seu armazenamento, mas principalm ente sua futura busca e recuperao. A processo de indexao, em multimdia, pode ser caracterizado como uma atividade subjetiva. Diferentes pessoas, embora treinadas de acordo com os mesmos princpios (critrios), podero indexar de forma diferente o mes mo objeto. A Indexao, em sistemas de banco de dados multimdia, pode ser hierrquica e em quatro nveis (Figura 5) [Gro97]: de aplicao, de atributos e valores, de estrutura e de mapeamento entre objetos implementados e o modelo de objetos. No nvel deaplicao, existem ndices para aplicaes multimdia. No segundo nvel, os atributos e valores de objetos multimdia so tratados como ndices. No nvel de estrutura, existem ndices para os objetos multimdia propriamente ditos. No nvel de mapeamento en tre objetos implementados e o modelo de objetos, a indexao feita entre os objetos codificados e o modelo de objetos multimdia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

24

Nvel de Aplicao Nvel de Atributos/Valores Nvel de Objetos Complexos Mapeamento entre objetos implementados e o modelo de objetos
Figura 5: Hierarquia de Indexao Multimdia

O sistema multimdia dever permitir a construo dos quatro nveis de indexao. Para que recuperaes sejam feitas no banco de dados multimdia necessrio que os objetos sejam analisados, de modo que descries de seu contedo possam ser extradas e armazenadas no banco de dados juntamente com os objetos originais. As descries so, ento, utilizadas para recuperao e permitem determinar quais informaes satisfazem os critrios de seleo das consultas ao banco de dados. Os componentes (Figura 6) que aparecem no processo de indexao so objeto multimdia, indexador, anlise, linguagem de indexao , modelo real e objetos armazenados, os quais so descritos a seguir. A atividade de atribuir metadados a um objeto multimdia sempre precedida da anlise conceitual do mesmo, usando a linguagem de indexao. Tal linguagem possui metadados/valores que podem ser associados aos objetos e funes que os manipulam. Os objetos multimdia podem ser descritos tendo como referncia um conjunto de metadados,

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

25

os quais podem ser extrados manualmente ou mecanicamente, sem interferncia do usurio.

Objetos Armazenados

Objetos Recuperados

Modelo Real

Modelo de Pesquisa

Anlise

Pesquisa

Linguagem de Indexao

Indexador

Pesquisador

Objeto Multimdia Indexao

Questes Recuperao

Figura 6: Indexao de Informao Multimdia

A partir da associao de metadados, construdo o modelo de indexao, que ser tanto melhor quanto maior for sua fidelidade ao modelo real. Quando a consulta for efetuada, o usurio deve construir um modelo de pesquisa, seguindo o mesmo modelo de indexao. No processo de recuperao, aparecem os seguintes componentes: questes, pesquisador, pesquisa, modelo de pesquisa e objetos recuperados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

26

Quando se pretende recuperar um objeto multimdia, o processo bastante similar. Primeiramente, tem que ser decidido, atravs da anlise conceitual, o que recuperar. Em seguida, tem que ser feita a traduo do modelo obtido para um modelo passvel de processamento pelo sistema derecuperao de informao que esteja disponvel. Para esta traduo indispensvel utilizar os metadados da mesma linguagem que foi utilizada durante o processo de indexao dos objetos. visvel, portanto, que a linguagem de indexao uma ferramenta comum ao i ndexador e ao pesquisador.

2.5 Recuperao de Informao


Um dado armazenado dentro de uma base deve ser estruturado de tal modo que a informao desejada possa ser recuperada. A modelagem de dados o termo utilizado para determinar quais informaes devem ser armazenadas na base e quais devem refletir os relacionamento entre os itens de dados. Tanto os usurios como os projetistas de aplicaes de banco de dados necessitam conhecer como os dados so modelados. A recuperao influenciada por fatores tais como sincronizao, linguagem de consulta, indexao, estratgias de pesquisa e recuperao baseada em contedo. Os objetos multimdia complexos impem restries de sincronizao no armazenamento e recuperao de informao multimdia. Estratgias de recuperao de dados devem

considerar restries de sincronizao quando executando uma consulta. Para a linguagem deve ser considerado que um usurio, no momento da pesquisa, pode no ter uma estratgia bem definida.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

27

As estratgias para sistemas multimdia no devem ser projetadas somente para casamento exato, mas tambm para aproximado. As pesquisas devem utilizar medidas de similaridade como construo de blocos fundamentais. Estas medidas de similaridade podem ser computadas em mais de uma dimenso. O resultado da consulta deve ser uma lista classificada em funo da medida definida. A recuperao de informao baseada no contedo caracteriza-se pelos dispositivos que so utilizados na troca de informaes entre diferentes md ias de armazenamento. Por exemplo, na passagem entre dispositivos ticos e magnticos, o armazenamento tem organizaes distintas e assim, diferentes modelos devem ser construdos. Cada dispositivo, ainda, tem seu prprio mtodo de acesso, cuja combinao introduz mais um fator de complexidade no processamento de consultas. Nas sees seguintes so descritos mtodos de recuperao de informao multimdia e os algoritmos de pesquisa que implementam tais mtodos.
2.5.1 Mtodos de Recuperao

A maneira pela qual as informaes so armazenadas e descritas tratada de acordo com o modelo de recuperao adotado, porm vale salientar que a eficincia na recuperao depende dos tipos de dados tratados, de como se pretende manter as info rmaes utilizadas para descrever o contedo de forma correta, dos modelos de recuperao permitidos s informaes e dos algoritmos de pesquisa implementados para tais mtodos. Na recuperao de informao, um objeto multimdia representado como uma coleo de aspectos. O usurio especifica o que deseja na forma de uma consulta. Dada a

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

28

representao da informao do usurio e a coleo de objetos, o sistema estima a semelhana dos dados fornecidos pelo usurio e as representaes dos objetos armazenados. Existem vrios mtodos de recuperao de informao textual na literatura, tais como [SKS99]: varredura completa de texto, inverses e clustering, entre outros. Varredura Completa de texto O usurio entra com um padro a ser pesquisado e o sistema varre o banco de dados at que um texto igual seja recuperado. Apesar da existncia de algoritmos de pesquisa de strings [CLR90] muito rpidos, varrer um banco de dados pode levar muito tempo. Mtodo de Inverses O mtodo de inverses um dos mais rpidos e adequados para ambientes estticos, ou seja, onde haja muitas consultas, porm nenhuma ou poucas modificaes. Nesse mtodo, cada entrada consiste de um padro e uma lista de endereos para os objetos onde o padro o corre. O padro pode ser implementado como uma palavra e os endereos podem ser a localizao exata da ocorrncia ou a identificao do objeto. Clustering corresponde ao agrupamento de objetos similares formando clusters. Neste mtodo pode ser necessria a reorganizao da estrutura de clusters quando acontecer incluso de novos objetos. Existem vrios modelos de recuperao de objetos multimdia, entre os quais podem ser citados: recuperao atravs de um identificador [BPJ93, OT97], por sentenas

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

29

condicionais [BPJ93, OT97], por similaridade [BPJ93, PF95] e recuperao semntica [KKH94, VAB95]. Recuperao Atravs de um Identificador Na recuperao atravs de um identificador, esse dado como ndice e o objeto recuperado. Recuperao por Sentenas Condicionais os objetos so recuperados somente se eles respondem precisamente s restries expressas na consulta. Recuperao por Similaridade No caso da recuperao de informao por similaridade no necessrio que uma informao seja e xatamente igual da consulta. Ao invs disso, a pesquisa ao banco de dados deve ser aproximada, para que todas as informaes sejam recuperadas at o grau de similaridade pr-especificado. Este mtodo de recuperao corresponde a um processo de casamento onde a relevncia dos objetos julgada de acordo com a similaridade baseada nas entradas de cada objeto e nas entradas de cada consulta. Petrakis e Faloutsos [PF95] criaram um mtodo para efetuar pesquisa por contedo baseada em similaridade, em banco de dados de imagens. O mtodo parte do princpio que existe um nmero fixo de caractersticas comuns que so esperadas para todas as imagens e um nmero varivel de caractersticas no definidas antecipadamente (no esperadas). O mtodo pode responder s consultas efetuadas atravs de exemplos, tais como: Obter todas as radiografias que so similares radiografia de Jos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

30

Recuperao Semntica O usurio expressa a informao necessria como um conceito e no como uma coleo de palavras -chave conectadas atravs de operadores lgicos. Esse mtodo tenta prover mais poder de abstrao e mecanismos de estruturao para especificao das consultas. Os dois primeiros so recuperaes simples que qualquer sistema permite, porm os dois ltimos so mais complexos visto que necessitam de algoritmos especiais.
2.5.2 Algoritmos de Pesquisa

No processamento de informaes multimdia, muitas vezes, os dados no podem ser decompostos em registros independentes, com pequenas partes identific veis. Assim, os tipos multimdia podem ser descritos atravs de strings, ou seja, seqncia de caracteres. Strings so, obviamente, centrais em sistemas de processamento de palavras, os quais possibilitam inmeras funes para a manipulao de texto. Es tes sistemas podem manipular objetos extremamente grandes, tais como um livro com milhes de caracteres. Como conseqncia, algoritmos eficientes so de grande importncia para manipular tais objetos. Em multimdia, a recuperao de dados pode recair na r ea de busca e comparao de seqncias. Um problema clssico nesta rea o casamento (exato) de padres ( string matching) [Mel96]. Tal problema consiste em, a partir de um string texto de tamanho n e um padro de tamanho m, obter uma ou todas as ocorrncias do padro no texto. Os principais algoritmos de busca atravs de strings [Mel96] so: KMP, Boyer Moore e algoritmo de string-matching via autmatos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

31

2.5.2.1 Algoritmo KMP O algoritmo KMP (Knuth-Morris-Prat) compara um padro com um texto, caractere a caractere. Porm, quando caracteres de posies correspondentes diferem, ou seja, quando ocorre um mismatch, o KMP aproveita a informao que os caracteres do padro (ou parte dele) casaram com o texto, evitando assim comparae s redundantes. O algoritmo KMP possui uma fase de pr-processamento, onde guardado o tamanho do maior prefixo do padro casado, que igual ao sufixo desse padro casado, com o texto. Esse tamanho computado e armazenado numa tabela. O padro pode en to ser deslocado atravs da diferena entre o tamanho do padro e o tamanho do prefixo, sem que nenhum casamento seja perdido e sem efetuar comparaes desnecessrias. Esse algoritmo nunca utiliza mais que a soma do tamanho do padro e o tamanho do texto para comparaes de caracteres. O custo de tempo do KMP, para o pior caso, de O(n+m), incluindo a fase de pr-processamento. Portanto, uma boa escolha para o problema de string matching no caso em que o alfabeto possua uma quantidade grande de elementos.

2.5.2.2 Algoritmo Boyer-Moore O algoritmo Boyer-Moore compara o padro com o texto, da direita para a esquerda, ou seja, a primeira comparao feita entre o ltimo caractere do padro e o caractere do texto correspondente ltima posio do padro. Se estes so iguais, ento os caracteres

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

32

da posio precedente do padro e do texto so comparados, e assim por diante. Ou seja, a busca por ocorrncias do padro no texto feita normalmente, da esquerda para a direita, apenas a comparao feita da direita para a esquerda. Na ocorrncia de um mismatch, o algoritmo move o padro para a direita, escolhendo o maior dos deslocamentos propostos por duas heursticas: mau caractere e bom sufixo. O deslocamento do padro efetuado com base nas heursticas que , na ocorrncia de um caractere do padro diferente do respectivo caractere do texto, buscam pela ocorrncia mais direita do caractere do texto que provocou o mismatch na heurstica do mau caractere ou aproveitam as informaes de que um sufixo do pa dro casou com o texto, no caso da heurstica do bom sufixo. Esse algoritmo utiliza mais que a soma do tamanho do padroN com o tamanho do texto M de comparaes de caracteres. O algoritmo utiliza N/M passos se o alfabeto no for pequeno e o padro no for longo. Portanto, esse algoritmo a melhor escolha quando textos de tamanho grande so considerados. No Boyer-Moore, no pior caso, o custo de tempo quadrtico, porm para casos prticos, ele sublinear. 2.5.2.3 Algoritmo de String Matching via Autmatos Os algoritmos anteriores fazem uso de pr-processamento, a fim de reduzir o tempo de execuo. Outro modo de efetuar tal pr-processamento atravs da construo de autmatos finitos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

33

Um algoritmo de string matching via autmatos examina cada caractere do texto exatamente uma vez. Um conjunto finito de estados rotulado de forma ordenada. O primeiro e o ltimo elemento desta ordem so os estados inicial e final do autmato. O alfabeto de entrada o mesmo sobre o qual esto definidos o padro e o texto. No autmato, nmeros so associados aos estados. Alcanar um determinado estado indica que houve casamento dos primeiros caracteres, correspondentes ao nmero desse estado, do padro com o texto. Em outras palavras, a transio para um estado n realizada apenas se ocorrer casamento com n-1 caracteres do texto. O custo de tempo de um algoritmo de string matching via autmatos, aps a construo do autmato, para o pior caso, de O(n).

2.6 Armazenamento de Objetos


Atualmente, podem existir dados multimdia armazenados fora do banco de dados, em sistemas de arquivos. Quando o nmero de objetos multimdia relativamente pequeno, os recursos fornecidos por um banco de dados no so importantes. A funcionalidade e integridade do banco de dados tornam -se importantes quando grande o nmero de objetos multimdia armazenados. Por exemplo, um filme pode ter trs horas de durao e pode necessitar de vrios gigabytes, mesmo depois de compactado. As informaes multimdia podem ser armazenadas em um sistema de banco de dados por diferentes mecanismos. A seguir so apresentados quatro tipos, os quais podem aparecer, juntos ou no, em um sistema de gerenciamento de banco de dados [RNL95].

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia Referncias Externas

34

Os bancos de dados possuem referncias para os objetos multimdia originais. Tais referncias podem ser nomes de arquivos ou outros identificadores que permitem localizar o dado no ambiente. Adicionalmente, as referncias contm dados descritivos modelados como atributos ou relacionamentos. Por exemplo, atributos de uma fita de vdeo [JH94] podem ser seu comprimento, o dispositivo de sada aplicado, seu formato de compresso e a descrio textual do contedo. Vale ressaltar que o prottipo do modelo MetaMdia proposto nesta tese implementa esse tipo de mecanismo. Campos Longos Os campos longos podem armazenar vrios Gbytes de dados e podem ser usados como domnio para atributos. Essencialmente, podem ser acessados parcialmente. Um sistema de gerenciamento de banco de dados d suporte para dados armazenados em campos longos. Entretanto, o contedo ainda no interpretado e as operaes oferecidas para operar nos dados so somente genricas. Funes Externas Alguns bancos de dados permitem chamar funes externas para

processamento de dados armazenados. As limitaes em linguagem de manipulao de dados, tal como SQL, so razes para introduzir chamada a funes externas. O suporte multi-usurio e autorizao podem ser aplicados

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

35

para o acesso a funes externas, mas sua execuo no pode ser controlada por um Sistema Gerenciador de Banco de Dados. Por exemplo, se um udio acionado em um dispositivo usando uma funo externa, o acesso exclusivo no pode ser garantido pelo sistema de banco de dados. Porm, as funes externas so adequadas para reuso de algoritmos existentes e ferramentas no contexto de captura e apresentao multimdia. Sistemas Orientados a Objetos ou Relacionais Estendidos Sistemas relacionais estendidos permitem que o programador defina tipos de dados abstratos e os referencie em aplicaes. Especialmente, a abordagem orientada a objetos d suporte modelagem avanada, pela construo de hierarquia de tipos de dados e definio de relacionamentos entre classes. Em alguns sistemas, mecanismos de indexao especficos podem ser estabelecidos por tipos de dados definidos pelos usurios. Os sistemas orientados a objetos oferecem suporte mais adequado para informao multimdia, mas faltam alguns aspectos tais como suporte a dados dependente de tempo, interao do usurio, consultas baseadas em contedo e tcnicas de recuperao. Muitos sistemas de banco de dados do acesso ao usurio do banco de dados que reside em uma mquina remota. Assim, a distribuio permitida se a informao multimdia armazenada em campos longos ou se um sistema orientado a objetos ou relacional estendido usado.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

2 Modelo de Metadados e Banco de Dados Multimdia

36

2.7 Consideraes Finais


Os sistemas de banco de dados multimdia gerenciam grandes quantidades de dados, q ue podem ser usados para dar suporte s aplicaes mdicas, aos sistemas de informao geogrfica, aos projetos de arquitetura, s bibliotecas fotogrficas, s galerias de artes, aos museus, s investigaes criminais, aos sistemas educacionais, entre uma srie de outras aplicaes. Esses tipos de aplicaes motivaram, nos ltimos anos, pesquisas nos aspectos relacionados aos sistemas de gerenciamento de banco de dados, tais como: tcnicas de modelagem, indexao e recuperao de objetos multimdia. As informaes multimdia podem ser representadas na sua forma original, acrescidas de informaes descrevendo o seu contedo. Essas informaes so definidas usando metadados. No captulo seguinte apresentado um modelo de metadados na indexa o e recuperao de informao multimdia. Os trabalhos relacionados com esta tese so apresentados no captulo seguinte ao modelo de metadados, e feita uma anlise comparativa do modelo proposto com os sistemas existentes. A evoluo de modelos na ltima dcada apresentada no final, para enfatizar a relevncia, originalidade e abrangncia do modelo proposto. O prottipo do mesmo descrito no Captulo 4.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Captulo 3 MetaMdia Um Modelo de Metadados para Objetos Multimdia


Existe o mundo das idias e o mundo da prtica. Mathew Arnold

Neste captulo apresentada a principal contribuio desta tese. A arquitetura e os aspectos inerentes ao modelo de metadados multimdia so definidos. A indexao, o mtodo de recuperao e o algoritmo que implementa tal mtodo so tambm apresentados.

3.1 Introduo
Um banco de dados multimdia contm imagens grficas, clipes de v deo, arquivos de som, textos, entre outros. E assim, o objeto armazenado no banco de dados multimdia deve ser descrito de tal modo que o mesmo possa ser facilmente localizado e recuperado.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

38

A indexao usada para determinar quais dados devem ser armazenados para descrever os objetos multimdia e permitir a pesquisa e recuperao dos mesmos. As pesquisas realizadas pelos usurios de banco de dados convencionais tendem a ser altamente estruturadas, enquanto usurios de sistemas de banco de dados multimdia podem desejar realizar consultas baseadas na descrio do contedo de um objeto multimdia. Esta tarefa pode ser difcil se no existirem modelos que permitam a indexao de objetos multimdia no momento de sua criao. No caso de um processo demorado para identificar uma caracterstica, pode ser indexado aps a criao. Assim, nesta tese apresentado um modelo de metadados para auxiliar no processo de indexao e recuperao de objetos multimdia. Uma das vantagens obtidas com a definio do modelo de metadados o ganho em termos de tempo, visto que no ser necessrio acessar inmeros objetos at encontrar o objeto desejado. Outra vantagem que no uso de descries de objetos existentes, as informaes desses objetos so herdadas pelo novo objeto, permitindo o

compartilhamento de metadados/valores entre meta -objetos multimdia. Para apresentar tal modelo de metadados, o captul o estruturado como segue. Na Seo 3.2, apresentada a estrutura do modelo de metadados. Na Seo 3.3,

apresentada a indexao de informao multimdia. Na Seo 3.4, so apresentados os aspectos relacionados com a recuperao de informao. Finalme nte, na Seo 3.5, so apresentadas as consideraes gerais do captulo. No Captulo 4 so descritos e analisados alguns trabalhos relacionados. Tambm so apresentados no Captulo 4, uma anlise
Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

39

comparativa do MetaMdia com esses trabalhos e um estudo evolutivo desses trabalhos, na ltima dcada.

3.2 Modelo de Metadados


O processo tradicional de indexao envolve determinar os dados que sero armazenados e os relacionamentos que existem entre eles. As tabelas de banco de dados tradicionais podem ser usadas para descrever os dados formatados. Atualmente, existem duas abordagens para modelo de dados multimdia. A primeira considera que as tcnicas e metodologias usadas em indexao convencional so estendidas para banco de dados multimdia. A segunda reconhece a natureza particular dos dados multimdia, como um objeto complexo. Para tanto, podem existir informaes associadas com tais objetos que so classificadas como segue: O prprio objeto, que composto de outros objetos. Um usurio pode visualizar todo ou somente parte do objeto. Por exemplo, uma seqncia de vdeo um agregado de objetos dos tipos vdeo, udio e texto. As caractersticas e propriedades que definem o objeto , tais como o formato do registro, durao de vdeo, tamanho do frame e tcnicas de compresso. Atributos que descrevem o objeto complexo e seus relacionamentos com outros objetos do banco de dados , muitas vezes descritos como atributos abstratos, tais como ttulo, diretor, data da produo e est dio de produo. Adicionalmente, operaes/mtodos sobre os objetos multimdia so definidas e essas operaes diferem daquelas que operam sobre os dados tradicionais mantidos dentro de

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

40

um banco de dados. Os objetos multimdia so objetos do mundo real, a t is como clipes de vdeo ou imagens grficas. Em bancos de dados convencionais so conceitos abstratos que descrevem objetos do mundo real. Por exemplo, o banco de dados de empregado mantm as informaes a respeito de empregados de uma organizao e no o prprio empregado. O banco de dados multimdia mantm as informaes do mundo real e no atributos dos mesmos. Tendo em vista o exposto, nesta tese proposto um modelo de metadados que permite indexar (descrever) objetos multimdia com o objetivo de recuper-los. A arquitetura do modelo de metadados (Figura 7) composta por trs mdulos: hierarquia de metadados/valores, esquema de metadados e os objetos multimdia propriamente ditos. O primeiro mdulo a hierarquia de metadados/valores que corresponde expresso semntica e pragmtica de aplicaes particulares. Conceitos so definidos como metadados/valores pelos usurios. Neste contexto, o usurio definir os tipos de metadados e valores que fazem parte da aplicao. O segundo, esquema de metadados, criado para os objetos multimdia indexados. Os metadados/valores so criados para os objetos, gerando os meta -objetos multimdia. O terceiro mdulo corresponde aos objetos multimdia armazenados e descritos para futura busca e recuperao.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

41

Objetos Multimdia

Esquema de Metadados

Hierarquia de Metadados/valores

Figura 7: Arquitetura do Modelo de Metadados

Nas subsees seguintes apresentada a semntica dos elementos que compem o modelo de metadados: hierarquia de metadados/valores, meta -objeto multimdia, operaes bsicas, herana em uma hierarquia de generalizao/especializao. Esses elementos so definidos atravs de um formalismo matemtico [Oom94], baseado na teoria dos conjuntos.
3.2.1 Hierarquia de Metadados/Valores

A hierarquia de metadados/valores, apresentada nesta tese, uma especificao de conceitos, isto , uma descrio dos conceitos e relacionamentos que podem existir para um conjunto de objetos multimdia. A generalizao de uma representao para vdeo, so m, imagem e texto, pode ser feita em um domnio de aplicao. Para apresentar o MetaMdia, um conjunto de metadados/valores apresentado (Tabela 1), como exemplo, para uma agncia de Publicidade, que trabalha com todos esses tipos de objetos multimdia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia M M1 M2 M3 M4 M5 M6 M7 M8 M9 Metadados Localizao Tipo de Imagem Classe da Imagem Colorao Profissional Formato do Filme Perspectiva Orientao ngulo Valores Central, Esquerda, Direita Paisagem, Objetos, Retrato, Nu Realismo, Pictorialismo Colorida, Preto e Branco Experiente, Amador 35mm, Slide Area, Terrestre, Close Vertical, Horizontal Baixo, Nvel do Olho, Alto Interior, Exterior, Nublado Randmica, Regular, Orientada Azul, Vermelho, Verde A que ponto pertence a histria Esporte, documentrio, romance Tem objetos, no tem objetos Azul, vermelha, ... Verde, azul, amarelo, ... Incio, fim Nome Data Filme, vdeo Do Filme, da msica, do artigo, ... Outdoor, spot, vdeo, anncio, jingle
Tabela 1: Metadados Descritivos

42

M10 Ambiente M11 Textura M12 Cor Predominante M13 Tempo do Frame M14 Classe de vdeo M15 Tipo de vdeo M16 Luminosidade do ambiente M17 Cor do objeto M18 Palavras-chaves de udio M19 Informao de produtor M20 Data de produo M21 Mdia original M22 Ttulo M23 Tipo de Pea

A representao tabular (Tabela 1) utilizada para melhor evidenciar os metadados/valores sugeridos para a aplicao, os quais so nomeados como descritivos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

43

Esses metadados so gerados manualmente pelo usurio. As colunas correspondem a: (i) M a designao simblica dos metadados que so utilizados na construo da seqncia de caracteres (strings) para a descrio de cada objeto; (ii) os metadados que pode m ser utilizados na aplicao; e (iii) alguns valores que esses metadados podem assumir (entre outros). Na Tabela 1, o M1 representa o metadado Localizao e possui os seguintes valores: Central, Esquerda e Direita. Assim, a lista M= [M1, M2, ... Mn], onde o n variar em funo do nmero de metadados definidos para a aplicao, corresponde aos metadados. Os valores dos metadados so listados da seguinte forma: M1 = [V11, V12, ... V1m], M2 = [V21, V22, ..., V2m], e assim por diante, onde o m variar em funo do nmero de valores assumidos para cada metadado. Os metadados/valores, que aparecem na Tabela 1, so colocados em uma hierarquia (Figura 8) representada por um grafo acclico dirigido [SKS99]. Neste tipo de grafo, um metadado/valor pode ter mais de um metadado de mais alto nvel. Por exemplo, o valor Azul tem dois metadados de mais alto nvel Luminosidade do ambiente e Cor.
Raiz

Localizao

Tipo da Imagem

...

Central

Esquerda

Direita

Paisagens

Nu

Objetos

Retratos

Figura 8: Hierarquia de Metadados/Valores

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

44

Assim, por exemplo, o metadado localizao, pode ser visto como um objeto genrico, dos valores: central, esquerda e direita. O metadado raiz representar a aplicao multimdia que pode ser descrita com os metadados/valores definidos .
3.2.2 Meta-Objeto Multimdia

Um meta-objeto multimdia (Figura 9) consiste no identificador de objeto multimdia (Ido) e em uma lista de metadados/valores d = [m1:v1, ..., mn:vn], que descreve o objeto multimdia. Assim, os meta-objetos multimdia correspondem s descries de objetos multimdia. Esses objetos podem descrever objetos do tipo vdeo, imagem, som, texto e documento.

Ido

m1:v1, ..., mn:vn

Figura 9: Meta-Objeto Multimdia

Os valores dos metadados tanto podem ser um dado simples como um dado complexo. Esse dado pode ser um conjunto de valores e um meta -objeto multimdia definido recursivamente. Na Definio 1 apresentado o meta -objeto multimdia formalmente representado. Definio 1: Meta-Objeto Multimdia Um meta-objeto multimdia uma tupla (ido, d), onde ido o identificador do objeto multimdia, e d uma lista [m1:v1,...,mn:vn], onde cada mi (1 i n) um nome de metadado e vi o valor do mesmo. O valor vi pode ser do tipo atmico (nmeros ou strings), do tipo conjunto ou do tipo lista definido recursivamente.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

45

Dados dois meta-objetos multimdia Obj1 = (id1, d1) e Obj2 = (id2, d2), com seus metadados/valores d1 = [m11:v11,...,m1n:v1n] e d2 = [m21:v21,...,m2m:v2m], metadados(d1) denota o conjunto de metadados em d1, e valor(d1) denota os valores de metadados do meta-objeto multimdia d1. Concat(d1,d2) denota a concatenao da descrio d1 com a descrio d2 dos meta-objetos multimdia Obj1 e Obj2. d1.mi e Obj1.mi denotam o valor vi. Como dito na seo anterior, os metadados descritivos apresentados na Tabela 1 so aqueles gerados (criados) manualmente pelo usurio na operao de criao (apresentada na Seo 3.2.3). Alm desses metadados existem os metadados gerados automaticamente (dinamicamente) nas operaes de disjuno (apresentada na Seo 3.2.4) e conjuno (apresentada na Seo 3.2.5). Esses metadados so aqueles relacionados criao simples, por conjuno ou por disjuno de meta -objetos multimdia (Tabela 2). Na criao simples, o metadado Criao assume o valor CR. Quando o meta-objeto multimdia gerado a partir de uma conjuno, ento o valor do metadado assume o valor CO. Quando gerado a partir da disjuno o metadado Disjuno recebe o valor DI. Na Tabela 2 so apresentados esses metadados e seus respectivos valores. M M1 M2 M3 Criao Conjuno Disjuno Metadados CR CO DI
Tabela 2: Metadados Estruturais

Valores

Em resumo, os metadados estruturais so gerados a partir de cada operao aplicada aos meta-objetos multimdia. Esses metadados podem ser usados pelas operaes de
Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

46

conjuno e disjuno na pesquisa e recuperao de objetos multimdia. Nas sees seguintes so apresentadas essas operaes.
3.2.3 Criao de Meta-Objeto Multimdia

A criao corresponde descrio (meta-objeto multimdia) de um objeto multimdia dado (Obj). Cada objeto multimdia no banco de dados deve possuir um meta -objeto multimdia associado. Existem trs formas de criao de meta-objetos multimdia: (i) descrio de objeto multimdia (Figura 10); (ii) disjuno de meta -objetos multimdia existentes (Seo 3.2.4); (iii) conjuno de meta-objetos existentes (Seo 3.2.5).

(Obj1, [localizao: central, nome: Rafaela, cor: cinza])

Figura 10: Criao de Meta-Objeto Multimdia

Na Figura 10, o objeto multimdia Obj1 descrito atravs dos metadados localizao, nome e cor, que possuem os valores central, Rafaela e cinza, respectivamente. A criao de um meta-objeto multimdia a partir de um objeto multimdia ocor re quando um sistema multimdia armazena um objeto. Assim, o usurio vai escolher os metadados/valores para descrever tal objeto e neste momento criado o meta -objeto multimdia. Nas sees seguintes so descritas as demais operaes.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia


3.2.4 Disjuno de Meta-Objetos Multimdia

47

A disjuno consiste na criao de um meta-objeto multimdia a partir de meta-objetos existentes (Figura 11). Na edio de objetos multimdia, os valores dos metadados dos meta-objetos existentes so unidos (agregados) em um nico meta-objeto multimdia.

(Obj1, [localizao: central, nome: Rafaela, cor: cinza])

(Obj2, [localizao: central, nome: Rafaela, cor: laranja])

(Objr, [localizao: central, nome: Rafaela, cor: {cinza,laranja}])

Figura 11: Disjuno de Meta-Objetos Multimdia

Essa operao usada para derivao automtica de descries. No processo de recuperao de informao, esta descrio ser de suma importncia visto que no precisar recuperar todos os objetos multimdia, mas si m os que aparecem na composio. Os metadados dos objetos so agregados e definidos para o novo objeto. O valor associado a cada metadado no novo objeto dado em funo de cada valor de metadado nos objetos existentes. A disjuno cria a descrio do objeto, a partir dos objetos existentes, atravs de regras de gerao simples. Se um meta-objeto possui metadados que no aparecem nos

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

48

outros meta-objetos, ento o mesmo ser gerado para o objeto resultante. Se existir o mesmo metadado nos dois objetos com valores diferentes, os valores do metadado sero atribudos para o objeto resultante em um valor do tipo conjunto.

Definio 2: Disjuno de Meta-Objetos Multimdia A operao disjuno entre meta-objetos multimdia Obj1 = (Ido1, d1) e Obj2 = (ido2, d2), denotada por Disj(Obj1,Obj2), corresponde ao meta-objeto multimdia Objr = (idr,dr=Disj(d1,d2), tal que dr = [m1:v1, ..., mn:vn], onde mi metadados(d1 d2 ) e (1 i n), corresponde a: 1. Para todo i=1,2,...,n, se mi metadados(d1) e mi metadados(d2) fazer: a) Se d1.mi = d2. mi ento Concat (dr, [mi: d1.mi]) b) Se d1.mi d2.mi ento i. Se d1.mi e d2.mi so valores do tipo atmico ento Concat(dr, [mi: {d1.mi, d2.mi}] ii. Se d1.mi e d2.mi so valores do tipo conjunto ento Concat(dr, [mi: d1. mi d2.mi]) iii. Se d1.mi e d2.mi so valores do tipo lista ento Concat(dr, [ mi: Disj(d1. mi,d2. mi)])
iv.

Se d1.mi um valor do tipo atmico e d2.mi um valor do tipo conjunto ento Concat(dr, [ mi: {d1.mi} d2.mi]

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia v.

49

Se d1.mi um valor do tipo conjunto e d2.mi um valor do tipo atmico ento Concat(dr, [ mi: d1.mi {d2.mi}]

2. Para todo i=1,2,...,n, mi metadados(d1) e mi metadados(d2) ento Concat(dr, [mi: d1.mi]).


3.

Para todo i=1,2,...,n, se mi metadados(d1) e mi metadados(d2) ento Concat(dr, [mi: d2.mi]).

A operao de disjuno permite que as descries dos objetos sejam agregadas e definidas para o novo objeto. Esta operao permite que meta -objetos multimdia sejam concatenados. Vale salientar que, todos os metadados/valores existentes nos meta -objetos multimdia so agrupados e passam a ser os metadados/valores do meta -objeto multimdia resultante. Na existncia de mais de dois meta-objetos multimdia, a operao de disjuno reaplicada quantas vezes forem necessrias.
3.2.5 Conjuno de Meta-Objetos Multimdia

A conjuno cria um novo meta-objeto a partir de meta-objetos existentes, onde o novo meta-objeto corresponde interseo dos metadados/valores dos objetos existentes (Figura 12).

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

50

(Obj1, [nome: Rafaela, cor: cinza])

(Obj2, [localizao: central, nome: Rafaela, cor: laranja])

(Objr, [nome: Rafaela, cor: {cinza,laranja}])


Figura 12: Conjuno de Meta-Objetos Multimdia

Os metadados que so comuns em ambos os objetos s o agregados pelo novo objeto. No exemplo da Figura 12, o metadado Localizao no aparece com seu valor no objeto resultante, visto que ele no comum a ambos os meta -objetos multimdia. Definio 3: Conjuno de Meta-Objetos Multimdia A conjuno entre meta-objetos multimdia Obj1 = (Ido1, d1) e Obj2 = (ido2, d2), denotada por Conj(Obj1,Obj2), o meta-objeto multimdia Objr =

(idor,dr=Conj(d1,d2)), tal que dr = [m1:v1, ..., mn:vn], onde mi (metadados(d1) metadados(d2)) e (1 i n), corresponde: 1. Para todo i=1,2,...,n, mi metadados(d1) e mi metadados(d2) faa a. Se d1.mi = d2. mi ento Concat (dr, [mi: d1.mi]) b. Se d1.mi d2.mi ento

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

51

i. Se d1.mi e d2.mi so valores do tipo atmico ento Concat(dr, [mi: {d1.mi, d2.mi}] ii. Se d1.mi e d2.mi so valores do tipo conjunto ento Concat(dr, [mi: d1. mi d2.mi]) iii. Se d1.mi e d2.mi so valores do tipo lista ento Concat(dr, [ mi: Conj(d1. mi,d2. mi)])
iv.

Se d1.mi um valor do tipo atmico e d2.mi um valor do tipo conjunto ento Concat(dr, [ mi: {d1.mi} d2.mi]

v. Se d1.mi um valor do tipo conjunto e d2.mi um valor do tipo atmico ento Concat(dr, [ mi: d1.mi {d2.mi}] A conjuno permite que os metadados/valores do meta-objeto multimdia resultante sejam aqueles que so comuns para os objetos envolvidos. Assim, permitir que a consulta de objetos multimdia retorne como resultado somente os objetos que casam exatamente com os padres especificados na consulta.
3.2.6 Mecanismo de Herana entre Meta-Objetos Multimdia

A herana, numa hierarquia de generalizao e especializao, o meio pelo qual valores de metadados de meta-objetos multimdia mais especficos so herdados do objeto mais genrico. A generalizao uma forma de abstrao em que um conjunto de objetos semelhantes considerado em um objeto de nvel mais alto, com os detalhes de nvel mais baixo suprimidos. A generalizao corresponde a um relacionamento onde, a partir

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

52

de propriedades comuns de diferentes meta-objetos, criado outro meta-objeto. A especializao corresponde ao processo inverso generalizao. A generalizao de objetos permite definir valores de metadados para os met aobjetos multimdia de baixo nvel a partir de objetos de mais alto nvel. Existem dois tipos de herana no modelo de metadados: simples e mltipla. A herana simples (Figura 13) o mecanismo que, numa hierarquia de generalizao, as propriedades de somente um objeto de nvel mais alto so herdadas.

(Obj1, [localizao: central, nome: Rafaela, cor: cinza])

(Obj2, [cor: laranja])

Figura 13: Herana Simples

Definio 4: Herana Simples entre Meta-Objetos Multimdia A herana simples entre dois meta-objetos multimdia Obj1 = (Ido1, d1) e Obj2 = (ido2, d2), denotada _Um(Obj1,Obj2), onde Obj2 herda os metadados/valores do

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

53

meta-objeto Obj1. O Obj2 = (ido2, d2=_Um(d1, d2)), tal que d1 = [m1:v1, ..., mn:vn], onde (1 i n), corresponde a: 1. Para todo i=1,2,...,n, se mi metadados(d1) e mi metadados(d2) ento a) Se d1.mi d2.mi ento i. Se d1.mi e d2.mi so valores do tipo atmico ento d2.mi = {d1.mi, d2.mi} ii. Se d1.mi e d2.mi so valores do tipo conjunto ento d2.mi = d1. mi

d2.mi

iii.

Se d1.mi e d2.mi so valores do tipo lista ento d2.mi = _um(d1. mi,d2. mi)

iv.

Se d1.mi um valor do tipo atmico e d2.mi um valor do tipo conjunto ento d2.mi = {d1.mi} d2.mi

v.

Se d1.mi um valor do tipo conjunto e d2.mi um valor do tipo atmico ento d2.mi = d1.mi {d2.mi}

2. Para todo mi metadados(d1) e mi metadados(d2) ento d2 = Concat(d2, [mi: d1.mi]). A herana mltipla (Figura 14), por outro lado, permite que as propriedades sejam herdadas de mais de um objeto de nvel mais alto.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

54

(Obj1, [localizao: central, nome: Rafaela, cor: cinza]) (Obj2, [localizao: central, nome: Rafaela, cor: laranja])

(Obj3, [E_um:{Obj1,Obj2}, nome: Salete])


Figura 14: Herana Mltipla entre Meta_Objetos Multimdia

Definio 5: Herana Mltipla entre Meta-Objetos Multimdia Supondo que existe um meta-objeto multimdia Obj1=(ido1,d1). Dado Obj={Obj11, Obj12, ...,Obj1n}, o conjunto de todos os meta-objetos multimdia no banco de dados, tal que Obj _um Obj1 para cada Obj1i = (id1i,d1i). multimdia Obj1=(id1, d1) onde: d1 = _Um(d11,d1) _Um(d12,d1). Neste tipo de herana pode haver conflitos de metadados entre o objeto de nvel mais baixo e o de nvel mais alto. No modelo proposto este problema solucionado atravs da unio de metadados/valores. Assim, o modelo, pela herana de metadados/valores, facilita o compartilhamento de dados.

O meta-objeto

_Um(d12,d1)

...

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

55

O mecanismo de herana do Modelo MetaMdia no implica em efeito cascata, o qual exigiria muito processamento, visto que esse mecanismo de herana controlado via hierarquia de metadados/valores.

3.3 Indexao de Objetos Multimdia e Anlise de Desempenho


O modelo proposto baseado na composio de meta -objetos multimdia atravs de metadados/valores. No mtodo baseado no casamento exato, dado um padro e a descrio de um objeto multimdia, o resultado tem todos os documentos que satisfazem pelo menos os metadados/valores introduzidos na consulta. O tempo utilizado numa busca por ocorrncias do padro pode influenciar significativamente o desempenho de um algoritmo. Uma forma de efetuar a busca por tais ocorrncias de um modo mais eficiente atravs da construo de um ndice de texto, ou seja, uma coleo de elementos que apontam para posies estratgicas no texto. Assim, a representao da informao multimdia organizada em Clusters (Figura 15), que possuem ndices apontando para posies estratgicas no banco de dados. Os Clusters so agrupamentos de informaes que possuem determinados metadados/valores (AB e ABC, por exemplo). Esses metadados so utilizados para a construo de ndices. As organizaes em Clusters podem levar a diferenas significativas na eficincia de um sistema, visto que agrupam dados que so freqentemente acessados, e permitem que os mesmos sejam fisicamente armazenados de uma forma que maximiza o acesso

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

56

seqencial. Em suma, o agrupamento de objetos em Clusters tem dois objetivos principais: facilitar o intercmbio entre estes objetos e diminuir o espao de busca.
Descrio AB Clusters AB AB AC AB ABC Obj1 Obj3

Clusters AC AC ACD ndice de Clusters de Metadados

Descrio ABC Obj5 Obj7

ndice de MetaObjetos Multimdia

ndice de Objetos Multimdia

Objetos Multimdia

Figura 15: ndices de Clusters do Modelo MetaMdia

Na Figura 16 so apresentados os ndices organizados de forma seqencial, em umarray triangular [CH97] W, que usado para otimizar o acesso aos Clusters. Os ndices so construdos atravs do uso de pelo menos dois valores de metadados, os quais so representados por letras maisculas.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia Smbolo/ndice B/1 C/2 AB AC A/0 BC B/1 C/2 D/3 E/4 F/5 G/6 H/7 I/8 J/9 K/10 D/3 AD BD CD E/4 AE BE CE DE F/5 G/6 H/7 I/8 AF AG AH AI BF BG BH BI CF CG CH CI DF DG DH DI EF EG EH EI FG FH FI GH GI HI J/9 AJ BJ CJ DJ EJ FJ GJ HJ IJ K/10 AK BK CK DK EK FK GK HK IK JK

57 L/11 AL BL CL DL EL FL GL HL IL JL KL

Figura 16: ndices em uma Array Triangular

O array triangular otimiza o acesso aos dados visto que, dado um ndice, podem ser localizados mais rapidamente quais os Clusters a serem pesquisados. A estrutura de ndices para clusters, dentro de um array triangular, construda em funo da quantidade de metadados/valores definidos para a aplicao. O critrio utilizado nesta tese a combinao do nmero de metadados, 2 a 2. P or exemplo, se forem utilizados 12 metadados, tem-se 66 ndices para Clusters possveis. A preocupao criar ndices para o nmero de metadados especificados. A Definio 6, generaliza, para o nmero possvel de ndices. Definio 6: Clculo do nmero possvel de ndices i = C2 m onde m corresponde ao nmero total de metadados. Portanto, o nmero mximo de Clusters com ndices correspondentes a combinao de m, 2 a 2. A principal vantagem desta abordagem o fato de no ser necessrio pesquisar uma parte significativa do banco, mas apenas subconjuntos dele. Cada vez que um dado

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

58

armazenado no banco de dados, o mesmo organizado de acordo com critrios estabelecidos. A seguir mostrado como pesquisado um padro: AxY, onde x X = [ B, C, D, ...] e Y qualquer palavra construda ordenadamente e de qualquer tamanho com smbolos pertencentes a X. Por exemplo, ABCDEFG um padro para a pesquisa. O x corresponde a B e o Y corresponde a CDEFG. Para x = B, o Cluster a ser pesquisado ser aquele com ndice AB. No cluster AB podem existir descries ABC, ABCDEFG, entre outras. Nestas descries, o y o complemento alm do AB. Para x = C, os clusters a serem pesquisados sero aqueles com ndices AB e AC. Para x = D, trs clusters tm que ser pesquisados, AB, AC e AD. Portanto, medida que o x aumenta, o nmero de clusters a serem pesquisados tambm aumenta. Ento para x = L, os clusters que devem ser pesquisados sero todos os Ax, isto , AB, AC, ..., AL. Assim sendo, no melhor caso, pesquisado em s um cluster, mas no pior caso a pesquisa seria feita em onze clusters. importante observar que medida que as informaes no so forn ecidas, mais clusters tero que ser pesquisados para verificar a existncia da descrio. A vantagem desta abordagem que, mesmo que poucas informaes sejam fornecidas, a busca no ser feita em todo o banco. Isto porque, mesmo no pior caso, no uso de 12 (doze) metadados, a busca ser efetuada em 56 clusters e esses no correspondem totalidade do banco, o qual possui 66 Clusters. A Definio 7, generaliza, para o pior caso, o clculo da quantidade de clusters que so visitados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia Definio 7: Clculo da Quantidade de Clusters que so visitados c= i - (m - 2)

59

onde i o nmero de ndices para clusters existentes (Definio 7) e m o nmero mximo de metadados utilizados. A Definio 8, fornece, para um dado ndice, quantos Clusters so visitados em todos os casos possveis, inclusive o pior caso. Definio 8: Clculo da quantidade de clusters para todos os casos possveis
x

q = (y - x) + j
j=0

onde x o ndice do primeiro smbolo e y o ndice do segundo smbolo. Por exemplo, para o ndice DI, o ndice x ser igual a 3 e o ndice de y ser igual a 8. Ento, aplicados esses valores na Definio 8 a pesquisa feita em onzeClusters. De modo a diminuir o nmero de pesquisas desnecessrias em clusters que no possuem ocorrncias da informao desejada, foi criada uma fase de pr -processamento, onde so armazenadas as informaes que so encontradas naquelecluster. A fase de pr-processamento corresponde ao registro da ocorrncia de determinados padres nas descries armazenadas nos clusters. O nmero de padres varia de cluster para cluster. Esse registro vai ser feito em uma lista que conter todos os padres possveis para um dado cluster com suas respectivas quantidades de meta-objetos multimdia. O xn, na Figura 17, a quantidade de descries, que existe para o padro, n o cluster especfico. A, B, C, ..., AB, AC, ..., etc. so substrings que podem estar em uma
Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

60

dada descrio no cluster AB. Se, por exemplo, no cluster no existem descries com BC, ento a quantidade de descries de BC zero. Vale ressaltar que todos os possveis ndices devem estar na lista.
A x1 B X2 C x3 ... ...
Figura 17: Fase de Pr-Processamento

AB

AC

...

BC

BD

BE

... xn

Na Figura 17, para o padro AxY, o nmero de elementos de cada Cluster o prprio tamanho do Cluster. Assim, se o Cluster com ndice AB no tem elementos, o mesmo no ser pesquisado e assim diminui-se o tempo de pesquisa. J para o padro BxY, o nmero de ocorrncias de Bx em AB colocado no array. Por exemplo, se x for C ento verificado se existem ocorrncias de BC nos Clusters com ndices AB e BC. Se em AB no ocorre BC ento o Cluster no pesquisado. Assim, se no houver ocorrncias do padro no Cluster, nenhuma leitura seqencial feita, e como conseqncia o tempo de resposta diminui. Caso ocorra, uma pesquisa seqencial efetuada dentro doCluster. Depois de agrupados dentro dos clusters, todos os meta-objetos multimdia com ndices correspondentes, a quantidade mxima de meta -objetos multimdia que o cluster possui e, para o pior caso, a serem pesquisadas ser calculada pela Definio 9. Definio 9: Clculo da quantidade mxima de meta-objetos a serem pesquisados
m -1

cl = 1 + C jm-2
j=1

onde m o nmero mximo de metadados permitidos. No pior caso, a quantidade mxima de meta-objetos a serem pesquisados calculada pela Definio 10.
Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

61

Definio 10: Clculo da quantidade mxima de elementos a serem pesquisados


v = c.cl

onde c a quantidade de clusters a serem pesquisados e cl o mximo de elementos para um determinado cluster, calculado pela Definio 9. O algoritmo verifica quais os clusters a serem pesquisados e em seguida busca a informao.

3.4 Recuperao de Objetos Multimdia


Na Seo anterior foi apresentada a indexao de objetos multimdia via o modelo de metadados proposto. As estruturas de indexao foram apresentadas e definies foram feitas. Nesta seo apresentado o algoritmo que implementa o mtodo de recup erao de objetos a partir da estrutura de indexao apresentada. O algoritmo que implementa o mtodo MetaMdia (Definio 11) apresentado atravs do casamento exato de padro. Dado um conjunto de metadados/valores, o resultado ser no mnimo, os objetos que casam com a especificao dada. Objetos com informaes adicionais so apresentados, mas possuem as informaes que foram introduzidas para a consulta.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia


Algoritmo incio Padro P = M 1M2...Mn k=0 ID = M 1M2 para i=0,...,x -1 efetuar para j=0,...,(x -(i+1)) efetuar ICk = W[i][j] INFO[k] = (IC k, CONT k) k=k+1 para j=0,...,(y -(x+1)) efetuar ICk = W[x][j] INFO[k] = (IC k, CONT k) k=k+1 para i=0,...,(k -1) efetuar se CONT i > 0 ento IC i = [DESC 0, ..., DESC w] para j=0,...,w efetuar se ID ocorre em DESC j ento Mostrar mdias associadas Ler prxima descrio Fim.
Definio 11: Algoritmo Pesquisa e Recuperao de Objetos Multimdia

62

A partir de um padro, todos os objetos multimdia associados a tal padro so pesquisados e recuperados. No algoritmo, ID o ndice para o padro P e dado pelo usurio que est pesquisando alguma informao; x e y so os ndices do primeiro e segundo smbolo no ID, respectivamente; W o array que contm os ndices; CONTk o nmero de ocorrncias do padro ID no cluster ICk (esta informao adquirida durante a fase de pr-processamento); e finalmente, DESCj so as descries que ocorrem dentro do cluster ICk. O custo de tempo, para o algoritmo MetaMdia, medido pela Definio 12. Definio 12: Ordem de Complexidade do Algoritmo MetaMdia O(mv)

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

63

Onde m o nmero mximo de metadados permitidos e v o nmero mximo de elementos que so verificados, para o pior caso (Definio 10). As principais caractersticas desejadas na construo e utiliza o de objetos e metaobjetos multimdia so: rapidez na recuperao dos objetos (aspectos de eficincia), processo de atualizao fcil (aspectos de tempo) e economia de armazenamento (aspectos de espao). O processo de armazenamento de grandes objetos e seus respectivos metadados/valores no difcil, mas a recuperao conforme metadados/valores de uma consulta requer cuidados mais elaborados. Assim, ao construir a estrutura de indexao para auxiliar a recuperao de objetos multimdia, foi verificado q ue os objetos multimdia no necessitam ser alterados, mas sim suas descries e os ndices correspondentes.

3.5 Consideraes Finais


Neste captulo foi apresentado o modelo de metadados na indexao e recuperao de objetos multimdia. Esse modelo de metadados corresponde a um conjunto de ferramentas conceituais usadas para a descrio de objetos multimdia, com o objetivo de indexar e recuperar os mesmos. O modelo de metadados tem como base um conjunto de meta -objetos multimdia, os quais correspondem a estruturas que descrevem objetos multimdia. Os meta -objetos multimdia possuem uma identificao do objeto multimdia e a sua descrio atravs de metadados e valores.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

64

Para manipular essa estrutura foram definidas as oper aes de criao, disjuno e conjuno de meta-objetos multimdia. Para definio dessas operaes teve -se como dificuldade inicial o fato que os valores de metadados podem ser de vrios tipos (por exemplo, atmicos, conjuntos e listas). Uma vez criada esta estrutura, os mesmos tm que ser indexados, em um banco de dados, de forma a permitir a pesquisa e recuperao de objetos multimdia. Assim, os metadados so analisados e uma estrutura de ndices construda. Esses ndices so atribudos a clusters de meta-objetos multimdia, os quais so agrupamentos de metadados/valores conforme as definies criadas. As organizaes de ndices tm suas prprias vantagens e desvantagens. A escolha da estrutura apropriada para um dado conjunto de dados pode ter um im pacto significante no desempenho. Se pesquisas so freqentes, classificar o arquivo ou construir um ndice importante. Um ndice uma coleo de dados de entrada que d suporte recuperao eficiente de dados que tem um dado padro de pesquisa (metada dos/valores). Os ndices podem ser classificados como agrupados (clusters) ou no agrupados. A diferena tem importante implicao no desempenho das pesquisas e recuperaes de objetos multimdia. Essas variaes so independentes das estruturas de ndic es usadas para localizar os objetos multimdia. Em todo o processo de indexao dos metadados/valores no banco de dados, so calculadas as funes para o pior caso. Assim, foi possvel comprovar a viabilidade do modelo de metadados na indexao e recuperao de informao multimdia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

3 MetaMdia Um Modelo de Metadados para Objetos Multimdia

65

A partir do modelo de indexao do banco de dados, um algoritmo de pesquisa e recuperao foi criado. No prximo captulo apresentado o prottipo do modelo

MetaMdia. No Captulo 5 apresentada uma anlise comparativa de alguns modelos e o modelo proposto neste captulo. Alm disso, a evoluo desses modelos na ltima dcada tambm analisada.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Captulo 4 Prottipo MetaMdia


O melhor jeito de multiplicar o conhecimento dividi-lo.

David Cohen

Neste captulo apresentada a especificao parcial, em UML, do prottipo do modelo de metadados na indexao e recuperao de informao multimdia.

4.1 Introduo
Os sistemas multimdia so ferramentas poderosas que esto mudando a maneira de adquirir o conhecimento e que do uma nova viso da realidade. Um sistema multimdia caracteriza-se pelo tipo de informao que especificada, manipulada, editada e armazenada. O modelo de indexao multimdia aumenta o poder de expressividade semntica para os dados desses sistemas, possibilitando ao usurio extrair o mximo de informao do banco de dados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

67

O uso de abstraes permite ao usurio modelar e ver os dados em muitos nveis, facilitando a modelagem de situaes do mundo real, visto que meta -objetos multimdia em muitos nveis consistente com o modo que as pessoas vem o mundo. Por exemplo, um objeto multimdia pode herdar meta-objetos multimdia de objetos j existentes. A generalizao e especializao de meta-objetos permitem que descries sejam feitas uma vez e no inmeras vezes. Nesta tese, foi proposto um modelo metadados na indexao e recuperao de objetos multimdia. Essas aplicaes impem um modelo de dados que permite uma definio natural e flexvel, e um esquema que permita representar a composio de objetos e os relacionamentos entre seus componentes. Neste apndice descrito o prottipo que implementa o modelo de indexao e recuperao. Essa especificao est elaborada segundo a Metodologia UML [Con99, Lar99]. Os diagramas de casos de uso, diagrama de acompanhamento de eventos, projeto interface homem/mquina telas do sistema, diagrama de classes e descrio das classes, mtodos e atributos so apresentados. Para validar o modelo apresentado, este captulo foi estruturado como segue. Na Seo 4.2, apresentada uma breve descrio da linguagem UML. Na Seo 4.3, so apresentados os diagramas de casos de uso do prottipo. Na Seo 4.4, so apresentados os diagramas de acompanhamento de eventos. Na Seo 4.5, apresentado o projeto de interface homem/mquina, as telas do sistema. Na Seo 4.6, apresentado o diagrama de classes do modelo. Nessa mesma seo, so descritas cada uma das classes e suas

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

68

propriedades (atributos e operaes). Na Seo 4.7 so descritos aspectos de codificao. Na Seo 4.8 feita uma avaliao da implementao do prottipo e feita as consideraes gerais do captulo.

4.2 Linguagem UML para Descrio do Modelo MetaMdia


A Linguagem UML (The Unified Modeling Language) [Cor99, Lar99] uma linguagem padro para especificar, visualizar, documentar e construir artefatos de um sistema e pode ser utilizada em todos os processos do ciclo de desenvolvimento de software, e em diferentes tecnologias de implementao. Os principais objetivos desta linguagem so fornecer aos usurios uma linguagem de modelagem visual expressiva e pronta para uso visando o desenvolvimento de modelos de negcio; fornecer mecanismo de extensibilidade e de especializao para apoiar conceitos essenciais; ser independente de linguagens de programao e processos de desenvolvimento; prover uma base formal para entender a linguagem de modelagem; encorajar o crescimento no nmero de ferramentas orientadas a objeto no mercado; dar suporte a conceitos de desenvolvimento de nvel mais e levado tais como colaboraes, estrutura de trabalho, padres e componentes; e integrar as melhores prticas. Em geral, essa linguagem pode ser usada para mostrar as fronteiras de um sistema e suas funes principais utilizando atores e casos de uso; ilust rar a realizao de casos de uso com diagramas de interao; representar uma estrutura esttica de um sistema utilizando diagramas de classe; modelar o comportamento de objetos com diagrama de

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

69

transio de estado; revelar a arquitetura de implementao fs ica com diagramas de comportamento e de implantao; e estender sua funcionalidade atravs de esteretipos. Nas sees seguintes usada a Linguagem UML para especificar o prottipo do modelo de indexao e recuperao de informao multimdia proposto ne sta tese.

4.3 Diagrama de Casos de Uso


O comportamento do sistema capturado atravs da anlise de casos de uso do sistema. Um diagrama de casos de uso especifica a funcionalidade do sistema. Esses diagramas so usados para descrever o comportamento nas mais variadas situaes que ocorrem durante operao. O sistema e seu ambiente so descritos, alm da relao entre os dois. O diagrama constitudo de atores e casos de uso. Na Figura 19 est a representao desses componentes.

Figura 18: Representao de Ator e Caso de Uso, em UML

Um ator representa o papel que o usurio vai desempenhar em relao ao sistema. O ator no parte do sistema. O ator pode interagir ativamente, sem receptor, passivo de informao ou representar um ser humano, uma mquina ou outro sistema. Caso de uso a descrio de uma transao que especifica uma utilizao do sistema. uma seqncia de aes que o sistema executa e produz um resultado para o

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

70

ator. Ele modela o dilogo entre atores e o sistema. O conjunto de todos os casos de uso representa todas as situaes possveis de utilizao do sistema. Em resumo, um caso de uso um modelo de funes a serem executas pelo sistema e das interaes com suas fronteiras. A sua principal aplicao confirmar aos usurios e clientes as suas funcionalidades e comportamento. Na Figura 19, apresentado o diagrama de casos de uso do prottipo do Modelo de Metadados na Indexao e Recuperao de Objetos Multimdia.
MetaMdia Criao de Meta-Objetos

Sistema Multimdia

Disjuno de Meta-Objetos

Usurio

Conjuno de Meta-Objetos

Pesquisa Total Usurio Pesquisa Conjuno

Pesquisa Disjuno

Figura 19: Diagrama de Casos de Uso do Modelo

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

71

Uma instncia de um caso de uso corresponde a um cenrio. O caso de uso deve ser descrito atravs de vrios cenrios. Devem ser construdos tantos cenrios quantos forem os casos de uso do sistema. Na Seo 4.4 so apresentados os cenrios dos principais eventos do sistema.

4.4 Cenrios
Os cenrios correspondem a uma seqncia ordem -tempo de eventos que podem ocorrer entre objetos. Os diagramas de acompanhamento de eventos representam graficamente os cenrios. A seguir so apresentados os cenrios do prottipo MetaMdia: Criao de Meta-Objeto Multimdia, Disjuno, Conjuno de Meta-Objetos multimdia e Pesquisa de objetos multimdia a partir dos meta-objetos.

Criao de Meta-Objeto Multimdia O Sistema Multimdia armazena o objeto multimdia. O MetaMdia exibe os metadados/valores para criao do meta-objeto. Ento o Usurio informa os metadados e seus valores para indexao. O MetaMdia cria o meta-objeto

multimdia e confirma a criao do meta-objeto multimdia. O Sistema Multimdia confirma a criao do objeto multimdia e finaliza a criao do meta-objeto multimdia.

Disjuno de Meta-Objeto Multimdia O Usurio d entrada de metadados/valores que deseja para que estejam na disjuno. O MetaMdia pesquisa no banco de dados os objetos multimdia que casam com os

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

72

metadados/valores digitados. O Usurio seleciona os objetos multimdia que deseja para a disjuno. O MetaMdia faz a disjuno de meta-objetos multimdia e ento confirma disjuno de objetos multimdia. O Sistema Multimdia confirma a edio de objetos multimdia.

Conjuno de Meta-Objetos Multimdia O Usurio d entrada de metadados/valores que deseja para que estejam na conjuno. O Sistema Multimdia pesquisa na banco de dados os objetos multimdia que casam com os metadados/valores digitados. O Usurio seleciona os objetos multimdia que deseja para a conjuno. O Sistema Multimdia d entrada de objetos multimdia. O MetaMdia exibe os metadados/valores dos objetos envolvidos e faz a conjuno dos meta-objetos multimdia. Finalizando, confirma a conjuno dos objetos multimdia.

Pesquisa de Objeto Multimdia O Usurio deseja pesquisa para o Sistema Multimdia. O Sistema Multimdia exibe a tela principal de MetaMdia. O MetaMdia exibe a tela de pesquisa. O Usurio informa os metadados e seus valores para pesquisa. O MetaMdia executa o algoritmo de pesquisa (Definio 11). O MetaMdia exibe na tela o resultado para o Usurio. Esse seleciona os objetos multimdia resultantes. E en to finaliza o sistema.

Pesquisa de Objeto Multimdia por Disjuno O Usurio deseja pesquisa para o Sistema Multimdia. O Sistema Multimdia exibe a tela principal de MetaMdia. O MetaMdia exibe a tela de pesquisa. O Usurio

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

73

informa os metadados e seus valores para pesquisa. O MetaMdia pesquisa pelos objetos criados por disjuno O MetaMdia exibe na tela o resultado para o Usurio. O Usurio seleciona os objetos multimdia resultantes e finaliza o sistema.

Pesquisa de Objeto Multimdia por Disjuno O Usurio deseja pesquisa para o Sistema Multimdia. O Sistema Multimdia exibe a tela principal de MetaMdia. O MetaMdia exibe a tela de pesquisa. O Usurio informa os metadados e seus valores para pesquisa. O MetaMdia executa o algoritmo de pesquisa. O MetaMdia exibe na tela o resultado para o Usurio. O Usurio seleciona os objetos multimdia resultantes e finaliza o sistema.

4.5 Projeto de Interface Homem/Mquina


O projeto de Interface Homem/Mquina tem por objetivo apresentar um prottipo do sistema. Nesta seo so apresentadas as principais telas do sistema, com as quais o usurio ir interagir durante a realizao das operaes que o sistema lhe permite efetuar . A tela principal (Figura 20) permite que o usurio inclua objetos multimdia do tipo vdeo, imagens estticas (fotos) e som. No momento da incluso dada a opo de criao de meta-objetos multimdia, que permitiro a busca baseada em metadados. Se o objeto que est sendo criado j existe na base, a operao de criao no habilitada.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

74

Figura 20: Tela Principal do Prottipo MetaMdia

Na Figura 21, o objeto foi carregado, mas no existia o meta -objeto criado. Assim, a operao de criao permitida.

Figura 21: Tela com Criao de metadados/valores para imagens

Aps a criao, j iro aparecer no lado direito da tela principal os metadados/valores correspondentes ao objeto. A tela da Figura 22 corresponde conjuno e disjuno de objetos multimdia. Primeiro, feita uma pesquisa de objetos que se pretende fazer a

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

75

conjuno ou disjuno. Com o resultado, o usurio decide se indexa ou no o objeto com os outros objetos.

Figura 22: Tela de Conjuno ou Disjuno

A tela (Figura 23) permite a pesquisa e recuperao de objetos multimdia. O usurio d entrada aos dados para a pesquisa e os resultados so colocados. O retorno pode ser qualquer tipo de mdia que case com os metadados/valores inseridos.

Figura 23: Tela de Pesquisa

A pesquisa pode ser feita total, isto , todos os objetos existentes na base, inclusive os criados por disjuno e conjuno, so recuperados. As outras duas pesquisas so por conjuno e disjuno, respectivamente.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

76

4.6 Diagrama de Classes


Diagrama de classes um esquema, um padro ou um modelo para descrever as instncias possveis e as classes de objetos. No diagrama de classes so especificados todos os atributos, operaes e relacionamentos de todas as classes do prottipo. A diagrama de classes prov uma notao grfica para modelagem das classes e os relacionamentos entre elas. Ele adequado tanto para modelar abstraes como projetar programas, pois fcil de entender, conciso e bem prtico. Uma classe de objetos uma descrio de um grupo de objetos com atributos, comportamentos, relacionamentos com outros objetos e semntica comum. Uma classe uma abstrao que enfatiza caractersticas relevantes dos objetos, suprimindo outras. Portanto, um objeto uma instncia de uma classe. A classe de objetos representada por um retngulo, subdividido em trs reas. A primeira contm o nome da Classe. A segunda contm os atributos e a terceira contm suas operaes. Para a descrio textual da representao que cada classe do sistema, bem como a descrio de seus atributos e operaes, usado dicionrio de dados, em UML. O dicionrio de dados permite um detalhamento maior do que est descrito no Diagrama de Classes (Figura 24).

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia
Sistema Multimdia +Criao(ObjetoMM) +Indexao(ObjetoMM) +Pesquisa( ) +Recuperao( )

77

Meta-Objeto Multimdia Identificador MetadadosValores +Criao(metadado,valor) +Conjuno +Disjuno +Pesquisa 1

MetaMdia +Criao(ObjetoMM) +Indexao(ObjetoMM) +Pesquisa(Padrometadados) +Recuperao(ObjetoMM)

Herana

Valor +valor +Criao( ) +Disjuno( ) +Conjuno( )

Metadado +metadado +Criao(metadado)

ValorConjunto +valor: Set +Criao(valor) +Disjuno(valor) +Conjuno(valor)

ValorAtmico +valor +Criao( ) +Disjuno( ) +Conjuno( )

ValorTupla +valor: List +Criao(valor) +Disjuno(valor ) +Conjuno(valor )

ValorString +valor: String +Criao(valor) +Disjuno(valor) +Conjuno(valor)

ValorInteiro +valor: Integer +Criao(valor) +Disjuno(valor) +Conjuno(valor)

Figura 24: Diagrama de Classes do Prottipo

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

78

A seguir apresentada a descrio das classes, dos atributos e das operaes do prottipo. Sistema Multimdia representa um sistema multimdia que cria objetos multimdia do tipo vdeo, imagem, som, texto e documento. As operaes sobre esta classe so: criao e pesquisa de objetos multimdia. O prottipo MetaMdia no edita objetos multimdia. A partir de um sistema multimdia, no momento que o objeto multimdia armazenado, o mesmo permite criar o meta-objeto multimdia para o mesmo. A operao de criao permite dar entrada do objeto multimdia no banco de dados. A operao de pesquisa permite recuperar objetos multimdia segundo um padro de entrada. Meta-Objeto Multimdia representa todos os meta-objetos multimdia relacionados aos objetos multimdia criados. Esta classe t em as seguintes operaes: Criao, conjuno, disjuno e pesquisa. A operao de criao permite criar um meta-objeto multimdia com os seus respectivos metadados e valores (ver descrio dessa operao na Seo 4.2.3). A operao de disjuno permite a unio entre meta-objetos multimdia (ver descrio dessa operao na Seo 4.2.4). A operao de conjuno permite a interseo entre meta -objetos multimdia (ver descrio dessa operao na Seo 4.2.5). A operao de pesquisa permite a consulta e recuperao de meta-objetos multimdia. Metadado representa os metadados atribudos a um meta-objeto multimdia. Esta classe permite as seguintes operaes: criao, excluso e alterao de

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia metadados.

79

Essas operaes, como o prprio nome diz, correspondem a

criao de metadados atribudos ao meta-objeto multimdia, respectivamente. Valor representa uma classe abstrata. Ela permite a atribuio de valores aos metadados de um meta-objeto multimdia. Esta classe permite a criao de valores. Essa operao, como o prprio nome diz, correspondem a criao de valores de metadados atribudos ao meta-objeto multimdia, respectivamente. ValorConjunto corresponde a uma subclasse da classe Valor. Essa classe representa os valores do tipo conjunto. Esta classe r edefine as operaes de criao, disjuno e conjuno de valores de metadados do tipo conjunto. ValorAtmico corresponde a uma subclasse da classe Valor. Esta classe representa os valores do tipo atmico e superclasse das classes ValorString e ValorInteiro. Esta classe redefine as operaes de criao, disjuno e conjuno de valores de metadados do tipo atmico. ValorLista corresponde a uma subclasse da classe Valor. Esta classe representa os valores do tipo Lista. Esta classe redefine as opera es de criao, disjuno e conjuno de valores de metadados do tipo Lista. ValorString corresponde a uma subclasse da classe ValorAtmico. Esta classe representa os valores do tipo String. Esta classe redefine as operaes de criao, disjuno e conjuno de valores de metadados do tipo String.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

80

ValorInteiro corresponde a uma subclasse da classe ValorAtmico. Esta classe representa os valores do tipo Inteiro. Esta classe redefine as operaes de criao, conjuno e disjuno de valores de metada dos do tipo Inteiro.

4.7 Codificao
Aps a confeco de todos os diagramas, a parte final a codificao. A codificao corresponde implementao de todas as classes, com os atributos, operaes e relacionamentos entre elas. A codificao deste prottipo foi feita em Delphi 5.0 e usando todas as tcnicas de anlise orientada a objetos.

4.8 Consideraes Finais


Neste captulo foi apresentado o Prottipo MetaMdia. Existem vrias observaes a serem consideradas na implementao do modelo de metadados na indexao e recuperao de objetos multimdia, as quais so: implementao das operaes de composio e do algoritmo de pesquisa, e o grande conjunto de dados armazenados. A indidualizao das informaes multimdia, em cada conjunto recuperado, feita por inspeo visual (caracterstica subjetiva da atividade). Diferentes pessoas, mesmo treinadas de acordo com os mesmos critrios, podem indexar, tanto para armazenamento como para pesquisa e recuperao, de forma diferente uma mesma mdia, da mesma forma que diferentes pintores, mesmo seguindo uma mesma escola, expressam de forma diferente uma mesma paisagem.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

4 Prottipo MetaMdia

81

Com o Prottipo MetaMdia, o problema das diferentes vises subjetivas de uma mdia, por pessoas diferentes minimizado atravs do conjunto de metadados/valores criados para uma determinada aplicao. Esse conjunto de metadados/valores est disponibilizado via hierarquia de metadados/valores. A composio de meta-objetos multimdia feita atravs da implementao das operaes de conjuno de disjuno de meta-objetos multimdia. A composio, no Prottipo MetaMdia, permite que um usurio solicite todos as mdias que contenham os metadados/valores especificados, ou alguns deles. Neste prottipo, a recuperao exata. Isto , a pesquisa feita para que a recuperao seja executada pelo menos para todos os metadados/valores especificados. No prximo captulo so analisados trabalhos relacionados e uma anlise comparativa com o MetaMdia feita.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Captulo 5 Trabalhos Relacionados


A grande finalidade do conhecimento no conhecer, mas agir.

Thomas Henry Huxley

Neste captulo so apresentados alguns trabalhos relacionados, dando nfase aos processos de indexao, aos mtodos de recuperao e aos algoritmos de pesquisa. Uma anlise comparativa dos trabalhos, com o modelo proposto, efetuada. A evoluo dos modelos na ltima dcada analisada.

5.1 Introduo
Atualmente, o problema no reside em como armazenar grandes quantidades de informao em computadores, mas como recuperar as informaes de forma fcil, rpida e correta. A eficincia da recuperao pode depender dos tipos de dados que so tratados, das informaes utilizadas para descrio do contedo, dos mtodos de recuperao permitidos e dos algoritmos de pesquisa implementados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

83

A recuperao de informao multimdia [AZP96,CL96,ZCA96,GSJ97] no trata somente tipos de dados alfanumricos, mas tambm imagem, v deo, som, entre outros. Portanto, a eficincia na recuperao depende dos tipos de dados tratados. Esses tipos de dados esto, cada vez mais, sendo parte de ambientes de computao com processamento de strings e gerenciamento de banco de dados. As pesquisas em recuperao de informao multimdia so divididas em duas categorias. A primeira baseada em anotao de dados multimdia com texto. Nessa categoria so utilizados sistemas de recuperao de textos existentes, os quais permitem pesquisar uma informao visual, indiretamente, atravs de anotaes. A segunda representar objetos multimdia no banco de dados e usar seus atributos visuais diretamente. Podem ser usadas tcnicas de viso computacional para extrair atributos visuais de baixo nvel dos objetos multimdia, como cor, textura para imagens e parmetros de movimento para vdeo, aspectos de som, etc. Para um dado atributo, a representao e a medida de similaridade so determinadas. A representao feita atravs de uma coleo de atributos e arecuperao de objetos realizada com base na computao das distncias de similaridade entre esses atributos. A descrio do contedo pode ser realizada de forma manual, automtica ou semi automtica. O processo manual geralmente uma tarefa um tant o difcil, visto que pode depender do ponto de vista de quem estiver descrevendo o objeto. Em geral, a tarefa de descrio manual inclui os seguintes pontos: escolher uma lista de metadados, utilizar

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

84

regras para definio de metadados para objetos complexo s, e varrer objetos a fim de identificar quais metadados devem ser selecionados. Todos esses pontos resultam do fato de que o usurio que est descrevendo tem que conhecer os objetos, alm de ter que lembrar as regras para descrio. Em objetos textuais, o processo automtico muitas vezes baseado em anlises estatsticas das palavras e frases usadas no texto do documento. Porm, no caso de outras mdias outras estratgias so usadas. No caso de figuras, por exemplo, so extradas suas cores, considerando padres internacionais de definies de cores. Em geral, existem quatro mtodos de recuperao, os quais foram descritos na Seo 2.4.1: recuperao atravs de um identificador, por sentenas condicionais, baseada em similaridades e o mtodo de recuperao semntica. Os algoritmos de pesquisa implementados devem no somente recuperar, mas faz-lo de forma eficiente, rpida e correta. O algoritmo de recuperao e os processos de descrio so os principais fatores que resultam em uma recuperao eficiente. Imagem uma fonte rica e subjetiva de informao. Por exemplo, diferentes pessoas extraem diferentes significados de uma mesma imagem. Como conseqncia, sistemas de informao multimdia necessitam de recursos para transmisso, armazenamento e processamento. Esses fatores fazem a indexao, recuperao e gerenciamento de informaes multimdia um grande desafio. Neste captulo so analisados os principais trabalhos relacionados indexao e recuperao de informao multimdia. Para tanto, o cap tulo est organizado como

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

85

segue. Na Seo 5.2 apresentado um estudo dos principais trabalhos, procurando enfatizar os tipos de mdias tratadas, o processo de indexao, os mtodos de recuperao permitidos s informaes e os algoritmos de pesquisa imple mentados. Na Seo 5.3 apresentada uma anlise comparativa dos trabalhos. Na Seo 5.4 apresentado a evoluo dos modelos at o MetaMdia. Finalmente, a Seo 5.5 destinada s concluses do captulo.

5.2 Modelos e Sistemas


Nesta seo so analisados sete trabalhos relevantes sob o prisma dos tipos de mdia, indexao de informao, mtodos de recuperao e algoritmos de pesquisa implementados.
5.2.1 Sistema VIMSYS

Bach et al. projetaram o Sistema VIMSYS (Visual Information Management System) [GWJ91,BPJ93,GSJ97], com o objetivo de gerenciar informaes visuais para reconhecimento de faces humanas. A indexao feita de forma incremental e semi-automtica. Isso possvel por meio de um conjunto de atributos bsicos, onde a partir desses o usurio interage com o sistema, introduzindo novos atributos. Quando uma nova imagem inserida no banco de dados, todas as informaes associadas imagem devem ser armazenadas no banco. Os metadados e seus valo res definidos pelo usurio podem ser armazenados de uma maneira padro. Os metadados

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

86

derivados diretamente da imagem, no podem ser facilmente armazenados. Por exemplo,um grupo de pixels, formando um objeto em uma imagem, deve ser armazenado no banco de dados, mas seria impraticvel armazenar todos os pixels individualmente. A recuperao pode ser realizada atravs de um identificador, por sentenas condicionais, baseada em similaridades e semntica. A recuperao atravs de um identificador pode ser efetuada mediante consultas a qualquer um dos atributos das imagens no banco de dados. A recuperao por sentenas condicionais permite que a pesquisa seja realizada em estgios, permitindo que os critrios sejam direcionados, permitindo que o usurio ajust e os critrios das consultas a cada estgio e progressivamente consiga os resultados desejados. Este tipo de recuperao adequado quando a especificao do contedo da figura (nas consultas) est ambgua. Porm, as pesquisas ao banco de dados so caras, visto que cada vez que uma consulta efetuada, uma parcela substancial do banco de dados pesquisada. Isso pode consumir muito tempo para banco de dados com grande quantidade de informaes. A recuperao por similaridade efetuada atravs da descriode uma imagem. O sistema recupera as imagens com maior grau de similaridade quela descrio. O clculo de similaridade baseado nos valores efetuados para descrever a imagem da consulta e que esto contidos nas imagens. A recuperao semntica permitida, mas em pequenas propores. As pesquisas so restritas a poucos atributos e so limitadas, visto que a gerao das consultas

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

87

baseada em descries de imagens recuperadas atravs de consultas anteriores. No caso de no existirem consultas anteriores, o sistema permite que as consultas sejam geradas utilizando descries alfanumricas padro. Quando o usurio inicia a pesquisa, caractersticas como sexo, idade, etc., so especificadas, embora quaisquer metadados possam ser usados. Para todos os metadad os fornecidos pelo usurio so atribudos valores, sendo esses baseados em estatsticas de metadados, a fim de estabelecer a pesquisa inicial. Depois disso, esta ser executada e as imagens casadas com as especificaes desta pesquisa so retornadas. A pa rtir da, o usurio especificar novas consultas baseadas nos resultados obtidos. O sistema VIMSYS utiliza um algoritmo de segmentao para localizar cada objeto em uma imagem. Para cada objeto do domnio, os atributos e funes necessrias sero mantidos para permitir que esse objeto seja identificado e segmentado em uma imagem.
5.2.2 Sistema OVID

Oomoto e Tanaka projetaram o sistema OVID (Object-oriented Video Information Database) [OT93, Oom94, OT97,Vaz97,VVSS98] que trata infor mao do tipo vdeo. A informao pode ser recuperada atravs de um identificador e por sentenas condicionais. Essas recuperaes so efetuadas a partir de textos, que so descries (pares de atributos/valores) associadas a cenas significativas de vdeo. As descries de cenas de vdeo ou objetos do tipo vdeo so subdivididas em objetos menores, e esses herdam as descries do objeto original. Um objeto do tipo vdeo

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

88

tambm pode ser valor de um atributo em um outro objeto. Assim, cenas de vdeo podem ser descritas mais naturalmente atravs de outra cena de vdeo. As descries so definidas durante o processo de codificao e estruturao. Essas descries so armazenadas em listas. A consulta e recuperao dos objetos do tipo vdeo so feitas atravs d e uma linguagem de consulta chamada VideoSQL. O resultado da consulta uma coleo de objetos que satisfazem uma condio especificada. Antes das consultas serem avaliadas, os objetos so avaliados com base no mecanismo de herana de intervalos de vdeo. O processo de herana, deste sistema, diferente dos sistemas orientados a objetos. A herana de incluso de intervalos ocorre entre instncias e no entre classes. Os objetos do tipo vdeo pertencem a uma mesma classe. A herana de incluso de intervalos permite que informaes de um objeto A sejam herdadas por um objeto B, desde que os intervalos de B sejam definidos sobre alguma poro dos intervalos de A e os atributos estejam includos em um conjunto de atributos herdveis. Esse conjunto de atributos definido pelo usurio. Na Figura 25, por exemplo, i1 pode ser uma cena de vdeo a respeito do Presidente Fernando Henrique Cardoso, i2 a visita do Presidente na comemorao dos 500 anos do descobrimento do Brasil, a qual uma poro de i2. Sendo i3 uma cena do Presidente fazendo um discurso, que tambm uma poro da cena i1, ento razovel que os atributos e valores sejam herdados por i3. Porm, nem todos os atributos e valores de i1

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

89

devem ser herdados. Neste momento, o usurio deve definir um conjunto de atributos herdveis. i1 i2 i3
Figura 25: Herana de Incluso de Intervalos no OVID

O modelo OVID foi especificado formalmente [VVSS98], na linguagem de especificao MooZ (Modular object-oriented Z) [MCS93], onde foram expostos de maneira mais clara os conceitos apresentados neste modelo. Na especificao original de OVID [OT97], foi considerado que conjuntos de intervalos tambm podem ser valores de atributos. No entanto, ao especificar o modelo de dados OVID, chegou-se a concluso que a especificao original est inconsistente ou ento incompleta, pois: (i) nos exemplos apresentados no h meno de intervalo como valor de atributo; (ii) intervalos j so componentes de objetos e assim no h sentido em coloc-los como valores de atributo. Se realmente houver necessidade, um objeto A pode ser colocado como valor de um atributo em um objeto B, e como conseqncia, o intervalo associado a A ser associado ao atributo em B; (iii) para um intervalo ser um valor, o mesmo deveria ter a operao Is_a e o trabalho no menciona tal operao sobre intervalos. A indexao efetuada de forma manual, como ocorre em OVID, pode ter diferentes imagens armazenadas, que deveriam possuir a mesm a descrio, porm, as descries podem ser totalmente diferentes. O problema que no existem definies claras de como
Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

90

cada imagem deve ser descrita. No sistema OVID no existe um modelo de indexao a ser seguido, tornando o trabalho tedioso e podendo resultar em descries errneas. No sistema OVID, a herana bastante adequada, pois ajuda o usurio na navegao em objetos, indo de nveis abstratos para detalhes de cenas, de forma gradual. A consulta em texto, apresentada por OVID, adequada apenas se as informaes a respeito da imagem de vdeo forem necessrias, porm inadequada se for necessrio pesquisar um conjunto de imagens diferentes, onde as mesmas, ou similares a estas, devem ter a mesma descrio. Pode ocorrer que essas im agens tenham descries totalmente diferentes. O problema poderia ser resolvido se definies claras de como cada imagem deve ser descrita fossem estabelecidas. Porm, como usurios elaboram essa descrio, possibilidades de erros existem.
5.2.3 Sistema QBIC

O sistema QBIC (Query By Image Content) [NBE+93, FBF+94, LBN+94a, LBN+94b, FSN+95,TOV+95] foi projetado para tratar informaes do tipo vdeo e imagens estticas. Tanto no OVID como nesse sistema, a informao do tipo vdeo c onsiste de uma seqncia de frames, correspondendo a cenas significativas de vdeo. Um frame de cada clipe extrado ou gerado como um frame representativo do clipe. O sistema QBIC indexa fotografias. Esse sistema apresenta um conjunto bsico de atributos, o que torna mais adequada descrio dos dados multimdia, visto que tem uma base inicial a ser seguida. OVID, por no ter esse conjunto bsico, fica sujeito s descries e pontos de vista de usurios distintos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

91

A escolha do frame representativo, de forma esttica, pode ser to simples como selecionar o primeiro frame, o ltimo ou do meio. Porm, na seqncia em movimento, pode no existir um nico frame que representativo para toda a cena. Para esse caso, o QBIC constri um frame conhecimento, a partir da seqncia de frames que quer representar. Esse frame representativo armazenado no banco de dados como imagem esttica. O usurio pode recuperar imagens e/ou vdeos por padres de cor. Ele compe a consulta graficamente com as cores desejadas. O banco de dados pesquisado e as imagens com um histograma de cor similar, para aquela consulta do usurio, so recuperadas. Todas as comparaes so feitas em imagens estticas ou frames representativos. Se o frame representativo recuperado, como resultado de uma consulta, ento o usurio pode dar um duplo click na imagem para ver o vdeo clipe. Os atributos so gerados a partir da consulta grfica, ento so usados algoritmos de casamento que recuperam imagens ou vdeos do banco de dados com atr ibutos similares. Esse sistema apresenta a recuperao semntica e por similaridade. Os mtodos de recuperao so baseados em contedo de vdeo. As consultas podem ser feitas com base em padres de cor, textura, formato e posio dos objetos. O objeto pode tambm ser identificado pelo seu contorno. O usurio desenha um objeto e a curva desenhada alinhada com o contorno do objeto. Isso pode ser feito em

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

92

tempo real, tanto que o usurio desenha e a curva automaticamente casada com objeto armazenado. O algoritmo de segmentao utilizado para gerar os atributos das imagens. Para facilitar a segmentao automtica, uma representao em camada de vdeo apresentada. As diferentes camadas de vdeo so geradas pelo algoritmo e usadas para identificar objetos significativos na cena, para computaes de atributos e processamento de consultas. Nas recuperaes de vdeo so acrescentados os parmetros de movimentao de cmara, tal como zoom. As imagens podem ser recuperadas baseadas em exemplo, isto , dada uma imagem, recupera-se as imagens similares quela. No sistema QBIC, a recuperao baseada em similaridade e semntica. As consultas so efetuadas ao banco de dados utilizando imagens exemplos, esqueletos e desenhos construdos pelos usurios, ou padres de textura e cores selecionados. O algoritmo de pesquisa permite que informaes de vdeo sejam segmentadas a fim de permitir a descrio e recuperao. O algoritmo faz uso de exemplos e representao em camadas de vdeo.
5.2.4 Sistema CIARS

O sistema CIARS (Color Image Archival and Retrieval System) [BMK95] aborda a recuperao por similaridade. Esse sistema permite indexao por cor. Os atributos de cor so extrados automaticamente usando um algoritmo de clustering de cores. A indexao realizada num espao de similaridade, onde distncia entre dois pontos para uma medida

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

93

de similaridade definida proporcional similaridade entre os objetos correspondentes aos pontos. O sistema CIARS se divide em trs fases. A primeira fase corresponde a definir os clusters de cores. Esses clusters so extrados atravs do algoritmo de clusters. Esses clusters so representados como pontos em um espao tridimensional de cores. Na segunda fase, esses pontos so separados em grup os disjuntos e retngulos com limite mnimo so construdos. Finalmente, na terceira fase, esses retngulos so tratados como objetos espaciais e uma estrutura de indexao R-Tree construda. Existem trs tipos de consultas que podem ser efetuadas com a R-Tree: (i) Obter toda a rea na forma de retngulos, os quais so fechados em um ponto particular; (ii) obter todos os retngulos base que tm como interseo um dado retngulo consulta; (iii) Obter todos os retngulos base que so fechados por um retngu lo consulta. Por exemplo, para conseguir pesquisar todas as imagens que tm uma cor particular especificada pelos valores (R,G,B) preciso executar o primeiro tipo de consulta, isto , consulta por pontos. J para recuperar todas as imagens que tm uma co r que similar a uma cor da imagem da consulta, preciso executar o segundo tipo de consulta. O sistema CIARS, da mesma forma que o sistema QBIC, apresenta informao do tipo imagem esttica. Existe uma variedade de aplicaes que podem ser modeladas n o sistema CIARS, tais como a recuperao de objetos de museus e padres txteis.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

94

A indexao de atributos feita de forma automtica. Essa indexao realizada em um espao de similaridade. Os atributos correspondem a atributos de informaes visuais relacionados a cores. No sistema CIARS, a recuperao baseada em similaridade utiliza um espao de similaridade, onde os objetos contidos em um mesmo grupo so mais similares comparados com os objetos pertencentes a grupos distintos. Um algoritmo de cluster utilizado para busca. Este algoritmo tratado da mesma forma que nos sistemas tradicionais, isto , agrupa objetos similares formando clusters.
5.2.5 Sistema FIBSSR

O Sistema FIBSSR (Feature Index-Based Similar-Shape Retrieval) [MG95] permite a recuperao por similaridade. O mesmo possui uma tcnica para recuperao de figuras similares. Esta tcnica envolve trs aspectos: representao de figuras, estrutura de ndices e mtodo de acesso. Na representao de figuras, uma figura a ser armazenada no banco de dados processada para obter os limites de contorno, tambm chamados pontos de interesse. Os limites de contorno so codificados como uma seqncia ordenada de pontos de interesse. Cada atributo codificado por invariantes de escala, rotao e translao. O FIBSSR define um sistema de coordenadas, para tratar o ponto de interesse base, ao longo da coordenada x. Todos os outros pontos de interesse do atributo so transformados para o sistema de coordenadas. O ponto de interesse base pode ser qualquer ponto de interesse da seqncia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

95

Os vetores de atributos possuem a representao dos pontos de interesse, que ajudam a formar os ndices de atributos para o banco de dados de figuras. A distncia euclidiana entre dois vetores define a similaridade entre os dois atributos. Dado esta representao de atributos e a medida de similaridade, o ndice pode ser obtido atravs de qualquer mtodo de acesso a pontos multidimensionais. O processamento da consulta envolve seleo de metadad os, formao de figuras e um conjunto de figuras similares como resposta consulta. Tal processamento utiliza um algoritmo que implementa um mtodo de acesso a pontos multidimensionais, visando maximizar as chances de obter resultado satisfatrio na pesqu isa. O ndice ento pesquisado para metadados similares na figura. Na consulta especificada a tolerncia para a similaridade. As figuras, onde os metadados so apresentados, so adicionadas a um conjunto de figuras similares. Assim, as figuras que so globalmente similares so adicionadas a um conjunto final. O FIBSSR trata imagens estticas que so aplicadas em reas, tais como meteorologia, medicina, educao e explorao do espao. A indexao efetuada baseada nos limites de contorno das imagens.Esses limites so construdos a partir de um sistema de coordenadas de imagens e essas coordenadas so armazenadas em vetores. A recuperao baseada na similaridade entre dois atributos, que definida como uma distncia euclidiana entre dois vetores. Vale lembrar que os vetores possuem as coordenadas dos limites de contorno das imagens.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

96

O processamento de consulta faz uso de um algoritmo que implementa um mtodo de acesso a pontos multidimensionais, visando maximizar as chances de obter resultado satisfatrio na pesquisa.
5.2.6 Sistema Piction

O Sistema Piction [Sri92, Sri95] permite o reconhecimento e indexao de imagens de pessoas que aparecem em fotografias de jornais. Este reconhecimento feito atravs de informaes textuais e fotogrficas. Este sistema baseado na anlise das informaes que acompanham as fotos dos jornais, identificando os indivduos que aparecem nas fotografias. Existem dois pontos chaves: interpretao das informaes e localizao facial dentro da fotografia. O primeiro estgio de interpretao envolve determinar os substantivos prprios dentro do texto. Por exemplo, O presidente da repblica, Fernando Henrique Cardoso, lugares como Braslia e organizaes tais como: Universidade Federal d e Pernambuco. O objetivo principal de Piction referenciar pessoas. Em seguida, necessrio verificar quais das pessoas referenciadas realmente aparecem na fotografia. Por exemplo, a descrio: Fernando Henrique Cardoso, esteve em Porto Seguro nas comemoraes dos 500 anos do Brasil implica que Fernando Henrique Cardoso pode ser visto na fotografia. Srihari observou que palavras tais como, antes e depois so significativas para identificar quem aparece na fotografia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

97

Quando determinado quem aparece na fotografia, ento necessrio identificar dentro da fotografia quem a pessoa. As frases mais comuns, que possibilitam identificar, so: em frente de, da esquerda, da direita, que podem ser usadas. A recuperao semntica efetuada tendo como objetivo identificar faces humanas, em fotografias de jornal, baseada nas informaes descritas a respeito das fotografias. As informaes so representadas atravs de um conjunto de restries. Esse conjunto dividido em trs tipos: espacial, caracteri zao e contextual. As restries espaciais so as geomtricas ou topolgicas, tais como direita, esquerda e acima. As restries de caracterizao descrevem propriedades de objetos e so unrias por natureza, tais como cor do cabelo. As restries co ntextuais descrevem as informaes relacionadas ao local onde ocorreu o fato, o contexto da cena. Por exemplo, apartamento, aeroporto, etc. Esse sistema utiliza um algoritmo de processamento de imagem para recuperao, o qual possui duas funes bsicas que so localizar e segmentar os objetos, e extrair propriedades visuais dos mesmos. Qualquer propriedade (por exemplo, identificao de pessoas ou objetos) representada no banco de dados atravs de coordenadas das imagens. Similarmente, qualquer informao de caracterizao da imagem que seja visualmente verificada (por exemplo, cor de cabelo) tambm anotada. As informaes baseadas nas imagens determinam a presena de um indivduo ou objeto. Essas informaes podem ser quantificadas de acordo com os se guintes atributos:

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

98

(i) identificao da face; (ii) tamanho e orientao da face; e (iii) mtodo usado para identificar a face. Esses trs atributos correspondem s medidas de similaridade usadas no algoritmo de processamento de imagem para recuperao. A indexao efetuada baseada na extrao de informaes de legendas de jornais e revistas, do texto explicativo que acompanha uma foto. Esta informao pode ser usada para recuperar a foto e identificar as pessoas que aparecem nas fotos. O sistema Piction utiliza a recuperao baseada em similaridade e semntica como o sistema QBIC. Porm, Piction identifica fontes de informaes tais como similaridade objetiva de texto (casamento exato), baseada em contedo de texto (casamento no exato), objetiva de imagem (casamento exato) e contedo de imagem (casamento no exato). O sistema VIMSYS possui uma descrio para cada objeto do domnio. Essa descrio estabelece o processo de avaliao do objeto. J o sistema Piction utiliza algoritmo de processamento de imagem, mas no cita qual algoritmo. Porm, exemplifica que para cada palavra contida na consulta, um contador especifica a quantidade de ocorrncia desta palavra na descrio da imagem. Qualquer identificao positiva de pessoa/objeto feita por Piction representada no banco de dados pelas coordenadas nas imagens.
5.2.7 Sistema MARS

O Sistema MARS [ORC+97, RHM98, PC99] (Multimedia Analysis and Retrieval System) foi desenvolvido por um grupo de pesquisa na Universidade de Illinois. E sse sistema

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

99

explora a recuperao de imagens baseada em contedo. Uma imagem representada como uma coleo de atributos, tais como cor, textura, forma elayout. Esses atributos so extrados automaticamente do contedo da imagem. Na forma manual so feit as descries textuais. Na recuperao baseada em contedo, atributos visuais so extrados de imagens, tais como: cor, textura, forma e layout. As tcnicas de recuperao de informao foram modificadas para dar suporte aos atributos visuais. Especificame nte, o modelo booleano foi estendido baseado em uma interpretao fuzzy e probabilstica de operadores booleanos, os quais so usados para dar suporte ao resultado classificado da recuperao. Rui, Huang e Mehrotra [RHM98a] construram uma estrutura de c enas de vdeo, onde imagens so agrupadas em funo da semntica atribuda mesma. A sada do algoritmo um vdeo estruturado que facilita o acesso do usurio. A construo no feita totalmente automtica, uma anlise de estrutura de vdeo pode ser fei ta manualmente atravs de uma ferramenta de anlise assistida pelo usurio. O nmero de frames, imagens, grupos e cenas so resultados da construo. O usurio constri graficamente uma consulta pela seleo de imagens, a partir de uma coleo. Atributos especficos das imagens so selecionados. Por exemplo, o usurio pode especificar a recuperao de uma imagem similar a uma outra imagem levando em conta o atributo cor. A consulta do usurio interpretada como uma expresso booleana de atributos de imagens, e um modelo de recuperao booleana, adaptado para recuperao de imagens,

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

100

usado para recuperao de um conjunto de imagens classificadas com base no grau de similaridade. Consultas booleanas oferecem uma interface natural para o usurio formular e refinar as consultas conceituais para o sistema, usando atributos de imagens de mais baixo nvel. A forma mais simples para adaptar o modelo booleano para recuperao de imagens associar o grau de tolerncia para cada atributo, tal que uma imagem cas a com uma consulta se a distncia do histograma da imagem e o histograma da consulta for menor ou igual ao grau de tolerncia associado. Em MARS, implementada uma arquitetura de feedback relevante, atravs de experimentos, permitindo melhorar o desempenho consideravelmente. A abordagem baseada na interao com o usurio, onde este guia o sistema durante a recuperao usando esses experimentos. A indexao feita extraindo atributos de imagens, tais como cor e textura, automaticamente ou ainda descries feitas manualmente. No Sistema MARS, o mtodo de recuperao baseado em similaridade e por sentenas condicionais. No caso de sentenas condicionais, a consulta interpretada atravs de uma expresso booleana sobre os atributos de imagens. No caso d e similaridade, um conjunto de imagens classificado em funo de um grau de similaridade.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

101

5.3 Anlise Comparativa


Nesta seo apresentado um estudo comparativo dos sistemas descritos. A representao tabular abaixo utilizada para melhor evidenciar o resultado do estudo feito. Aspectos Mdia Sistemas OVID VIMSYS Vdeo Vdeo Indexao Manual Manual Automtica Recuperao Identificador Condicional Identificador Condicional Similaridade Semntica Similaridade Similaridade (*) Segmentao Algoritmos

CIARS FIBSSR QBIC

Imagem Imagem Imagem Vdeo Imagem Imagem

Automtica Automtica

Piction MARS

Manual Semntica Automtica Similaridade Semi-Automtica Automtica Semntica Manual Automtica Manual Automtica Semi-automtica Similaridade Condicional Identificador Condicional

Clustering Mtodo de acesso a pontos multidimensionais Clustering

Processamento de imagem Baseado em lgica Fuzzy Clustering

MetaMdia Qualquer tipo de mdia

Tabela 3: Anlise Comparativa dos Modelos/Sistemas

As linhas da Tabela 3 correspondem aos trabalhos analisados, enquanto que as colunas correspondem aos atributos que foram considerados relevantes no estudo. O (*) que aparece na Tabela 3, corresponde ao fato de no ter sido mencionado na literatura analisada. A recuperao em OVID feita por uma linguagem de consulta visual. A seguir, so feitas algumas consideraes a respeito de cada item citado.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

102

Em geral, os sistemas tratam de recuperao de informao do tipo imagem. Os sistemas OVID e QBIC tratam informaes do tipo vdeo. O sistema VIMSYS trata imagem para reconhecimento de faces. J o MetaMdia no faz distino entre os vrios tipos de mdia. A hierarquia de metadados/valores pode ser usada e o tratamento dado a qualquer tipo de mdia. Cada modelo indexa (descreve) seus objetos de forma particular. O sistema QBIC, por exemplo, indexa fotografias partindo de um conjunto de atributos e vai adequando ou acrescentando atributos conforme a necessidade, durante a consulta. A forma mais utilizada de indexao a manual, onde os usurios constroem o conjunto mnimo de atributos necessrios para indexao de objetos multimdia. Porm, alguns sistemas possuem vrias formas de indexao, incluindo a automtica ou a semi automtica. Esse o caso do VIMSYS, que permite reconhecimento de faces a partir dos atributos inseridos. O MetaMdia permite a indexao manual. Uma vez definido o conjunto de metadados/valores para uma aplicao particular, os mesmos so utilizados. O modelo de metadados no restrito em sua estrutura, ele permite que outros metadados/valores sejam incorporados e nada impede que estruturas de indexao existentes sejam adicionadas ao sistema. A estrutura bsica do modelo (meta-objeto multimdia) permite que isso seja feito, atravs da definio de um metadado e de valores para o mesmo. Assim, no impede que indexao automtica ou semi-automtica seja incorporada ao modelo, no afetando a

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

103

estrutura bsica do mesmo. Por exemplo, supondo que fosse feita a indexao automtica em uma imagem para extrao das cores da mesma. O metadado cor com todas com todos os seus valores (cores existentes) daquela imagem seriam criados. O processo de recuperao de informao pode ser feito atravs de identificador, condicional, semntica e por similaridade. O MetaMdia tem implementado a busca por identificador e condicional. O nico modelo que aborda os quatro mtodos de recuperao o VIMSYS. Maiores detalhes so explorados na prxima seo, quando so analisados os sistemas do ponto de vista de evoluo. Os algoritmos que implementam os mtodos de recuperao de cada um dos sistemas so baseados em clustering, processamento de imagens, baseado em lgica fuzzy ou segmetao de imagem. O MetaMdia prope um algoritmo baseado em clustering, mas possui uma fase de pr-processamento para verificar se existem descries ou no para o cluster a ser pesquisado. O modelo MetaMdia tenta uniformizar as diferentes vises subjetivas de uma mdia pessoas diferentes, atravs da hierarquia de metadados/valores. Atravs desta hierarquia os usurios podem descrever as mdias, no distanciando -se dos metadados/valores utilizados.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

104

5.4 Do VIMSYS ao MetaMdia


O modelo MetaMdia apresentado, nesta tese, pode tratar qualquer tipo de mdia, seja vdeo, imagens estticas, som, entre outras, podendo ser utilizado em qualquer aplicao no convencional. Nesse modelo, a indexao feita de forma manual, atravs do uso de metadados/valores que so pr-definidos pelos usurios. Alm disso, esses metadados podem ser acrescidos de outros metadados/valores, caso no sejam suficientes para descrever o objeto multimdia. O modelo possui abstraes que permitem descrever informaes de forma organizada. Para ressaltar a relevncia e importncia do modelo MetaMdia, nesta seo feita uma anlise comparativa com os sistemas descritos, procurando enfatizar a evoluo durante a ltima dcada. Na Figura 26, analisada a evoluo dos modelos, desde o VIMSYS at o modelo MetaMdia. A anlise feita em funo da estrutura de representao, indexao e recuperao de informao multimdia. Alm de analisar os tipos de objetos multimdia que os modelos tratam e recuperam. A interseo Sistema/ano representa uma publicao rela cionada ao sistema em questo. A linha cheia mostra a evoluo do sistema ao longo do tempo. A seta pontilhada representa aspectos relacionados ao modelo MetaMdia e que influenciaram o desenvolvimento do mesmo.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados
Ano Sistemas

105

1991 1992

1993

1994

1995

1996

1997 1998

1999

2000

VIMSYS OVID QBIC FIBSSR CIARS Piction MARS MetaMdia


Limites de contorno Indexao de Cor

Reconhecimento de faces Indexao Manual Indexao de Vdeo

Reconhecimento de Imagens por legendas

Recuperao baseada em atributos de objetos Modelo baseado em String-Matching Modelo de Metadados na Indexao e Recuperao Multimdia Figura 26: Do VIMSYS ao MetaMdia

O modelo VIMSYS apresentou no incio da dcada um sistema para reconhecimento de faces, que incrementalmente acrescentava atributos para recuperao de imagens. O MetaMdia permite que sejam adicionados novos metadados para recuperar objetos multimdia. medida que novos metadados e valores so acrescentados, um novo conjunto de objetos retornado. O MetaMdia pode facilmente ser utilizado para

reconhecimento de faces, desde que o conjunto de metadados seja definido pelo usurio ou extrado automaticamente das imagens, tornando o MetaMdia flexvel. O VIMSYS parte de um conjunto padro e a partir dele vai construindo a face. O sistema OVID possui um mecanismo de herana apenas entre atributos definidos para intervalos de vdeo. O modelo MetaMdia permite a herana entre meta-objetos

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

106

multimdia para qualquer tipo de mdia, desde que esse contenha o novo objeto. O MetaMdia traz como original a herana entre instncias. Atualmente, os sistemas convencionais permitem identificar um conjunto de objetos atr avs da definio de um atributos comuns que os identificam. No caso desta tese, no definido um conjunto de atributos para uma classe de objetos, mas sim para cada objeto, que corresponde ao meta objeto multimdia. O modelo MetaMdia permite indexar qualquer tipo de mdia. O modelo original no sentido de integrar representao, indexao e recuperao de objetos multimdia em um mesmo enfoque. O Sistema Piction faz reconhecimento de imagens atravs de legendas. O modelo proposto nesta tese no apresenta metadados/valores extrados automaticamente dos objetos multimdia, como o caso do MARS. Uma caracterstica importante do MARS e que o MetaMdia apresenta a recuperao baseada em atributos de objetos. A recuperao baseada no casamento de padres, onde o padro um subconjunto dos metadados utilizados para descrever o objeto multimdia armazenado. O mtodo de pesquisa e recuperao tem como vantagem no pesquisar uma parte substancial do banco de dados, mas sim apenas parte dele, mesmo parao pior caso. Isso alcanado devido indexao de informao ter sido organizada em clusters no modelo MetaMdia.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

5 Trabalhos Relacionados

107

O mtodo de recuperao proposto tem um algoritmo de pesquisa implementado, baseado na estrutura de clusters, e utiliza uma representao de array triangular que otimiza o acesso aos clusters.

5.5 Consideraes Finais


Neste captulo foram descritos e analisados os principais trabalhos relacionados com o tratamento de dados multimdia. O enfoque foi dado aos tiposde mdia tratados, o modelo de indexao, mtodo de recuperao e os algoritmos que implementam o mtodo de recuperao. Uma anlise comparativa foi feita entre esses trabalhos. Os metadados so definidos para cada item de dado e a recuperao feita e t ndo como base as suas descries e no o item multimdia. Assim, os algoritmos de string matching podem ser adequados devido ao fato de ser efetuada a pesquisa considerando as descries, as quais podem ser definidas de forma textual. Os metadados so con siderados strings no processo de recuperao. A representao multimdia genrica a ponto de permitir a descrio de qualquer tipo de mdia Finalmente, uma anlise comparativa do modelo MetaMdia foi feita com os principais modelos, desde o VIMSYS, que surgiu no incio dos anos 90. Esta anlise permitiu mostrar o que o modelo MetaMdia tem de indito e relevante para o estado da arte.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Captulo 6 Concluses e Trabalhos Futuros


Concluindo, a nova economia no est na tecnologia, seja ela o microship ou a rede mundial de telecomunicaes. Est na mente humana.

Alan Webbe.

Neste captulo so apresentadas as concluses obtidas no desenvolvimento desta Tese. As principais contribuies, a originalidade desse trabalho, relevncia do mesmo e as perspectivas de trabalhos futuros so evidenciadas.

6.1 Enfoque Geral


Um problema muito importante em Sistemas de Banco de Dados Multimdia, atualmente, prover mecanismos que permitam que os usurios localizem as informaes desejadas.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

109

A recuperao da informao multimdia necessita de um modelo comum capaz de acomodar estrutura de informao semanticamente rica. Neste trabalho, foi proposto um modelo de metadados na indexao e recuperao de objetos multimdia. Tal modelo de metadados baseado em uma hierarquia de metadados/valores. O mtodo de recuperao implementado com um algoritmo de clusters com ndices, usando metadados, como descrito no Captulo 3. No Captulo 4 vrios trabalhos foram analisados e comparados com o modelo MetaMdia. Um enfoque de evoluo foi apresentado e as vantagens do modelo foram destacadas. Neste captulo final so abordados os objetivos alcanados durante o desenvolvimento desta tese, sua contribuio e os aspec tos relacionados a trabalhos futuros.

6.2 Objetivos Alcanados


O modelo proposto permite definir os critrios de indexao, pesquisa e recuperao de objetos multimdia, e atinge os seguintes objetivos:
6.2.1 Descrio de Objetos Multimdia

Na modelagem, objetos podem ser especificados sem que o indexador conhea algum(s) valor(es) de metadados do domnio. Alm disso, podem existir alguns objetos multimdia que no possuem evidncias sugestivas para serem descritos e outros podem gerar

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

110

descries muito resumidas. Isso ocorre, principalmente, na descrio de objetos em fase de preparao, onde algumas partes do mesmo ainda podem ser desconhecidas. permitida a criao de um ou mais meta-objetos multimdia em diferentes estgios de criao do objeto multimdia. Um meta -objeto multimdia pode representar um objeto mais significativamente do que um meta -objeto multimdia criado anteriormente. A descrio de informaes estruturadas permitida, visto que o gerenciamento de grandes quantidades de dados requer instrumentos adequados para a organizao de partes desses dados. disponibilizada uma representao que permite a descrio estruturada de informaes. A dificuldade de obter descries coerentes e xige que se padronize, na medida do possvel, os metadados e os valores que eles podem assumir. Os objetos multimdia so descritos atravs de mecanismos de reuso de metadados/valores, que podem ser importados de outros meta -objetos multimdia, feito atravs de herana de metadados/valores. Esta tese tem como conseqncia direta, permitir descrever com uma semntica mais precisa o modelo e as operaes de criao, conjuno, disjuno e herana de meta objetos.
6.2.2 Compartilhamento de Metadados

Compartilhamento de metadados/valores entre mltiplos meta -objetos multimdia, visto que diferentes usurios esto interessados em diferentes componentes ou diferentes

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

111

apresentaes do mesmo documento. Atravs das estruturas de abstrao permitido compartilhamento de metadados/valores entre mltiplos objetos. A representao de objetos multimdia, usando metadados/valores, permite a recuperao baseada na composio de objetos. Alm disso, abstraes tais como generalizao e especializao de metadados/valores podem ser utilizadas para descrever os objetos multimdia.

6.3 Contribuio Principal


Esta tese tem como principal contribuio, um modelo de metadados na indexao e recuperao de objetos multimdia. Esse modelo possui operaes para criao e manipulao de meta-objetos multimdia. O meta-objeto multimdia corresponde a uma descrio de mdia. A descrio pode ser feita para qualquer tipo de mdia e atravs dela pode ser recuperado qualquer tipo de objeto multimdia, de forma natural e transparente. Com o modelo de indexao, o usurio efetuar menos consultas desnecessrias, visto que o resultado da consulta ser o agrupamento de objetos. O agrupamento de meta-objetos em clusters permite menor tempo de busca e menos informaes so analisadas quanto a sua relevncia. O desempenho na busca linear em alguns casos. Assim, atravs do modelo, facilidades so oferecidas para

pesquisa e recuperao de informao multimdia, atravs dacomposio de objetos.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

112

O modelo permite que seja feita a herana entre instncias de meta -objetos multimdia. Em orientao a objetos, existe a herana de estrutura e comportamento. O modelo permite a herana entre instncias. Os meta-objetos multimdia representam significativamente um objeto multimdia. Uma vez alterado o objeto multimdia, novos meta -objetos so criados, no substituindo os meta-objetos anteriores. Os novos meta-objetos herdam os metadados/valores dos objetos anteriores. O modelo de metadados no afetado em funo das mudanas ocorridas. Assim, a evoluo e edio dos objetos multimdia implicam em mudanas do seu contedo, porm no significa que os meta-objetos multimdia ficam no atualizados.

6.4 Trabalhos Futuros


Como perspectivas de trabalho futuro sugere-se a validao das idias apresentadas nesta tese atravs do uso de uma base real objetos e meta -objetos multimdia, e usando tipos de mdias disponibilizadas na Internet. Outro aspecto importante a ser tratado a

formalizao formal do modelo usando uma linguagem de especificao para descrever os meta-objetos multimdia. Alm desses aspectos o modelo de metadados pode ser evoludo a ponto de ser tratado em informtica na educao, recuperao bas eada em similaridade e mecanismo de verses para meta-objetos multimdia. Abaixo so descritos os aspectos relacionados a cada uma dessas reas.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros


6.4.1 Modelo de Indexao e Processo de Ensino/Aprendizagem

113

Estudos envolvendo o modelo aqui apresentado podem ser aprofundados sob o ponto de vista educacional [GM98], de modo a auxiliar tanto o aluno no exerccio do aprendizado, como tambm auxiliar na avaliao do prprio processo de ensino/aprendizagem. As novas tecnologias de informao apresentam perspectivas para a educao. Considerando que essas tecnologias esto influenciando todas as reas da sociedade, a educao precisa atender s expectativas provocadas pelas mudanas sociais, enfatizando a interao criativa, o pensamento crtico e o julgamento de valores, de modo a ajudar os alunos a desenvolverem a capacidade de aprender, condio fundamental para a vida nas dcadas futuras. O processo de aprendizado no uma atividade linear, com comeo, meio e fim bem determinados, mas sim, uma atividade dinmica onde, a partir de um conhecimento inicial, vo se agregando continuamente modificaes sugeridas pela aplicao prtica dos conhecimentos. A utilizao do modelo abrange situaes variadas e entre essas situaes pode -se registrar o ciclo de desenvolvimento de objetos criados por alunos, visto que permite a composio de objetos j existentes atravs das operaes apresentadas no modelo. Uma ferramenta pode ser criada para permitir a avaliao do processo educacional ao longo da hierarquia de documentos, com o objetivo de analisar a capacidade de aprender, criar, integrar e explorar o conhecimento.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

114

Algumas das vantagens adquiridas sero: melhor anlise do processo educacional e melhor aplicao dos conceitos pelos alunos. Como universo inicial de estudo, podem ser tomados professores, alunos e a realidade educacional do ensino mdio brasileiro.
6.4.2 Mtodo de Recuperao Baseado em Similaridade

Atualmente, o mtodo de recuperao baseado no casa mento exato de padres. A definio de medidas de similaridade para o mtodo de recuperao pode ser alvo de estudo. A pesquisa de objetos multimdia, baseado no MetaMdia, feita em funo dos metadados/valores atribudos consulta. Todos os objetos m ultimdia que possuem pelo menos os metadados/valores indicados so recuperados. Vale ressaltar que, os objetos multimdia que no tiverem pelo menos um dos metadados/valores indicados, no so recuperados. A implementao do mtodo de recuperao baseado em similaridade permitir que esses objetos sejam recuperados. Mas para tanto, medidas devem ser definidas com critrios de busca e recuperao.
6.4.3 Mecanismo de Verses

O conceito de verso num Sistema de Banco de Dados pode s er definido como: descrio de um objeto num determinado momento; descrio completa de uma entidade, sob um determinado ponto de vista; diferentes representaes de um mesmo objeto; ou diferentes estgios de desenvolvimento de um objeto.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

6 Concluses e Trabalhos Futuros

115

A natureza das aplicaes multimdia requer flexibilidade dos sistemas, de modo a permitir a existncia de vrias verses de um mesmo objeto. O uso de verses apresenta a vantagem de permitir atualizaes no destrutivas, gerando novo objeto com novo valor em vez da subst ituio de valores antigos. Alm disso, a seqncia de verses de um objeto pode ser utilizada para fins de consultas. Um mecanismo de verses para o modelo de indexao de informao apresentado nesta tese pode ser criado. A vantagem da criao de tal me canismo que os usurios utilizando na consulta tambm verses de meta-objetos multimdia, o resultado da pesquisa pode ter ainda mais sucesso.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas
[AS94] J. T. Anderson and M. Stonebraker. SEQUOIA 2000 metadata schema for satellite images. SIGMOD RECORD, 23(4):42-48, December 1994. [Ass98] N. A. Assimakopoulos. Systemic approach for a multimedia presentation system with pre-planned knowledge rules. Proceedings of World

Multiconference on Systemics, Cybernetics and Informatic, and 4th International Conference on Information Systems, Analysis and Systhesis, Orlando, Florida, 3:1-8, Jully 1998. [AZP96] F. Aigrain, H. Zhang, and D. Petkovic. Content-based representation and retrieval of visual media: A state-of-the-art review. Multimedia Tools and Applications, 3(3):179-202, November 1996. [BMK95] G.P. Babu, B. M. Mehtre, and M. S. Kankanhalli. Color indexing for eff icient image retrieval. Multimedia Tools and Applications, 1(4):327-348, November 1995. [BPJ93] J. R. Bach, S. Paul, and R. Jain. A visual information management system for the interactive retrieval of faces. IEEE Transactions on Knowledge and data Engineering, 5(4):619-628, August 1993. [BR94] K. Bhms and T. C. Rakow. Metadata for multimedia documents. SIGMOD RECORD, 23(4):21-26, December 1994.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas

117

[BSH00] S. Bradshaw, A. Scheinkman and K. Hammond. Guiding people to information: providing an interface to a digital library using reference as a basis for indexing. Proceedings of the 2000 international conference on Intelligent user interfaces. Pages 37-43. January 2000. [CC98] G. Cha and C. Chung. Object-oriented retrieval mechanism for semistructured image collections. Proceedings of the 6th ACM international conference on Multimedia. Bristol United Kingdom, pages 323-332, September 1998. [CH97] G. Cornell and C. S. Horstman. Core Java. Sunsoft Press, Makron Books, 1997. [CL96] J. Cha and S. Lee. COMID: Composite icon browser for multimedia databases. Multimedia Tools and Applications, 3(3):203-224, november 1994. [CLR90] T. H. Cormen, C. E. Leiserson, and R. L. Rivest. Introduction to algorithms. MIT Press, 1990. [CNY98] M. T. Chan, T. S. Ng, and N. H. C. Yung. MVM a multimedia virtual machine for design modeling and performance simulation. Proceedings of World Multiconference on Systemics, Cybernetics and Informatic, and 4th International Conference on Information Systems, Analysis and Systhesis, Orlando, Florida, 3:9-15, jully 1998. [Con99] Jim Conallen. Modeling WEB Application Architectures with UML. Communication of the ACM, 42(10):63-70, October 1999.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas

118

[CSBB97] S. Chang, J. R. Smith, M. Beigi, and A Benitez. Visual information retrieval from large distributed online repositories. Communications of the ACM, 40(12):63-71, December 1997. [Dat99] C. J. Date. An Introduction to Database Systems. Addison -Wesley Book, Seventh Edition, 1999. [EN99] R. Elmasri and S. B. Navathe. Fundamentals of Database Systems. Addison Wesley Book, Third Edition, 1999. [FBF+94] C. Faloutsos, R. Barber, M. Flickner, J. Hafner, W. Niblack, D. Petkovic and W. Equitz. Efficient and Effective querying by image content. Journal of Intelligent Information Systems 3, Pages 231-262, 1994. [FSN+95] M. Flickner, H. Sawhney, W. Niblack, J. Ashley, Q. Huang, B. Dom, M. Gorkani, J. Hafner, D. Lee, D. Petkovic, D. Styeele, and P. Yanker. Quer y by image and video content: the QBIC system. IEEE COMPUTER Innovative Technology for computer Professionals Finding the Right Image Contentbased Image Retrieve Systems, pages 23-31, September 1995. [GCJ00] R. Gonzalez, G. Cranitch and J. Jo. Acade mic directions of multimedia education. Communications of the ACM. Vol. 43, pages 89-95, 2000. [GD98] F. Golshani and N. Dimitrova. A Language for Content -Based Video Retrieval. Multimedia Tools and Applications 6, pages 289-312, 1998.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas

119

[GFSC94] W. I. Grosky, F. Fotouhi, I. K. Sethi, and B. Capatina. Using metadata for the intellingent browsing of structured media objects. SIGMOD RECORD, 23(4):49-56, December 1994. [GM98] R. Goularte and E. S. Moreira. Helping authoring educational multimedia material through the use of metadata-based browsing tools. Proceedings of World Multiconference on Systemics, Cybernetics and Informatic, and 4th International Conference on Information Systems, Analysis and Systhesis, Orlando, Florida, 3:24-29, July 1998. [Gor00] A. S. Gordon. Using annotated video as an information retrieval interface . Proceedings of the 2000 international conference on Intelligent user interfaces. Pages 133-140. January 2000. [Gro97] W. I. Grosky. Managing multimedia information in database systems. Communications of the ACM, 40(12):72-80, December 1997. [GSJ97] A. Gupta, S. Santini, and R. Jain. In search of information in visual media. Communications of the ACM, 40(12):34-42, December 1997. [GWJ91] A. Gupta, T. Weymouth, and R. Jain. Semantic queries in image databases. IFIP 2nd Working Conference of Visual DBS, Budapest, Hungary, September 1991.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas

120

[HMM00] W. Hrst, R. Mller and C. Mayer. Multimedia information retrieval from recorded presentations. Proceedings of the 23rd annual internation ACM SIGIR conferenc on Research and development in formation retrieval. Pages 339-341. July 2000. [HSHA98] S. Hollfelder, F. Schmidt, M. Hemmje, and J. Aberer. Transparent integration of continuous media support into a multimedia DBMS. International Workshop on Issues and Applications of Database Technology, Berlin, Germany, July 1998. [HSS96] A. Hoff, S. Shaio, and O. Starbuck. Ligado em Java. Makron Books, 1996. [Inm99] W. H. Inmon. Gerenciando Data Warehouse. 1. ed. So Paulo: Makron Books, 1999. [JH94] R. Jain and A. Hampapur. Metadata in video databases. SIGMOD RECORD, 23(4):27-33, December 1994. [KKH94] Y. Kiyoki, T. Kitagawa, and T. Hayama. A meta-database system for semantic image search by a mathematical model of meaning. SIGMOD RECORD, 23(4):34-41, December 1994. [Kow97] G. Kowalski. Information Retrieval Systems: Theory and Implementation. Kluwer Academic Publichers, 1997.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas

121

[KSC99] Y. Kim, C. Sim and J. Chang. Spatial match representation scheme supporting ranking in iconic images databases. Proceedings of the eighth international conference on Information knowledge management, Pages 450 457, November 1999. [Lar99] G. Larsen. Designing component-based frameworks using patterns in the UML. Communications of the ACM, 42(10):38-45, October 1999. [LBN+94a] D. Lee, R. Barber, W. Niblack, M. Flickner, J. Hafner, and D. Petkovic. Query by image content using multiple objects and multiple features: User interface issue. In Proceedings of the ICIP, 1994. [LBN+94b]D. Lee, R. Barber, W. Niblack, M. Flickner, J. Hafner, and D. Petkovic. Indexing for complex queries on a query by content image database. In Proceedings of the ICPR, 1:142-146, 1994. [LZ96] D. Lucarella and A. Zanzi. A visual retrieval environment for hypermedia information systems. ACM transactions on Information Systems, 14(1):3-29, January 1996. [Mar01] J. M. Martinez. Overview of the MPEG-7 Standard. International Organisation for Standardisation. Singapore, March 2001. [MCS93] S. R. L. Meira, A. L. C. Cavalcanti, and C. S. Santos. The Unix File System: A MooZ Specification. In K. Lano and H. Haughton, editors, Object-Oriented Specification Case Studies, Object-Oriented Series. Pretince-Hall, 1993.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas [Mel96]

122

J. C. B. Melo. Diferentes abordagens em comparao de seqncias. Dissertao de Mestrado, Universidade Federal de Pernambuco, 1996.

[MG95]

R. Mehrotra and J. E. Gary. Similar-shape retrieval in shape data management. COMPUTER Innovative Technology for Computer Professionals Finding the Right Image Content-Based Image Retrieve Systems, pages 57-62, 1995.

[Nar96]

A. D. Narasimhalu. Multimedia databases. Multimedia Systems, 4:226-249, 1996.

[NBE+93] W. Niblack, R. Barber, W. Equitz, M. Flickner, E. Glasman, D. Petkovic and P. Yanker. The QBIC Project: Quering Images by content using color, texture and shape. SPIE Conference on Storage and Retrieval for Image and Video Databases, pages 173-187, 1993. [Oom94] E. Oomoto. Study on data models and visual query languages for mult imedia and historical databases. Doctoral Dissertation, Kobe University, January 1994. [ORC+97] M. Ortega, Y. Rui, K. Chakrabarti, S. Mehrotra, and T. S. Huang. Supporting similarity queries in MARS, Proceedings of ACM Multimedia97,

Seattle,Washington, pages 403-413, Seattle, Washington, November 1997. [OT93] E. Oomoto and K. Tanaka. OVID: desing and implementation of a video object database system. IEEE Transactions on Knowledge and Data Engineering, 5(4):629-643, August 1993.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas [OT97]

123

E. Oomoto and K. Tanaka. Video database systems recent trends in research and development activities. The Handbook of Multimedia Information Management, Pretince Hall, 1997.

[PC99]

K. Porkaew and K. Chakrabarti. Query refinement for multimedia similarit y retrieval in MARS. Proceedings of the conference on ACM mutlimedia '99, Pages 235-238, Orlando, Flrida, October 1999.

[PF95]

E. G. M. Petrakis and C. Faloutsos. Similarity searching in large image databases, Technical Report CS-TR-3388, University of Maryland, 1995.

[RHM98] Y. Rui, T. S. Huang, and S. Mehrotra. Exploring video structure beyong the shots. Proceedings of IEEE International Conference on Multimedia Computing and Systems (ICMCS), June 1998. [RNL95] T. C. Rakow, E. J. Neuhold, and M. Loehr. Multimedia database systems the notions and the issues. Datenbanksysteme in Bro, Technik und Wissenschaft (BTW), GI-Fachtagung, Dresden, pages 1-29, March 1995. [SD99] D. Sitaram and A. Dan. Multimedia Servers: Applications, Environments and Design. Morgan Kaufmann Publishers, October 1999. [SKS99] A. Silberschatz, H. F. Korth and S. Sudarshan. Sistema de Banco de Dados. Terceira Edio. So Paulo: Makron Books, 1999. [SL95] R. Steinmetz and B. Lindsay. Multimedia: Computing, Communications, and Applications. Pretince Hall, 1995.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas [Sri92]

124

R. K. Srihari. Extracting visual information from text: using captions to label faces in newspaper photographs. Doctoral Dissertation. CEDAR Center of Excellence for Document Analysis and Recognition, 1992.

[Sri95]

R. K. Srihari. Automatic indexing and content-based retrieval of captioned images. COMPUTER Innovative Technology for computer Professionals Finding the Right Image Content-Based Image Retrieve Systems, pages 4956, 1995.

[TOV+95] H. Treat, E. Ort, M. Vo, J. Jang, L. Hall, F. Tung and D. Petkovic. Searching images using ultimedia manager. In SPIE Proceedings Storage and Retrieval for Image and Video Databases III, pages 204-213, 1995. [VAB95] M. Volz, K. Aberer, and K. Boelm. A flexible approach to combine IR semantics and database technology and its application to structured document handling. GMD Technical Report N. 891, Sankt Augustin, January 1995. [Vaz97] M. S. M. G. Vaz. Recuperao da Informao Multimdia atrav s de algoritmos de string matching. Exame de Qualificao, Universidade Federal de Pernambuco, 1997. [VVSS98] M. S. M. G. Vaz, A. M. L. Vasconcelos, F. F. Souza, e A. C. Salgado. Descrevendo um modelo de informao de vdeo atravs de uma linguagem de especificao orientada a objetos. IDEAS98 Workshop Iberoamericano de Engenharia de Requisitos e Ambientes de Software, 1998.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Referncias Bibliogrficas [WS99]

125

M. Wechsler and P. Schuble. A new ranking principle for multimedia information retrieval.. Proceedings of the fourth ACM conference on Digital libraries. Pages 146-151, August 1999.

[YN99]

R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Retrieval. AddisonWesley-Longman, May 1999.

[YY97]

B.

Yeo

and

M.

M.

Yeung.

Retrieveving

and

visualizing

video.

Communications of the ACM, 40(12):43-52, December 1997. [ZCA96] A. Zhang, B. Cheng, and R. Acharya. A fractal-based clustering approach in large visual database systems. Multimedia Tools and Applications, 3(3):225244, November 1996.

Tese de Doutorado - Maria Salete Marcon Gomes Vaz

Vous aimerez peut-être aussi