Vous êtes sur la page 1sur 35

FERNANDA CARDINALY DE ARAJO SILVA

WEB SEMNTICA: DESVENDANDO A EVOLUO DA WEB E DOS SOFTWARES DE


SUPORTE A TECNOLOGIA SEMNTICA

Um novo formato de contedo web que compreendido pelos computadores ir desencadear uma revoluo de novas possibilidades.
( Tim Berners-Lee )

RESUMO
Este trabalho trata da Web Semntica, uma ideologia voltada para uma refatorao da web que conhecemos e que est ganhando as mesas de discusso por todo o mundo. Neste documento ser apresentado a web semntica, a viso geral por trs dessa nova web, as instituies que colaboram com o desenvolvimento da mesma, a explorao das tecnologias que a cercam e a viabilidade da implementao e do estudo da web semntica na atualidade. Em seguida o leitor irar se deparar com os problemas que incidem no mbito de desenvolvimento e de negcios. Em sua fase final, o trabalho expe recursos para a criao de cdigos semnticos atravs de uma anlise elaborada, mostra tambm as aplicaes semnticas de maior uso atualmente. Em sua ltima seo, o trabalho dedica seu contedo a cincia da informao.
PALAVRAS CHAVE web, semntica, aplicaes, W3C, informao, processamento,

inferncia, metadados, deduo .

ABSTRACT
This paper discusses the Semantic Web, an ideology toward a refactoring of the web we know and that is winning the roundtable discussions throughout the world. This document will be presented the semantic web, the general view behind this new web, the institutions that contribute to its development, the exploitation of the technologies that surround and feasibility of implementation and the study of the semantic web today. Then the reader is confronted with the anger issues that affect the development and course of business. In its final phase, the document raises funds for the creation of semantic codes through an elaborate analysis also shows the applications currently use more semantic. In the last section, the work devotes its contentes to information science.

KEY WORDS - web, semantics, applications, W3C, information, processing, inference, metadata, deduction.

SUMRIO

1. INTRODUO ........................................................................................................................... 9 1.1 CONTEXTO .......................................................................................................................... 9 1.2 OBJETIVOS ........................................................................................................................... 9 1.3 ORGANIZAO DO DOCUMENTO .................................................................................... 10

2. WEB SEMNTICA .................................................................................................................... 10 2.1 VISO GERAL .................................................................................................................... 11 2.1.1 CONSOLIDANDO A WEB SEMNTICA ........................................................................ 11 2.1.2 TECNOLOGIAS DA WEB SEMNTICA ......................................................................... 13 2.1.2.1 URI (Uniform Resource Identifier) ..................................................................... 14 2.1.2.2 XML (Extensible Markup Language) .................................................................. 14 2.1.2.3 RDF (Resource Description Framework) ........................................................... 15 2.1.2.4 OWL (Web Ontology Language ) ....................................................................... 16

3. O W3C E A WEB SEMNTICA .................................................................................................. 17 3.1 DADOS LINKADOS ............................................................................................................. 17 3.2 VOCABULRIOS E ONTOLOGIAS ...................................................................................... 18 3.3 INFERNCIA ...................................................................................................................... 18 3.4 CONSULTAS ...................................................................................................................... 19 3.5 APLICAES VERTICAIS .................................................................................................... 19

4. APLICABILIDADE DA WEB SEMNTICA .................................................................................. 20

5. APLICAES BASEADAS EM WEB SEMNTICA E COMPARTILHAMENTO DE DADOS .......... 21 5.1 FREEBASE .................................................................................................................. 21 5.2 POWERSET ............................................................................................................... 21 5.3 BING ......................................................................................................................... 22 5.4 HAKIA ....................................................................................................................... 22

5.5 TALIS ........................................................................................................................ 23 5.6 SWOOGLE ................................................................................................................. 23

6. ANLISE DAS FERRAMENTAS DE APOIO A WEB SEMNTICA ............................................... 24 6.1 ANOTAES ............................................................................................................. 24 6.2 API (APPLICATION PROGRAMMING INTERFACE) .................................................... 25 6.3 ARMAZENAGEM DE DADOS .................................................................................... 26 6.4 EDIO DE INFORMAES ...................................................................................... 27 6.5 FERRAMENTAS DE SUPORTE INFERNCIA ............................................................ 28 6.6 INTEGRAO ........................................................................................................... 29 6.7 APLICAES PARA CONSULTA ................................................................................. 30 6.8 VALIDAO DE INFORMAES ............................................................................... 31 6.9 VISUALIZAO DE INFORMAES .......................................................................... 31

7. CONTRIBUIES PARA A CINCIA DA INFORMAO ...................................................... 32 7.1 APERFEIOAMENTO E MELHORAMENTO DOS BUSCADORES ................................. 33 7.2 NOVAS INTERFACES COM O USURIO PARA SISTEMAS DE INFORMAO ............. 33 7.3 GESTO DO CONHECIMENTO ORGANIZACIONAL .................................................... 33

CONSIDERAES FINAIS .................................................................................................... 34 ANEXOS............................................................................................................................. 35 REFERNCIAS BIBLIOGRFICAS........................................................................................... 36

INTRODUO

1.1

CONTEXTO

A Web arranjada por elementos e suas ligaes, sendo adequado para as pessoas a identificao do significado de um elemento e o tipo de relao com outros elementos, como a relao de um indivduo com o seu respectivo website. Para o computador, porm, esse tipo de relacionamento entre os elementos no natural. Como espelho da falta de semntica das informaes, os mecanismos de busca encaram problemas para executar pesquisas por documentos que no esto distinguidos por tema, qualidade e relevncia. Alm disso, agentes inteligentes, empregados para obter informaes a partir dos documentos, so atidos e possuem pouca competncia para interagir com tipos de dados distintos e informaes. Os computadores proporcionam auxlio restrito no acesso e processamento da informao, deixando as funes de extrair e interpretar a cargo dos usurios. Alm disso, a web ineficiente para transferir, encontrar, acessar, expor e manusear conceitos definidos nos documentos de forma simples e autnoma. A Web Semntica, uma proposta para aprimorar pesquisas realizadas na web, procura adicionar semntica ao atual formato de representao de dados. Desta maneira, o trabalho de ponderar a qualidade e a validade de um documento seria realizado de maneira eficaz e em conjunto pelas pessoas e pelos computadores. Nessa situao, foi proposta pelo W3C (World Wide Web Consortium) uma linha de processos para que os computadores, a partir de aplicaes, sejam capazes de raciocinar e deduzir sobre as informaes estruturadas semanticamente na Web. As aplicaes utilizadas com o desgnio de raciocinar e deduzir sobre as informaes na Web so chamadas aplicaes semnticas. Para abordar os seus desgnios, as aplicaes semnticas necessitam de uma web semanticamente estruturada. Esta estruturao pode ser feita a partir do uso dos mtodos da Web Semntica. Dessa forma, as aplicaes de apoio web semntica podem auxiliar no manuseio de informaes definidas de acordo com as tecnologias da Web Semntica e no apoio ao desenvolvimento de aplicaes semnticas.

1.2

OBJETIVOS

Sendo assim os objetivos desse trabalho apresentar a web semntica, suas tecnologias, seus desafios de implementao, revelar o ambiente semntico em softwares j usuais e analisar aplicaes de apoio a nova web. Nosso objetivo contribuir com pesquisas nessa rea como formar de difundir o que acreditamos ser o futuro da web. Atravs da web semntica, cremos na construo de uma internet mais inteligente, capaz de lidar com contextos e interpretaes, mais do que simples tags. Tornar as coisas muito mais fceis e com auxlio das novas tecnologias.

1.3

ORGANIZAO DO DOCUMENTO

O prximo captulo fala sobre a Web Semntica, ele introduzir nosso assunto dando uma viso geral completa sobre nosso tema principal, e as tecnologias associadas a ele. O captulo 3 aborda as caractersticas bsicas que devem existir e serem difundidas nas aplicaes semnticas, segundo a viso da W3C (The World Wide Web Consortium). O captulo 4 rene a problemtica que cerca nosso tema, tanto do ponto de vista tcnico, de implementao, quanto do ponto de vista dos negcios abrangidos por ele. O captulo 5 agrupa aplicaes semnticas, vista sobre o olhar da W3C, algumas delas utilizam o princpio de compartilhamento de dados, que alguns especialistas visam como a soluo para a construo da nossa nova web. O captulo 6 apresenta a anlise das aplicaes que do suporte web semntica, de todas as maneiras possveis, desde realizao de inferncias at o armazenamento, edio e validao de nossas pginas, aplicaes ou dados. O captulo 7 direciona toda nossa pesquisa aos cientistas da informao e exibe os benefcios consequentes da proposta da Web Semntica no mundo da cincia da informao. Por fim consideraes so feitas na ltima seo, anumerada.

2. WEB SEMNTICA
Antigamente, a internet era restringida aos meios acadmicos e militares e tinha como ocupaes fundamentais: a troca de arquivos, o correio eletrnico e a emulao de terminal. Em maro de 1989, o fsico britnico Tim Berners-Lee expediu uma proposta para o CERN (European Center of Nuclear Research). Sua ambio era inventar um sistema de gesto de informaes para promover o compartilhamento de documentos entre os seus colegas. A proposta de Berners-Lee foi acolhida e como decorrncia surgiu a World Wide Web, ou Web. Com o aparecimento da web, o uso da Internet generalizou-se, permitindo a disponibilizao de novos servios na Internet. Atualmente, a Web to pblica que, no raro, os seus usurios embaraam-se com a prpria internet. No comeo da Web, a quantidade de informaes disponveis era pequena, entretanto nos dias de hoje existem mais de 90 milhes de websites. Os servios disponibilizados na Web comportam aos usurios pesquisar, negociar produtos, ler noticirios, escutar msica, jogar, interagir com outros usurios, consultar a conta corrente, recarregar crditos no celular e inmeras outras atividades. Para buscar por informaes disponveis na Web, so empregados os mecanismos de busca. Entretanto, apesar da ampla quantidade de informaes adquiridas, apenas parte da Web observada, enquanto uma parte considervel das informaes fica inacessvel pelos motores de busca (Web Oculta). O W3C (World Wide Web Consortium), consrcio criado em 1994 pelo autor da web (Tim Berners-Lee), determina padres (particularizaes, diretrizes, software e

instrumentos) e tem como desgnio a criao de uma web segura, onde as pessoas tomem a autoria e carga por suas publicaes. A Web Semntica, uma expanso da Web contempornea, permitir a acessibilidade, a captao e a gesto das informaes disponibilizadas na Web, autnoma da maneira em que elas se apresentem (texto, som, imagem), a partir do uso dos padres definidos pelo W3C.

2.1 VISO GERAL


Pesquise no Google: Banco. Voc encontra diversas respostas, como: mvel encontrado em praa, doao de sangue, empregos; Mas, na realidade voc busca por Instituio Financeira. Porque isso acontece? O sistema no faz distino do mvel, da doao de sangue, da instituio; Em menos de duas dcadas a internet cresceu muito e o modo de compartilhar informaes do mundo todo chegou a criar propores inimaginveis de abrangncia de fontes com contedos diversos que acabou criando um verdadeiro caos de informaes. Por estes motivos, a navegao tornou-se confusa e dispersa. O HTML limitado, ou seja, no possui recursos que permitam atribuir significado a informao. "As tags HTML so muito limitadas nesse sentido. Elas apenas descrevem como a pgina deve ser exibida e no oferecem nenhuma descrio dos dados como fala Rubens Queiroz, professor da UNICAMP. Para ns usurios que visitamos as pginas da web, a diferena entre o mvel e a instituio evidente. Em contrapartida, os computadores no conseguem entender toda esta informao. Eles no podem ler, fazer relaes ou tomar decises como voc. A Web Semntica uma tentativa inversa de soluo. Ao invs de pensar na informao para os humanos, a ideia pensar na mquina. "Machine-Understandable Information", esta a definio da Web Semntica, segundo o "pai da Web", Tim Berners-Lee, um dos comandantes desse projeto.

2.1.1 CONSOLIDANDO A WEB SEMNTICA


O W3C avalia seis princpios imprescindveis para a concretizao da Web Semntica: Qualquer recurso deve ser identificado por um identificador universal. Os recursos e as ligaes podem ser tipificados. Tolerncia ao rompimento de ligaes. A confiana no carece ser total. Admitir ao progresso. Implementao minimalista.

Para que os computadores possam processar e compreender o sentido das informaes transmitidas na Web, os recursos disponveis necessitam ter semntica.

Desta maneira, os computadores podero pesquisar, processar, agregar, intercambiar e expor recursos de forma inteligente. Para isso, indispensvel estruturar semanticamente os recursos da Web. As seguintes abordagens podem ser usadas: Top-Down (de cima para baixo): os agentes inteligentes retiram informaes das pginas da Web e estrururam-nas semanticamente. Bottom-Up (de baixo para cima): as aplicaes semnticas pesquisam na Web por informaes estruturadas semanticamente. Agentes inteligentes, para a abordagem Top-Down j existem, como o Blue Organizer da Adaptive Blue e o Personal Web da Claria. O Blue Organizer mune um complemento para o navegador Firefox, que proporciona organizar websites de interesse do usurio. O Personal Web altera a pgina inicial do navegador do usurio com informaes do seu interesse. As aplicaes semnticas esto em constante trabalho e a consolidao da abordagem Bottom-Up se dar quando as informaes das pginas Web ficarem estruturadas semanticamente. A Web Semntica permitir o desenvolvimento de aplicaes que promovero o agrupamento e o reuso de informaes. Como exemplo, uma aplicao poderia refinar informaes e executar trabalhos que hoje so considerados complexos, como rebater a seguinte pergunta: Quais hospitais da cidade de Currais Novos aceitam o plano Mais Sade? A estruturao semntica da informao nos documentos criaria uma atmosfera onde as pessoas e as mquinas (os computadores ou qualquer outro aparelho ligado na internet) poderiam trabalhar em colaborao, deixando a cargo das mquinas qualquer servio que pudesse ser automtico. Para alcanar os desgnios da Web Semntica, indispensvel uma uniformizao de tecnologias, linguagens e metadados descritivos, de maneira que todos os usurios da Web satisfaam a determinadas normas comuns e partilhadas sobre como gravar dados e descrever a informao armazenada de forma que ela seja usada por pessoas e mquinas de maneira automtica e sem impreciso. Apesar dos padres web terem evoludo nos ltimos 5 anos e empreendimentos comerciais terem nascido, os esforos atingidos neste campo se renem principalmente no meio acadmico. O procedimento para o desenvolvimento da web atual em uma Web Semntica pode ser lento. O sucesso dessa nova estrutura est amarrado cooperao entre seus usurios, independentemente de diversidades tnicas, sociais e culturais. Apesar de as possibilidades enxergadas pela Web Semntica sejam empolgantes, os seguintes desafios precisam ser encarados: Constituir regras que determinem a informao contida nas pginas web de maneira simples, inteligente e universal. Desenvolver aplicaes que consigam, de maneira autnoma, explicar e compartilhar a informao obtida a partir de distinta origens. Desenvolver aplicaes que obtenha gerar novas informaes estruturadas semanticamente a partir da informao recebida. Desenvolver aplicaes que permitam o manuseio das tecnologias da Web Semntica de forma clara.

Para acessar, decodificar e usar informaes estruturadas de maneira competente, as aplicaes utilizam as tecnologias da Web Semntica, as quais so abordadas a seguir.

2.1.2 TECNOLOGIAS DA WEB SEMNTICA


A figura abaixo exibe a arquitetura da Web Semntica, com as suas tecnologias relacionadas:

Fig. 1 ( Tecnologias da web semntica ) [1]

As tecnologias exibidas nas camadas inferiores da arquitetura so empregadas como base para as tecnologias das camadas superiores. Apesar do afastamento, as camadas esto fortemente relacionadas, sendo complexa a anlise separada de algumas camadas, tais como RDF e RDF-S, por exemplo. A disposio das tecnologias pode ser feita de acordo com a sua maturidade, sendo expostas na ordem decrescente de maturidade: Tecnologias normatizadas: as tecnologias Unicode, URI (Universal Resource Identifier) e XML esto nas camadas de alicerces da estrutura. Tecnologias recm-normatizadas: as tecnologias RDF, RDF-S e OWL, esto no centro da estrutura. Tecnologias experimentais: as tecnologias SPARQL, Regras, Estrutura Lgica, Prova e Confiana, esto no topo da estrutura.

Alm dessas tecnologias, ainda tem a camada de encriptao, existente desde a base at o topo da estrutura, e que empregada para codificar e encontrar alteraes

nas informaes. Na prxima seo as tecnologias normalizadas e recm-normalizadas pelo W3C so expostas.

2.1.2.1 URI (UNIFORM RESOURCE IDENTIFIER)


Para que a informao seja partilhada em qualquer parte, necessrio um preceito de identificao global chamado URI. O principal desgnio desta identificao aceitar o intercmbio com os aspectos de recursos sobre uma rede, tipicamente a Web, usando protocolos especficos. Um recurso pode ser caracterizado como qualquer coisa (fsica ou lgica) acessvel ou no pela Web. Por exemplo, um recurso poderia ser: uma pgina Web www.ufrn.br; o ttulo, o autor, ou a data de modificao de uma pgina da Web; uma coleo de pginas Web, um elemento HTML especfico, um livro impresso ou uma cadeira. Por exemplo, o URL (Uniform Resource Locator) http://www.ufrn.br/ um URI que identifica um recurso (Pgina da Universidade Federal do Rio Grande do Norte) e implica em uma feio desse recurso (como o cdigo HTML da pgina e a codificao de caracteres) adquirido via protocolo HTTP em uma rede chamada http://www.sistemas.ufrn.br/portalufrn/PT/.

2.1.2.2 XML (EXTENSIBLE MARKUP LANGUAGE)


XML uma linguagem de marcao de padro aberto, que impede imprecises e d apoio a permuta de documentos na Web de forma autnoma de formato de arquivo, tecnologia e plataforma. A linguagem XML qualificada como uma linguagem extensvel, pois comporta aos usurios definirem suas favorveis etiquetas (tags), desde que elas sejam bem formatadas, ou seja, estejam de concordata com as normas de sintaxe definidas. O cdigo abaixo exibe um exemplo de um arquivo XML. Cdigo Exemplo de arquivo XML
1 2 3 4 5 6 7

<aviso> <data>28/04/2012</data> <para>Fernanda Cardinaly</para> <de>Prof Flavius Gorgnio</de> <cabecalho>Lembrete</cabecalho> <corpo>Amanh, avaliao de arquitetura de computadores</corpo> </aviso>

A linha 2, do cdigo , exibe a etiqueta data. A etiqueta inicia em <data>, possui o contedo 28/04/2012, e finaliza em </data>. Todos os benefcios da XML fazem com que ela signifique uma armao ideal para permuta de dados. Acredita-se que, com a expanso da web e o advento da Web Semntica, XML se tornar a linguagem universal para a representao de dados.

2.1.2.3 RDF (RESOURCE DESCRIPTION FRAMEWORK)


RDF determina um arqutipo de dados para uma descrio semntica processvel por computadores, permitindo a codificao, a interao e o reuso de metadados estruturados e a edificao de elementos de metadados. Uma linguagem natural, como o portugus, adequada para a conversao entre seres humanos, RDF apropriado para expressar descries (declaraes) a respeito de recursos para descomplicar o processamento automtico pelos computadores. A ideologia por trs do RDF a descrio dos dados atravs de triplas do tipo recurso-propriedade-valor, ou seja, identificar recursos com o uso de URIs e descrever objetos em termos de propriedades simples e seus respectivos valores. RDF se assemelha com um diagrama de Entidade-Relacionamento (DER), onde as entidades so os recursos e as propriedades so os relacionamentos entre os recursos. Uma declarao RDF pode ser simulada atravs de um grafo orientado, conforme a figura 2:

Recurso (Sujeito) )

Propriedade

Recurso (Objeto)

Fig. 2 (Representao RDF em grafo)

Os arcos simulam propriedades, enquanto os ns simulam recursos. A direo da seta relevante: o arco sempre comea no sujeito e aponta para o objeto da declarao. Em um exemplo, seja a sentena: http://www.info.ufrn.br/html tem um criador cujo valor Universidade Federal do Rio Grande do Norte A sentena poderia ser representada pela seguinte declarao RDF: O sujeito http://www.info.ufrn.br/html O predicado a palavra criador. O objeto Instituto de Informtica.

O pedao que identifica o recurso da declarao chamado de sujeito, um atributo de um recurso chamado de predicado (propriedade) e o valor de uma propriedade chamado de objeto (valor de propriedade). Em outro exemplo, analise as sentenas a seguir: O autor do documento TEXTO o indivduo FERNANDA. O indivduo FERNANDA autor do documento TEXTO.

Um indivduo que conhea o idioma portugus asseguraria que as duas sentenas tm o mesmo significado, contudo o computador no capaz de analis-las. Na primeira sentena o recurso documento TEXTO, a propriedade autor e o valor para a propriedade indivduo FERNANDA. Na segunda sentena o recurso indivduo FERNANDA, a propriedade autor e valor da propriedade documento TEXTO. Nas duas sentenas o sujeito documento TEXTO, o predicado autor e o objeto indivduo FERNANDA. O Cdigo 2 expe um exemplo em RDF/XML, uma reproduo formal de dados RDF em formato XML, usando as sentenas empregadas no exemplo anterior: Cdigo 2 Exemplo de arquivo RDF /XML
1 2 3 4 5 6 7 8

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ex1="http://ex1.com/elements/1.0"> <rdf:Description rdf:about="http://ex1.com/documento1"> <ex1:titulo>Documento TEXTO</ex1:titulo> <ex1:autor>Individuo FERNANDA</ex1:autor> </rdf:Description> </rdf:RDF>

2.1.2.4 OWL (WEB ONTOLOGY LANGUAGE)


A backbone da Web Semntica so as ontologias. Embora a palavra ontologia se refere natureza do ser, em Inteligncia Artificial ela pode ser decifrada como o unido de entidades com suas relaes, restries, axiomas e vocabulrio. Uma ontologia pode ser determinada como uma particularizao mais explcita e formal que conceitual, um modelo abstrato de algum elemento do mundo em um conhecimento consensual, isto , partilhado por todos. Alm disso, os julgamentos, as propriedades, as funes e os axiomas devem ser explicitados e serem manejveis por computador. As ontologias devem ter aptido de identificar contextos de um termo, compartilhar significados e dar apoio ao reuso. Quando elas so arquitetadas levandose em importncia esses aspectos, possvel auxiliar as pessoas na pesquisa, extrao, interpretao e processamento da informao. Para a edificao de ontologias, essencial uma linguagem com semntica bem determinada e significativa o suficiente para descrever inter-relacionamentos abstrusos e restries entre objetos. J existe uma linguagem padro que aborda esses requisitos, a OWL (Web Ontology Language), que procede de um acordo entre duas propostas, a europia OIL (Ontology Inference Layer) e a DAML (DARPA Agent Markup Language). A OWL uma linguagem para demarcao e instanciao de ontologias Web. A ideia principal da OWL comportar a reproduo competente de ontologias. Alm disso, a linguagem proporciona examinar uma ontologia para decidir se sua lgica slida ou se h algum conceito falho. Uma ontologia OWL pode conter: relaes de taxonomia entre classes; propriedades dos tipos de dados e definies dos atributos de elementos das classes,

propriedades do objeto e definies das relaes entre elementos das classes, instncias das classes e instncias das propriedades. A sugesto do W3C possui trs verses da OWL, que est amarrado a capacidade de expressividade requerida. As verses menos expressivas (OWL Lite e DL) esto inclusas dentro das mais expressivas (OWL DL e Full). Uma ontologia em uma linguagem menos expressiva acolhida por uma linguagem mais expressiva, contudo a recproca no aceita. A adoo da linguagem OWL vem crescendo a cada dia, apesar disso existem poucas ferramentas e ambientes de desenvolvimento de software para dar apoio s suas produes e aplicaes.

3. O W3C E A WEB SEMNTICA


Evoluindo a j clssica e conhecida Web de documentos, o W3C ajuda no desenvolvimento de tecnologias que daro suporte Web dos dados, viabilizando pesquisas como num banco de dados. O objetivo final da Web de dados possibilitar com que computadores faam coisas mais teis e com que o desenvolvimento de sistemas possa oferecer suporte a interaes na rede. O termo Web Semntica refere-se viso do W3C da Web dos Dados Linkados. A Web Semntica dar s pessoas a capacidade de criarem repositrios de dados na Web, construrem vocabulrios e escreverem regras para interoperarem com esses dados. A linkagem de dados possvel com tecnologias como RDF, SPARQL, OWL.

3.1 DADOS LINKADOS


A web semntica uma web de dados de datas e ttulos e nmeros, de propriedades e quaisquer outros dados que poderamos conceber. A coleo de tecnologias da Web semntica (RDF, OWL, SPARQL, etc.) fornece um ambiente onde o aplicativo pode consultar dados e elaborar inferncias utilizando as linguagens, etc. No entanto, para tornar a web de dados uma realidade, importante ter uma enorme quantidade de dados na web disponvel em um formato padro, acessvel e gerencivel por ferramentas da web semntica. Alm disso, a web semntica precisa acessar os dados, para isso, as relaes entre os dados devem ser disponibilizadas, isso tambm contribuir para criar uma web de dados (em oposio a uma enorme coleo de conjuntos de dados). Esta coleo de conjuntos de dados inter-relacionados na web tambm pode ser chamada de dados linkados. Para conseguir criar dados linkados, existem tecnologias que devem estar disponveis para um formato comum (RDF), para fazer a converso ou o on-the-fly aos bancos de dados existentes (relacional, XML, HTML, etc). O W3C fornece uma paleta de tecnologias (RDF, GRDDL, RDFa, R2RML, RIF, SPARQL) para obter acesso aos dados. O conceito de dados linkados encontra-se no corao da web semntica: o raciocnio e a integrao em grande escala de dados na web. Quase todos os aplicativos listados nas colees de casos de uso e estudos de caso da web semntica

baseiam-se essencialmente na acessibilidade e integrao de dados linkados a diversos nveis de complexidades.

3.2 VOCABULRIOS E ONTOLOGIAS


Na declarao de atividades do comit da W3C para Web Semntica temos: A Web Semntica uma viso: a ideia de ter dados na Web descritos e conectados de maneira que estes possam ser utilizados por mquinas, no apenas com intuito de exibio, mas tambm para automao, integrao e reuso desses dados atravs de diversas aplicaes. A Web, como a conhecemos atualmente, constitui um magnfico repositrio de dados, informaes e conhecimento. No entanto, as mquinas, nesse contexto, basicamente possuem as funes de armazenamento e recuperao de dados, dependendo totalmente da cognio humana para processamento e transformao desses dados em informaes e conhecimento til e relevante. A Web Semntica tem como objetivo principal descrever semanticamente os dados na Web, de forma que agentes de software [Nwana, 1996] possam, alm de armazenar, recuperar e exibir tais dados, processar, aprender, inferir e tomar decises baseadas na semntica das informaes. Quando a Web Semntica for uma realidade, poderemos pedir para um agente de software algo como: entre nas 10 melhores lojas de livros na Internet e procure os livros da editora Moderna, com preo entre 50,00 e 70,00, do assunto web semntica, recomende-me os 5 melhores baseados nas crticas de outros compradores. Esse agente de software ser capaz de computar semanticamente, e no apenas como cadeias de caracteres, conceitos como loja, livro, editora, preo, assunto, crtica, comprador. Para que esses agentes de software entendam esses conceitos, eles se utilizaro de ontologias. Ontologias so especificaes formais de um domnio de conhecimento que incluem a descrio de termos e objetos que formam esse domnio, assim como a descrio de como eles se relacionam uns com os outros. Ontologias fornecem um vocabulrio para representar e comunicar sobre determinada rea de conhecimento, e promovem o reuso e compartilhamento desse conhecimento. Atravs de uma ontologia possvel definir o que um livro, que este possui um criador, tambm conhecido como autor que nesse contexto equivalente a escritor, que este livro publicado por uma editora, etc. Na Web Semntica, essas definies sero representadas atravs de metadados que podero estar anexados a uma imagem da capa de um livro, por exemplo, e que podero ser utilizados por mquinas e pessoas.

3.3 INFERNCIA
Em termos gerais, o conceito de inferncia na web semntica pode ser caracterizado como um mecanismo para descobrir novos relacionamentos. Dados so modelados sobre a web semntica como um conjunto de relaes (nomeadas) entre

recursos. "Inferncia" significa que procedimentos automticos podem gerar novas relaes baseadas nos dados e com base em algumas informaes adicionais sob a forma de um vocabulrio, por exemplo, um conjunto de regras. Se as novas relaes so explicitamente adicionadas ao conjunto de dados, ou so retornadas no momento da consulta, uma questo de implementao. Na web semntica, a fonte dessas informaes extras pode ser definida por meio de vocabulrios ou conjuntos de regra. Ambas destas abordagens baseiam-se em tcnicas de representao do conhecimento Segundo a W3C, CORUJA ou SKOS so as ferramentas de escolha para a definio de ontologias. Assim, a inferncia um dos mecanismos escolhidos para melhorar a qualidade da integrao de dados na Web, por sua capacidade de descobrir novos relacionamentos, e de analisar o contedo dos dados automaticamente ou de gerir conhecimento na web em geral. Tcnicas de inferncia tambm so importantes na descoberta de possveis inconsistncias nos dados (integrados).

3.4 CONSULTAS
"Consulta" na web semntica significa tecnologias e protocolos que podem programaticamente recuperar informaes na web de dados. RDF fornece a base para a publicao e vinculao de dados. Vrias tecnologias permitem que voc incorpore dados em documentos (RDFa, GRDDL), expor o que voc tem nos bancos de dados SQL, ou disponibiliz-los como arquivos RDF. No entanto, assim como os bancos de dados relacionais precisam de linguagens de consulta especficas (SQL), a web de dados - geralmente representados usando RDF como formato de dados - precisa de sua prpria linguagem de consulta. Isso fornecido pela linguagem SPARQL. Essa linguagem torna possvel enviar consultas e receber os resultados, atravs de HTTP ou SOAP, por exemplo. Tecnicamente, consultas SPARQL so baseadas em padres. RDF pode ser visto como um conjunto de relaes entre os recursos; Consultas SPARQL fornecem um ou mais padres contra tais relaes. Esses padres chamados padres triplos so semelhantes aos triplos RDF, exceto que um ou mais dos elementos constitutivos dos recursos so variveis. Cabe a um motor SPARQL retornar os recursos para todos os triplos que correspondem a esses padres.

3.5 APLICAES VERTICAIS


Aplicaes verticais o termo utilizado no W3C para designar reas especficas de aplicao, comunidades especficas, etc., que exploram as tecnologias W3C (por exemplo, tecnologias de web semntica) e que podem ajudar nas suas operaes, aumentando a sua eficincia, fornecendo a melhor experincia ao usurio, etc. Alguns destes domnios de aplicao podem decidir formar algum tipo de grupo no W3C para cooperar com outros membros do W3C ajudando a explorar essas tecnologias ainda mais. Existem muitas dessas aplicaes verticais que contribuem com o W3C em diferentes reas, como: cuidados com a sade e cincias biomdicas, espaos sociais, bibliotecas digitais, servios financeiros, explorao de petrleo e gs, etc.

Exemplos consolidados de aplicaes verticais: The Health Care um grupo de interesse pela cincia da vida. Ele foi criado em 2005, para explorar a possibilidade de utilizao de tecnologias da web semntica no campo, como a descoberta de medicamentos, gesto no atendimento ao paciente e emisso de relatrios, publicao dos conhecimentos cientficos, processos de aprovao de drogas, etc. O grupo tem produzido vrias manifestaes, publicaes, organizando workshops e conferncias e conseguiu transformar este domnio de aplicao especfica em uma das comunidades de utilizadores mais ativas de tecnologias da web semntica. A maioria das empresas de pesquisa de drogas, laboratrios universitrios e centros de investigao, esto trabalhando na rea e produzindo ferramentas especializadas aos fornecedores que participam deste trabalho. Os feedbacks fornecidos por este grupo tambm foi significativo para as tecnologias da web semntica; como por exemplo, a definio de alguns dos perfis OWL2 foi fortemente influenciada pelas ontologias e vocabulrios desenvolvidos por esta comunidade.

4. APLICABILIDADE DA WEB SEMNTICA


Imagine a ocasio: Voc precisa fazer uma viagem s pressas para So Paulo, ento voc pede ao computador para encontrar uma companhia area que siga as seguintes restries: que tenha um vo para a manh seguinte na classe econmica e seja a companhia com o preo mais barato. O computador, em poucos momentos lhe fornece o resultado da busca com a companhia que melhor se encaixa nas medidas impostas. Depois disso, voc apenas tem o trabalho de reservar seu lugar A aplicabilidade disto em termos de uso poder ser algo totalmente inovador e prtico. Alm de melhorar os resultados das buscas tornando-a mais relevante, a web semntica pode ser inteligente. Voc poderia, por exemplo, se viajar, registrar no buscador qual o valor mdio que gostaria de gastar por viagem, assim ele faria toda a parte burocrtica da viagem e lhe deixaria todos os dados em sua conta de e-mail. Alm desta aplicabilidade, outro exemplo, so os endereos e uso de telefones por meio de GPS + 3G, imagine voc precisando encontrar um caixa eletrnico de seu banco preferido, conectaria a internet e conforme as coordenadas de seu GPS, o aparelho encontraria o terminal de auto-atendimento mais prximo e traaria a rota para voc. Isto poderia se valer muito mais alm do que buscar um caixa eletrnico, poderia se fazer para todos os estabelecimentos que fosse de seu interesse. At agora descrevemos uma web semntica ativa e vivel, mas quais so os problemas enfrentados para a implementao dessa nova tecnologia? Tecnologicamente falando, a rejeio por parte dos sites se adequarem a web semntica, e reformular o cdigo das pginas. Este um grande problema, imagine o nmero de sites que precisam ser praticamente refeitos para se adequarem a nova internet? Os grandes portais teriam este interesse em estarem aptos a esta tecnologia? Outro problema se situa nos nossos buscadores: As buscas por informaes dentro das pginas devero ser mais refinadas, assim como o resultado das buscas. Portanto, provavelmente mais consumo de processamento seria necessrio, estariam eles dispostos e aptos a ter hardware e software suficiente? E em se tratando de negcios? O principal fator para o impedimento disto, que empresas que so criadas como guias de algum determinado ramo, ou de N

determinados ramos, seria praticamente descontinuado, pelo fato de que voc ao invs de precisar utilizar este servio usaria os buscadores para encontrar a informao. Portanto, este tipo de sites sairia prejudicado. Outro problema seria a exposio de muitos dados de usurios na internet, como por exemplo, se for aplicar a semntica em redes sociais, imagine quantas informaes pessoais seriam visveis a usurios no ligados a voc? A prxima seo destinada ao conhecimento dos softwares semnticos que apostam em conectividade entre aplicaes e portabilidade de dados para contornar esses problemas.

5. APLICAES BASEADAS EM WEB SEMNTICA E COMPARTILHAMENTO DE DADOS


Como foi dito anteriormente o objetivo das aplicaes com caractersticas semnticas determinar os significados de textos ou dados, criando conexes para os usurios. As informaes e sites passam a ter sentido quando esto conectados a partir de uma semntica. Para conseguir tais conexes, os especialistas apontam a portabilidade de dados e conectividade das aplicaes como fatores de sucesso para o desenvolvimento da web semntica, quando as aplicaes falam uma "lngua" em comum fica mais fcil de desenvolver os links entre esses dados. Nas prximas subsees exploraremos essas tais aplicaes.

5.1 FREEBASE
Freebase uma grande base de conhecimento colaborativa. um refgio de dados estruturados online colhidas de vrias fontes, inclusive a contribuio 'wiki' individual. O objetivo da Freebase, criar um recurso global que permita as pessoas (e mquinas) acessarem informao comum, mais efetivamente. desenvolvido pela empresa de software americana Metaweb e tem sido executado publicamente desde Maro de 2007. Dados Freebase esto disponveis para uso em uma "atribuio" de licena Creative Commons, e uma API, rdf endpoint, e database dump so fornecidos para programadores. Google's News Timeline inclui meios de comunicao de informaes Freebase. A pgina oficial da freebase www.freebase.com e seu lema : Um grfico de entidade de pessoas, lugares e coisas, construda por uma comunidade que ama dados abertos.

5.2 POWERSET
Adquirida recentemente pela Microsoft, um engenho de busca de linguagem natural. A Powerset estava trabalhando na construo de uma linguagem natural para motor de busca que pode encontrar respostas a perguntas especficas do usurio (em oposio a pesquisa por palavra).

A empresa licenciou a tecnologia de linguagem natural da PARC , o ex- Xerox Palo Alto Research Center . Em 11 de maio de 2008, a companhia revelou uma ferramenta para procurar um subconjunto fixo na Wikipedia usando frases de conversao em vez de palavraschave. Em 01 de julho de 2008, a Microsoft assinou um acordo para adquirir a Powerset por cerca de US$ 100 milhes.

5.3 BING
Bing, durante a etapa de testes, o motor de pesquisa da Microsoft, designado para competir com os lderes das indstrias Google e Yahoo!. Revelado pelo CEO da Microsoft, Steve Ballmer, em 28 de maio de 2009, na conferncia "All Things D", em San Diego. Bing um substituto do Live Search, e disponibilizado totalmente em 1 de junho de 2009. Em 4 de junho de 2009, com apenas trs dias em atividade, o Bing alcanou o segundo lugar na rea de pesquisas online, superando o Yahoo! Busca, e ficando atrs apenas do Google Search. No dia, o motor de pesquisa representou 16,2% das buscas nos Estados Unidos, enquanto o Yahoo! representou 10,2%. Globalmente, o Bing representa 5,6% contra 5,1% do Yahoo!. Os aperfeioamentos incluem adio de pesquisas relacionadas (chamado "Explorer panel", no lado esquerdo dos resultados da pesquisa, baseado na tecnologia semntica do PowerSet, empresa de busca da Microsoft comprada em 2008), e busca de sugestes ao digitar (aumenta o histrico de pesquisas). O Bing pode ser acessado atravs do link: br.bing.com

5.4 HAKIA
Apontado com um dos mais promissores engenhos de busca em alternativa ao Google, faz a anlise de sentenas na hora de fazer uma busca. Disponvel em portugus tambm, trouxe resultados relevantes em algumas buscas que fiz. A empresa hakia quem inventou a tecnologia QDEXing, uma infra-estrutura que surgiu como nova alternativa indexao de dados e que usa o algoritmo SemanticRank, uma mistura de soluo das disciplinas de semntica ontolgica e lgica fuzzy e lingstica computacional e matemtica . Fundada em 2004, a empresa uma empresa privada com sede em Nova York . A Hakia foi fundada por Riza Berkan , um cientista nuclear por formao, com especializao em inteligncia artificial e lgica fuzzy, e Kouri Pentti , um economista baseado em Nova York e capitalista de risco. Professor Victor Raskin , pai da semntica ontolgica e notvel autoridade internacional na rea de lingstica computacional. O Hakia poder ser acessado em: http://hakia.com

5.5 TALIS
Talis uma plataforma para criao de aplicaes semnticas na web. Os desenvolvedores podem criar, compartilhar e reutilizar informaes nessa plataforma, que tem como objetivo facilitar o desenvolvimento das aplicaes semnticas. A Plataforma Talis torna mais fcil para desenvolvedores criar aplicativos poderosos que utilizam tecnologias de Web Semntica e padres. Entregue como Software de Servio (SaaS), a plataforma reduz drasticamente a complexidade e custo de armazenamento, de indexao, de busca e aumenta grandes quantidades de dados. Ele fornece um ambiente confivel e seguro para suportar uma vasta gama de aplicaes de informaes ricas. A plataforma Talis pode ser acessada atravs do: www.talis.com

5.6 SWOOGLE
O Swoogle uma ferramenta de busca de documentos na Web Semntica. Ele aplica um sistema de rastreamento para achar documentos RDF e documentos HTML com contedo RDF embutido. O buscador compreende esses documentos e as suas partes constituintes (termos e triplas, por exemplo), registra e indexa metadados significativos sobre eles em seu banco de dados. Os documentos achados tambm so indexados por um sistema de recuperao de informao que pode usar referncias URL como palavras-chave para verificar a semelhana com um conjunto de documentos. Uma das funcionalidades interessantes que o Swoogle utiliza o ranking de ontologia, uma medida da importncia de documentos na Web Semntica. Seus servios so fornecidos para os usurios por meio de uma interface, que pode ser acessada a partir de qualquer navegador e para agentes de software via servios (Web Services). Vrias tcnicas so usadas para retornar os resultados e seu algoritmo inspirado no PageRank, desenvolvido pelo Google, mas adaptado ao modelo semntico dos documentos. O Swoogle foi desenvolvido com o objetivo de encontrar ontologias, instncia de dados e responder perguntas no contexto da Web Semntica. A figura 3 mostra a interface web com os usurios do Swoogle.

Fig.3 ( Pgina do Swoogle )

O servio reconhece mais de 5 milhes de URLs, sendo mais de 2 milhes de documentos semnticos, buscados diretamente em arquivos RDF,OWL, ou atravs de pginas HTML que podem conter documentos semnticos. Mais de 10.000 ontologias esto disponveis, armazenadas em uma base de dados MySQL em forma de URIs. O swoogle pode ser acessado atravs da url: swoogle.umbc.edu

6. ANLISE DAS FERRAMENTAS DE APOIO A WEB SEMNTICA


Em nossa seo de anexos est disponvel uma tabela com as principais aplicaes e ferramentas para a Web Semntica, mas nessa seo em especial sero apresentadas e analisadas algumas aplicaes de suporte Web Semntica. As aplicaes sero categorizadas tais como: Anotao, API (Application Programming Interface), Armazenamento, Edio, Inferncia, Integrao, Consulta, Validao e Visualizao. Algumas aplicaes podem incumbir a mais de uma categoria, contudo ser considerada a categoria com maior relevncia na categorizao.

6.1 ANOTAES
Nesta categoria sero apresentadas aplicaes que proporcionam gerar anotaes (explicaes, notas) sobre documentos ou imagens.

NOME
Dose MnM OntoMat Annotizer PhotoStuff SemanticWord Swangler

LICENA
MnM LGPL MPL GPL

LINGUAGEM
Java Java Java Visual Basic Java

DOSE: plataforma distribuda de preparao semntica que prov servios semnticos, como a anotao automatizada de recursos na Web. MnM: aplicao de anotao que mune o suporte automatizado e semi automatizado para anotao de pginas Web com contedo semntico. OntoMat Annotizer: aplicao que permite a anotao de uma pgina Web em OWL. Ela ampara os trabalhos de criao e conservao de ontologias OWLs, seus atributos e relaes. Contm um navegador para descobrir a ontologia e exibir partes anotadas do texto. PhotoStuff: aplicao para anotao de imagens, admitindo ao usurio anotar pedaos da imagem de acordo com conceitos definidos em ontologias. Alm disso, aceitvel publicar o metadado gerado automaticamente. SemanticWord: aplicao que proporciona realizar associaes entre marcaes OWL e regies especficas em documento do editor de texto Word. Swangler: aplicao que cria anotaes de documentos em formato RDF que podem ser indexados e em seguida serem pesquisados na Web a partir da sua substncia semntica.

Todas as ferramentas, menos a SemanticWord, so autnomas de sistema operacional. A ferramenta DOSE fornece um intercmbio com o usurio atravs do navegador. As ferramentas MnM, OntoMat-Annotizer, PhotoStuff e SemanticWord admitem um intercmbio com o usurio de forma grfica (GUI), j a ferramenta Swangler proporciona uma interao atravs de uma API.

6.2 API (APPLICATION PROGRAMMING INTERFACE)


Nesta categoria sero apresentadas as ferramentas que do suporte as interfaces para a programao de aplicaes semnticas.

NOME
CODIP HAWK NG4J OWL API

LICENA
BSD GPL BSD LGPL

LINGUAGEM
Java Java, PL/SQL Java Java

OWL-S API Ripple Jun SOFA

LGPL MIT LGPL

Java Java Java

CODIP (Components for Ontology Processing): API que municia uma coleo de mdulos em Java para o processamento, criao e a gesto de ontologias. Ela prov suporte para OWL, XML/RDF e UML XMI (XML Metadata Interchange). HAWK: API para explanao, edio, manuseio e armazenamento de ontologias OWL. NG4J (Named Graphs API for Jena): API de expanso ao arcabouo Jena. Consente a interpretao, manuseio e a serializao de um unido de grafos. OWL API: interface e implementao Java para OWL. A API focaliza sobre o OWL Lite, OWL DL e OWL 1.1 e proporciona uma interface para inferncias. OWL-S API: prov as funes necessrias para criar e manusear arquivos OWL-S. Ripple Jun: linguagem de script que admite manusear e criar metadados RDF. SOFA (Simple Ontology Framework API): API que proporciona expressar uma ontologia pelo meio de um modelo de objetos abstratos e livre da linguagem de particularizao usada na ontologia;

As ferramentas CODIP, HAWK, NG4J, OWL API, OWL-S API, Ripple e SOFA so independentes de sistema operacional. A ferramenta CODIP disponibiliza uma influncia mtua pelo meio de uma API e linha de comandos.

6.3 ARMAZENAGEM DE DADOS


Nesta categoria sero apresentadas as ferramentas que suportam a persistncia de dados que esto formatados de ajuste com as tecnologias da Web Semntica.

NOME
RDFStore Sesame Kowari YARS

LICENA
BSD LGPL MPL BSD

LINGUAGEM
C Java Java Java

RDF Store: aplicao que proporciona guardar informaes RDF. Sesame: arcabouo RDF open source com apoio a consulta e inferncia sobre esquemas RDF. Foi desenvolvido com o objetivo de prover flexibilidade no desenvolvimento de ferramentas RDF.

Kowari: ferramenta que prov uma base de dados implementada para o armazenamento de metadados. escalvel e proporciona transaes seguras. YARS (Yet Another RDF Store): aplicao que possibilita armazenar informaes RDF.

Quanto maneira de reproduo da arquitetura RDF, as ferramentas RDFStore e YARS usam apenas modelos RDF, j a ferramenta Kowari, utiliza grafos, asseres e ontologias e a aplicao Sesame utiliza grafos e asseres. Quanto modelo de persistncia, a ferramenta RDFStore usa a memria principal e arquivos, a ferramenta Sesame usa a memria principal, arquivos e banco de dados MySQL, PostgreSQL, Oracle ou SQL Server. Quanto o uso para a consulta, a ferramenta Kowari utiliza a linguagem iTQL (Tucana SQL-like query language), a ferramenta RDFStore utiliza as linguagens RDQL e SPARQL, a ferramenta Sesame utiliza as linguagens RDFS e OWL-Lite e a aplicao YARS utiliza a linguagem N3QL (Notation3 Query Language). Como apoio ao mecanismo de inferncia, as aplicaes Kowari e Sesame usam as linguagens RDFS e OWL-Lite e a aplicao RDFStore utiliza somente a linguagem RDFS.

6.4 EDIO DE INFORMAES


Nesta categoria sero expostas as ferramentas que suportam a edio das informaes que esto formatadas de ajuste com as tecnologias disponveis para Web Semntica.

NOME
Protg Snoggle SMORE SWeDE SWOOP

LICENA
MPL BSD LGPL BSD LGPL

LINGUAGEM
Java Java Java Java Java

Prtge: um editor que proporciona criar e manusear ontologias. implementado na linguagem Java e pode, ser definido de trs maneiras: como uma aplicao que proporciona a criao e manuseio de ontologias, como uma plataforma que pode ser alargada ou agrupada em outros sistemas de representao de conhecimento ou como uma biblioteca que pode ser usada por outros sistemas de representao de conhecimento. Snoggle: aplicao grfica fundamentada em mapeamento SWRL para auxiliar no trabalho de preparao de ontologias OWL. Proporciona aos usurios visualizar a ontologia e desenhar mapeamentos de forma grfica. Os usurios desenham os mapeamentos graficamente e o Snoggle permite convert-los em SWRL/RDF ou SWRL/XML.

SMORE : aplicao planejada para proporcionar a criao e utilizao de asseres RDF associadas a ontologias, a partir de documentos HTML. SWeDE: essa ferramenta na verdade um ambiente de desenvolvimento para a plataforma Eclipse. Inclui um editor de ontologias no formato OWL, um verificador de sintaxe OWL, um conversor de OWL para Java e um visualizador grfico. SWOOP: uma aplicaopara edio de ontologias. Contm uma interface simples para a criao e manuseio de ontologias OWL. Tem como caracterstica fundamental uma navegao simples, por meio das entidades definidas nas ontologias OWL.

As ferramentas Protg, Snoggle, SMORE, SWeDE e SWOOP so autnomas de sistema operacional e proporcionam o intercmbio com o usurio por meio de uma interface grfica (GUI).

6.5 FERRAMENTAS DE SUPORTE A INFERNCIA


Nesta categoria sero apresentadas ferramentas para apoio s normas de inferncia.

NOME
Euler EulerMoz Metalog OWLJessKB Pellet

LICENA
W3C W3C W3C GPL MIT

LINGUAGEM
Java JavaScript Python Java Java

Euler: aplicao que disponibiliza um mecanismo de inferncia para a informao descrita em formato RDFS e OWL. EulerMoz: baseada na Euler, com as mesmas funes; porm, o motor de inferncia desenvolvido em JavaScript. Instance Store: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL-DL. MetaLog: aplicao que disponibiliza um motor de inferncia e um intercmbio simples com o usurio por meio da linguagem PNL (Pseudo Natural Language). OWLJessKB: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL. Pellet: aplicao que disponibiliza um motor de inferncia para a informao descrita em OWL-DL.

As ferramentas Euler, EulerMoz e OWLjessKB, como modelo de persistncia, usam a memria principal, a ferramenta MetaLog usa a memria principal e arquivos e a ferramenta Pellet usa arquivos. Analisando as ferramentas para consulta, a aplicao Euler utiliza a linguagem N3QL, a aplicao MetaLog utiliza a linguagem PNL (Pseudo Natural Language), a aplicao OWLJessKB utiliza a linguagem Jess e a aplicao Pellet utiliza SPARQL. Analisando as ferramentas como suporte ao motor de inferncia, as aplicaes Euler e EulerMoz usam as linguagens RDFS e OWL, a aplicao MetaLog usa a linguagem Prolog, a aplicao OWLJessKB utiliza as linguagens RDF e OWL-Lite e a aplicao Pellet utiliza OWL.

6.6 INTEGRAO
Nesta categoria sero apresentadas ferramentas que auxiliam o desenvolvimento de aplicaes semnticas.

NOME
4Suite Jena KAON RAP RDFGateway Redland RDF Wilbur Set

LICENA
Apache BSD LGPL LGPL Comercial LGPL -

LINGUAGEM
Python Java Java PHP C Common Lisp

4Suite: plataforma para processar e gerir os dados em arquivos XML, possui uma biblioteca de ferramentas integradas para o processamento de arquivos XML, um repositrio de dados XML e um servidor com um motor de regras. Jena: arcabouo open source para a criao de aplicaes semnticas. Ele prov uma API, ou seja, um conjunto de rotinas e padres estabelecidos, para extrair e escrever dados em grafos RDF. KAON: infraestrutura para a gesto de ontologias com foco em aplicativos de negcio. RAP: pacote de software para anlisar, consultar, manusear, a serializao e apresentao de modelos RDF. RDF Gateway: plataforma para o desenvolvimento e distribuio de aplicaes semnticas. Redland RDF: um unido de bibliotecas gratuitas que proporciona o desenvolvimento e manuseio de modelos RDF.

Wilbur Set: caixa de ferramentas (toolkit) para desenvolver aplicaes semnticas que utilizam RDF.

Para a representao da arquitetura RDF, a ferramenta Wilbur utiliza modelos e asseres, a aplicao 4Suite utiliza somente asseres, a aplicao RDF Gateway utiliza modelos, grafos e asseres e as ferramentas Jena, KAON, RAP e RedLand utilizam asseres,grafos e ontologias. Quanto a atuao das ferramentas como modelo de persistncia, a aplicao Wilbur utiliza somente a memria principal, a aplicao 4Suite utiliza a memria principal, arquivos e banco de dados PostgreSQL, a aplicao Jena utiliza a memria principal, arquivos e os banco de dados Berkeley, MySQL ou SQLite, a aplicao KAON utiliza a memria principal e banco de dados SQL Server, PostgreSQL, IBM DB2 ou Oracle 9i, a aplicao RAP utiliza a memria principal e qualquer banco de dados compatvel com o ADObd (ActiveX Data Objects Data Base), a aplicao RDF Gateway utiliza memria principal, arquivos e qualquer banco de dados compatvel com OleDB (Object Linking and Embedding Data Base) e a aplicao Redland utiliza memria principal, arquivos e banco de dados MySQL, PostgreSQL, Oracle, Berkeley, SQL Server ou DB2. Analisando nossas ferramentas quanto consulta, a aplicao 4Suite utiliza a linguagem Versa, as aplicaes Jena e Redland utilizam as linguagens RDQL e SPARQL, a aplicao KAON utiliza a linguagem KAON, a aplicao RAP utiliza a linguagem RDQL, a aplicao RDF Gateway utiliza a linguagem RDFQL (RDF Data Query Language) e a aplicao Wilbur utiliza a linguagem WQL (Windows Management Instrumentation Query Language). Como apoio ao motor de inferncia, a ferramenta KAON utiliza as linguagens RDFS e OWL-Lite, as ferramentas RAP e RDF Gateway utilizam a linguagem RDFS e OWL, a ferramenta Redland utiliza as linguagens RDFS, OWL-Lite e DIG e a ferramenta Wilbur usa a linguagem RDFS.

6.7 APLICAES PARA CONSULTA


Nesta categoria sero apresentas as aplicaes para consultar por informaes que esto definidas de acordo com as tecnologias RDF ou OWL.

NOME
Cwm OWL-QL OWLS-TC

LICENA
W3C BSD GPL

LINGUAGEM
Python Java Java

Cwm (Closed World Machine): aplicao que proporciona consultar, verificar e filtrar informaes descritas em RDF/XML e N3. OWL-QL (OWL-S Service Retrieval Test Collection): aplicao que utiliza uma linguagem e um protocolo de consulta formal, especificados em OWL, para a interao entre agentes inteligentes.

OWLS-TC: aplicao que proporciona ponderar a performance de algoritmos de servios de OWL-S.

As ferramentas Cwm, OWL-QL e OWLS-TC so autnomas de sistema operacional. Analisando essas ferramentas quanto maneira de interagir com o usurio, a ferramenta Cwm disponibiliza entrada via API e linha de comandos. Para a reproduo da arquitetura RDF, a aplicao Cwm usa apenas modelos e para consulta a aplicao Cwm utiliza a linguagem N3.

6.8 VALIDAO DE INFORMAES


Nesta categoria sero apresentadas ferramentas para validar se as informaes so colocadas de acordo com as tecnologias da Web Semntica.

NOME
ConsVISor OWL Validator SWRL Validator

LICENA
BSD BSD

LINGUAGEM
Java Java Java

ConsVISor: aplicao que faz a verificao da consistncia de documentos OWL. Os resultados so colocados em uma pgina Web ou atravs de anotaes OWL. OWL Validator: aplicao para a verificao da consistncia de documentos OWL. SWRL Validator: aplicao para a verificao da consistncia de anotaes em SWRL (Semantic Web Rule Language).

As ferramentas ConsVISor, OWLValidator e SWRLValidator so autnomas de sistema operacional. Quanto maneira de interagir com o usurio, as ferramentas OWL Validator e SWRL Validator contm acesso via Web, uma API e linha de comandos. A ferramenta ConsVISor disponibiliza acesso via Web.

6.9 VISUALIZAO DE INFORMAES


Nesta categoria sero apresentadas ferramentas para manuseio e visualizao informaes definidas de acordo com as tecnologias da Web Semntica.

NOME
DumpOnt IsaViz

LICENA
BSD -

LINGUAGEM
Java Java

Object Viewer OWL-P SVG-OWL Viewer VIVID

BSD MPL

Java Java Java Java, Javascript, XMI

DumpOnt: aplicao para expor graficamente, por meio da Web, a hierarquia de classes e propriedades presentes em uma ontologia OWL. IsaViz: aplicao que proporciona o manuseio de modelos RDF graficamente. ObjectViewer: aplicao para apresentao graficamente, por meio da Web, grafos RDF. OWL-P: uma aplicao que determina uma ontologia OWL que pode ser utlizada como um protocolo para ontologias OWL. SVG-OWL Viewer: aplicao que proporciona a exibio de ontologias graficamente usando o formato SVG. VIVID: aplicao que proporciona a visualizao e publicao de estruturas em OWL e RDF.

A ferramenta VIVID (Visual Variable-Depth Info Display) foi feita para executar no sistema operacional Windows NT/2000, j as outras aplicaes DumpOnt, IsaViz, Object Viewer, OWL-P e SVG-OWL Viewer so autnomas de sistema operacional. Quanto forma de intercmbio com o usurio, a ferramenta VIVID disponibiliza a interao por meio da Web, as aplicaes IsaViz, Object Viewer, OWL-P e SVG-OWL Viewer disponibilizam a interao por meio de interfaces desktops do tipo GUI e a ferramenta DumpOnt disponibiliza a interao por meio da Web, via API ou linha de comandos.

7. CONTRIBUIES PARA A CINCIA DA INFORMAO


Os estudiosos da cincia da informao creem que na convergncia destas tecnologias e ferramentas apresentadas, podero surgir alternativas para suportar um uso mais significativo e eficaz do grande patrimnio disponvel nas redes de informao. A ordem que se iniciou com o XML a possibilidade de sistemas diferentes conversarem entre si. Tudo indica que os padres que esto sendo desenhados para esta nova Web tambm sejam adotados na arquitetura de bibliotecas digitais e de novos sistemas de informao. Espera-se que estas tecnologias tambm tragam mudanas para a rea e a atividade dos profissionais da cincia da informao. Na prxima seo, ser apresentado algumas atividades bem especficas que sero possibilitadas ou melhoradas com esta nova Web.

7.1 APERFEIOAMENTO E MELHORAMENTO DOS BUSCADORES


Com a marcao semntica das informaes, h uma nova mirade de possibilidades para o projeto de mecanismos de recuperao de informaes. Nota-se uma preocupao atual por parte dos maiores motores de busca em se preparar para essa outra verso da Web (Marchiori, 1998), que constituda gradualmente de um nmero cada vez maior de documentos marcados semanticamente. Faz parte do escopo da cincia da informao o estudo de processos de indexao e recuperao de informaes e, nesta perspectiva, bem provvel que venhamos a confrontar nossas linguagens artificiais de indexao com as metodologias de marcao semntica dos dados representadas pelos metadados e namespaces da Web Semntica e, tambm, da lgica formalizada do XML e do RDF.

7.2 NOVAS INTERFACES COM O USURIO PARA SISTEMAS DE INFORMAO


O estudo de interfaces dos sistemas de informao, como os motores de busca, com o usurio, ganha um novo impulso com aumentadas possibilidades da Web Semntica, uma vez que a lgica intuitiva e natural do RDF permite que projetemos interfaces para sistemas de informao de forma mais intuitiva e coerente com o funcionamento cognitivo dos seres humanos. Alm disso, com os agentes inteligentes, poderemos aprimorar e personalizar a utilizao dos perfis de usurios para que a interao destes com os sistemas seja mais significativa e gil. A lgica de triplas do RDF casa-se sobremaneira com a construo de mapas conceituais (Novak, 1977), e podemos adotar estratgias de visualizao como as geometrias hiperblicas (Lamping, 1995).

7.3 GESTO DO CONHECIMENTO ORGANIZACIONAL


De acordo com Teixeira Filho (2000), a gesto do conhecimento organizacional nasce da confluncia entre tecnologia da informao e administrao e se posiciona entre os campos da cultura organizacional, estratgia empresarial e sistemas de informao de uma organizao. Outros autores poderiam acrescentar o campo da educao corporativa e de recursos humanos, e um dos campos de estudo da cincia da informao. Podemos apontar a grande confluncia das tecnologias tornadas disponveis pela Web Semntica e as necessidades de gesto do conhecimento organizacional. Com o aumento das possibilidades de recuperao de documentos e da interoperabilidade entre os sistemas, podemos esperar maior funcionalidade de portais corporativos, tecnologia-smbolo da gesto do conhecimento. Com as ontologias comunitrias e da padronizao dos metadados, torna-se mais fcil a tarefa de explicitar, classificar e armazenar o conhecimento produzido pelos ativos de capital intelectual da organizao.

CONSIDERAES FINAIS
Os conceitos bsicos da Web Semntica para o desenvolvimento deste trabalho foram vistos, tais como as tecnologias difundidas, as aplicaes que usa ideologias semnticas e a explanao tcnica de como o alicerce semntico. Todo esse conhecimento descrito aliado ao conhecimento tcnico possibilitou que fosse feita uma anlise das aplicaes que do apoio a Web Semntica. Por fim, a didtica ligada ao trabalho inferiu em um captulo dedicado aos benefcios da aplicao desta nova web aos estudiosos da informao e a prpria cincia da informao.

ANEXOS

Fig anexo (Ferramentas para Web Semntica)

REFERNCIAS BIBLIOGRFICAS
[1] Semantic Web and Other W3C Technologies to Watch. http://www.w3.org/2006/Talks/1023-sb-W3CTechSemWeb/, ltimo acesso em maio de 2012. [ANEXO] JARDIM, Andr Desessards. Ferramentas e Aplicaes para a Web Semntica. Universidade Catlica de Pelotas . Mini Curso Web Semntica (Mdulo 09) DECKER, S. et al. The semantic web: the roles of XML and RDF. IEEE Expert, v. 15, n. 3. Oct. 2000. HYACINTH, Nwana. Software Agents: An Overview. Engineering Review, Vol. 11, Num. 3. Cambridge University Press, 1996. LAMPING, J; RAO, R.; PIROLLI, P. A Focus+context technique based on hyperbolic geometry for visualizing large hierarchies. Disponvel em: <http://www.acm.org/sigchi/chi95/proceedings/papers/jl_bdy.htm>. Acesso em: maio de 2012. LANCASTER, F. W.; WARNER, A. J. Information retrieval today. Information Resources, 1993. MARCHIORI, Massimo. The limits of web metadata, and beyond. In: INTERNATIONAL WORLD WIDE WEB CONFERENCE, 7., 1998. Computer networks and ISDN systems. Proceedings... [S. l. : s.n. ], 1998. v. 30. p. 1-9. MOF 2.0/XMI Mapping, Version 2.1.1. MOF2.0/XMIMapping,Version2.1.1, ltimo acesso em maio de 2012. MOREIRA, Daniele. Ajude a construir a Web Semntica. Disponvel em: http://info.abril.com.br/professional/desenvolvimento/ajude-a-construir-a-websemantica.shtml. Acesso em: abril de 2012. NOVAK, J. D. A theory of education. Ithaca, NY : Cornell University, 1977. PICKLER, M. Web Semntica: Ontologias como Ferramentas de Representao do Conhecimento. Perspectivas em Cincia da Informao, 2007. PRADA, Rodrigo. O que web semntica? Disponvel em: http://www.tecmundo.com.br/800-o-que-e-web-semantica-.htm. Acesso em: abril de 2012

Semantic Web and Other W3C Technologies to Watch. http://www.w3.org/2006/Talks/1023-sb-W3CTechSemWeb/, ltimo acesso em abril de 2012 SILVA, Alberto Sales e. Web Semntica: o estado da arte. Disponvel em: http://pt.scribd.com/doc/7253958/Web-Semantica-Estado-Da-Arte. Acesso em: maio de 2012. SMORE. http://www.mindswap.org/2005/SMORE, ltimo acesso em abril de 2012. SNOOGLE. http://snoggle.projects.semwebcentral.org/, ltimo acesso em maio de 2012. SOFA. http://projects.semwebcentral.org/projects/sofa/, ltimo acesso em abril de 2012. SOUZA, R; ALVARENGA, L. A. Web Semntica e Suas Contribuies para a Cincia da Informao. Cincia da Informao, 2004. SOUZA, Renato Rocha e ALVARENGA, Ldia. A Web Semntica e suas contribuies para a cincia da informao. Ci. Inf. [online]. 2004, vol.33, n.1, pp. 132-141. ISSN 0100-1965. Start-Up Aims for Database to Automate Web Searching, The New York Times, 09-032007. Pgina visitada em maio de 2012. SWRL Validator. http://projects.semwebcentral.org/projects/swrl-val/, ltimo acesso em abril de 2012. TEIXEIRA FILHO, J. Gerenciando conhecimento. Rio de Janeiro : Senac, 2000. VIVID. http://projects.semwebcentral.org/projects/vivid/, ltimo acesso em abril de 2012. W3C. Architecture of the World Wide Web, Volume1. Disponvel em: http://www.w3.org/TR/webarch/,ltimo acesso em abril de 2012. W3C. Extensible Markup Language (XML) 1.0 (Fourth Edition). http://www.w3.org/TR/2006/REC-xml-20060816/,ltimo acesso em abril de 2012. W3C. SPARQL Query Language for RDF. http://www.w3.org/TR/rdf-sparqlquery,ltimo acesso em abril de 2012.

W3C.WorldWideWeb Consortium. http://www.w3.org/,ltimo acesso em abril de 2012. Web Semntica ou web 3.0, o que e para que serve?, disponvel em: http://www.oficinadanet.com.br/artigo/1831/web_semantica_ou_web_3.0_o_que_e _e_para_que_serve, ltimo acesso em: maio de 2012. Welkin. http://simile.mit.edu/welkin/, ltimo acesso em abril de 2012. Wilbur. http://wilbur-rdf.sourceforge.net/, ltimo acesso em abril de 2012. WILSON, Tracy V. Como funciona a web semntica. Disponvel em: http://informatica.hsw.uol.com.br/web-semantica.htm.Acesso em: maio de 2012 YARS. http://sw.deri.org/2004/06/yars/, ltimo acesso em maio de 2012.