Vous êtes sur la page 1sur 13

DataGramaZero - Revista de Cincia da Informao - v.2 n.

6 dez/01

ARTIGO 05

A Teoria do Conceito Revisitada em Conexo com Ontologias e Metadados no Contexto das Bibliotecas Tradicionais e Digitais
Concept Theory Revisited in Conection with Ontologies and Metadata in Traditional and Digital Libraries Context

por Ldia Alvarenga

Resumo: Ensaio baseado na literatura e na reflexo dedutiva da autora, bibliotecria e atualmente professora da rea de tratamento da informao e bibliometria, na Escola de Cincia da Informao da UFMG. O pressuposto bsico do trabalho se ancora na afirmao de que o conceito se constitui no componente invarivel do processo de organizao de bibliotecas tradicionais e digitais. Sua fundamentao conceitual aborda: a) fundamentos da teoria do conceito, sob a tica da cincia da informao e suas relaes com os metadados, ontologia e o processo de classificao; b) peculiaridades e restries intervenientes no processo de organizao e tratamento da informao; c) e alguns fatores especficos inerentes representao e recuperao de informaes. O artigo ressalta potencialidades, ainda pouco exploradas, dos recursos tecnolgicos na criao de bibliotecas digitais e chama ateno para o fato de que as atuais tentativas de classificao automtica de documentos repetem as experincias de muitas dcadas, realizadas na rea da cincia da informao, alcanando-se resultados ainda bastante limitados. As reflexes empreendidas levam a que se conclua que, para superar o problema do registro e anlise conceituais, tornar-se-a necessria a criao de uma nova linguagem entendida por mquinas e seres humanos e que possibilitasse igualmente a codificao de conceitos discursivos, grficos e sonoros. O tratamento da web, tal como vem sendo proposto por alguns sistemas de metadados, torna-se factvel, caso este se processe em nvel da produo do documento primrio, na construo de hipertextos, ou seja, apriorsticamente. O tratamento a posteriori ao proceso de produo apresenta-se como um recurso pouco exeqvel, devido a grande quantidade de objetos de diferentes tipos, expostos e dispersos na web, a cada segundo e a impossibilidade de execuo pela mquina de processos interpretativos dos conceitos que compem os objetos digitais. Palavras chave: Bibliotecas digitais; Metadados; Ontologias; Teoria do conceito; Bibliotecas Abstract: This essay is based on author thoughts originated from scientific literature and her experiences and professional and academic life in library science schools and librarianship context in Brazil. The article basic presupposition posed is that concept, as the principal thought element, represent the unchanging part in the process of migration from traditional to digital libraries. As conceptual foundation the article outstands: concept theory, ontology, metadata and classification. The results point to changes in resources production and technical processing in digital context, concerning with the weakness of atual language, that could have been changed in the future. The present endeavour toward to documents automatic classification repeats old experiences in information science research arena. The information treatment from web documents today only would be possible a priori, i.e., with the author responsibility, in the moment of the genesis of documents; the same task a posterior could get impossible, caused by the large amounts and sorts of digital documents in www. Key-words: Digital libraries; Libraries; Metadata; Ontology; Classification; Concept theory

Introduo, problema e contexto Este artigo constitudo de um ensaio em que se prope delinear uma estrutura terico-conceitual que vise fundamentao de pesquisas no campo das bibliotecas digitais. Seu pressuposto bsico se ancora na afirmao de que o conceito se constitui no componente invarivel do processo de organizao de bibliotecas tradicionais e digitais e sua fundamentao conceitual aborda: a) fundamentos da teoria do conceito sob a tica da cincia da informao e suas relaes com os metadados, ontologia e o processo de classificao; b) peculiaridades e restries intervenientes no processo de organizao e tratamento da informao; c) e alguns fatores especficos inerentes representao e recuperao de informaes, fatores esses que se localizam no complexo espao digital do qual participam produtores de documentos, bibliotecrios e usurios. O presente texto emerge de reflexes a partir da literatura publicada e da experincia e vivncia da autora no campo da biblioteconomia, como bibliotecria, coordenadora de sistemas de informao nas reas dos transportes e da educao, pesquisadora e professora universitria, atuando atualmente no ensino e na pesquisa na rea do tratamento da informao e bibliometria. Reportando-se a Goethe, Vickery j afirmava em 1986 que toda a representao do conhecimento simblica e constitui-se em matria que vem preocupando o mundo da documentao desde a sua origem. Partindo-se da definio de que representar significa o ato de colocar algo no lugar de, pode-se classificar em nvel primrio a representao simblica feita pelos autores, no momento da expresso dos resultados de suas observaes metdicas sobre a natureza, utilizando-se das linguagens disponveis no contexto da produo e comunicao de conhecimentos. Nessa representao as lnguas dos diversos povos e lnguas de especialidades desempenham papel primordial.

Em instncia profissional de intermediao entre o conhecimento e seus usurios potenciais, os bibliotecrios vm desempenhando, no exerccio de suas funes profissionais, diferentes tipos de representaes, que podem ser vistas como de natureza secundria, envolvendo a substituio da informao primria por registros especficos a ela relativos. Nos catlogos dos sistemas e servios de informao mantidos especialmente no mbito de bibliotecas, a informao primria textual, sonora ou grfica encontra-se representada por novos conjuntos de informaes, dando origem a produtos que poderiam ser considerados metainformaes ou metadocumentos. Na catalogao bibliogrfica tradicional, o documento representado por um conjunto de informaes relativas sua descrio fsica e pontos de acesso, representao esta preparada e armazenada em um contexto fsico independente do documento primrio. Considerando-se que o novo espao digital tenha se expandido, pode-se dizer ilimitadamente, os acervos de objetos digitais, gerados em mbitos particulares e institucionais se multiplicaram, tanto no que tange sua tipologia quanto sua complexidade. Dentre esses objetos encontram-se dentre outros, textos das mais variadas naturezas, home-pages, listas de discusso, software em geral, padres, protocolos e outros dispositivos essenciais implementao das tecnologias digital, objetos esses que passam a requerer diferentes tipos de ndices e pontos de acesso, visando-se a uma recuperao bem sucedida. medida que as tecnologias da informao foram sendo criadas, disponibilizadas e aperfeioadas, os sistemas de representao e recuperao de informaes documentais assistiram a uma extrapolao dos limites dos tradicionais catlogos referenciais em fichas, alcanando as bases de dados online. Essa nova situao resultou em uma grande mudana no ambiente dos sistemas de representao, assistindo-se a um gradual envolvimento de bibliotecrios com profissionais oriundos de outros campos de conhecimento, destacando-se dentre estes o pessoal da cincia da computao e da lingstica e tambm os produtores comerciais de bases de dados, nos mais diversos campos de conhecimento. Estimuladas pelo apelo advindo das novidades tecnolgicas, relacionadas com as bibliotecas e arquivos digitais, algumas pessoas costumam ter em nossos dias uma viso equivocada das bibliotecas tradicionais, considerando-as como na situao descrita por Rasmussen (1999, p. 397), em que tais instituies so vistas essencialmente como detentoras de colees de livros empoeirados, acessveis atravs de catlogos em fichas. Segundo o citado autor, essas pessoas demonstram desconhecer o fato de terem sido as bibliotecas as primeiras instituies a fazerem uso dos sistemas automatizados de recuperao de informaes. Embora o reconhecimento formal de bibliotecas digitais seja relativamente novo, conhecido que algumas bibliotecas tradicionais, especialmente nos pases econmica e tecnologicamente mais desenvolvidos, j vinham se aperfeioando no que se refere ao uso das tecnologias de processamento eletrnico de dados, desde que comearam a organizar e oferecer acesso a bases de dados referenciais online, e que os OPAC's (on-line public access catalogs) passaram a ter uma maior presena no contexto de bibliotecas, ambos fenmenos que, em escala de maior intensidade, remontam ao final dos anos 60 e incio dos anos 70. O advento do mundo digital ocasionou, entretanto, novas mudanas no trabalho de autores e bibliotecrios, fazendo com que estes, de repente, envolvessem-se com novas possibilidades tecnolgicas, diretamente incidentes nos processos de produo, armazenagem, tratamento e recuperao de documentos e informaes, alterando de forma radical seus processos de trabalho e produtos finais. Em decorrncia dessa verdadeira ruptura, compartilham hoje do mesmo espao de produo os autores de textos, sons e imagens, fixas ou em movimento, geradas em todos os quadrantes do mundo civilizado, juntamente com profissionais dedicados s tarefas de organizao de conjuntos especficos de e informaes e de criao de meios para recuper-los. Nesse complexo processo, vem sendo construdo um ilimitado e cambiante universo constitudo dos denominados objetos digitais. O meio digital se constituiu, portanto, no espao sem precedentes para o registro e recuperao de documentos textuais, sonoros e imagticos e que, ao ensejar uma enorme gama de possibilidades de armazenagem, memria e formatos, passou tambm a requerer novos elementos facilitadores de sua recuperao. Pode ser destacada como uma das principais mudanas ocorridas, com a implantao e desenvolvimento da plataforma www e da internet, a contingncia denominada de desterritorializao do documento, ou seja, o fato de passar o documento a ter sua materialidade desvinculada da forma fsica anterior, assumindo a forma digital, que possibilita uma organizao espacialmente integrada de textos, imagens e sons. Com o advento e intensificao do uso da internet, a chamada biblioteca digital tornou-se realidade. Em constante evoluo, esse novo e potente meio de comunicao vem possibilitar, finalmente, a concretizao do sonho da biblioteca sem paredes, da grande biblioteca universal, preconizado por pensadores, dentre os quais podem ser citados os enciclopedistas franceses e Jorge Lus Borges, que um dia sonharam com a possibilidade de

existncia de uma biblioteca que pudesse abarcar a totalidade dos conhecimentos produzidos, em todos os recantos do mundo; a concretizao, enfim, de uma situao dantes utpica e recorrente em inmeros momentos da evoluo do pensamento cientfico e filosfico da humanidade. Podemos identificar em artigo publicado por Vickery (1986), ainda nos anos de 1980, uma verdadeira anteviso de que, com o advento do computador e a conseqente mudana de paradigma quanto prpria materialidade dos documentos, o trabalho de tratamento da informao extrapolaria as fronteiras dos campos da biblioteconomia e correlatos, envolvendo novas situaes, fatores e elementos diversos inerentes ao trabalho de profissionais vinculados a diferentes campos disciplinares, ampliando o campo de pesquisa relativo biblioteca. Como exemplos desse tipo de situao o autor destaca: a estrutura dos registros e arquivos em bases de dados; as estruturas de dados em programas de computador; as estruturas semnticas e sintticas da linguagem natural; a representao do conhecimento na inteligncia artificial; os modelos de memria humana. Em todas essas instncias, tornar-se-a necessrio que se decidisse como os vrios tipos de conhecimentos, informaes e instrumental tecnolgico deveriam ser representados [ou identificados] [*]. Segundo Vickery, diferentes tipos de dados requereriam diferentes tcnicas de representao. Da a diversidade de tipos de "tratamento da informao", desempenhados nos contextos das bibliotecas, arquivos, museus e hoje na www, a grande plataforma de exposio de objetos digitais, com a qual to rapidamente aprendemos a conviver. A representao do conhecimento, em nossos dias, no compreende somente a substituio do documento primrio por uma informao catalogrfica. Considerando-se que o documento no se acha fisicamente em outro espao, mas no prprio meio que lhe proporciona materialidade, novas formas de se criar ndices de recuperao foram ensejadas. No novo contexto de produo, organizao e recuperao de objetos digitais, as metas de trabalho no se restringem criao de representaes simblicas dos objetos fsicos constantes de um acervo, mas compreendem estabelecimento dos denominados metadados, muitos dos quais podem ser extrados diretamente dos prprios objetos, constituindo-se esses em chaves de acesso a servio dos internautas. Por biblioteca tradicional, entende-se a instituio social, criada com a finalidade de se adquirir, tratar, armazenar, disseminar e disponibilizar documentos, em sua materialidade convencional, independentemente de sua forma fsica ou suporte (livro, peridico, mapa, gravura, filme, cd-rom, etc.), armazenados em instituies determinadas. As bibliotecas constituem-se, pois, em sistemas formais de preservao e memria dos saberes e do conhecimento pblico de natureza cientfico, tecnolgico e cultural, na acepo de John Ziman, caracterizvel por possuir as qualificaes de conhecimento derivado, acumulado e publicado. consenso afirmar que, sem bibliotecas, no haveria cincia, tecnologia ou as demais manifestaes, ficando o conjunto do conhecimento restrito aos saberes limitados ao escopo da memria oral coletiva ou dos eventuais registros humanos dispersos. Por biblioteca digital entende-se, por outro lado, um conjunto de objetos, concebidos em meio digital, desmaterializados de sua condio fsica tradicional, constitudos de funes inteiramente novas que lhes garantem a hipertextualidade e carter multimiditico, tornando-os passveis de acatar novos e peculiares arranjos e tipos de abordagem, no processo de sua recuperao. De forma simplificada, a biblioteca digital, pode ser definida como um conjunto de objetos digitais construdos a partir do uso de instrumentos eletrnicos, concebidos com o objetivo de registrar e comunicar pensamentos, idias, imagens e sons, disponveis a um contingente ilimitado de pessoas, dispersas onde quer que a plataforma www alcance. A partir do pensamento de autores contemporneos (Watson-Verran e Turnbull apud Bishop et al, 2000), Dias (2001) destaca do conceito de biblioteca digital a afirmao de que : "[...] a biblioteca digital parece estar se firmando como um conjunto de artefatos, conhecimento, prticas e uma comunidade que engendra compromissos realsticos assumidos por profissionais da informao, analistas de sistemas e usurios". O conceito, segundo a sntese feita por Dias, expressaria um amlgama formado pela mistura de lugares, corpos, vozes, habilidades, prticas, mecanismos tcnicos, teorias, estratgias sociais e trabalho coletivo, elementos estes que em conjunto constituiriam a instncia dos conhecimentos/prticas tecno-cientficas, com as prticas ativas e em evoluo

substitutas da considerada passiva e esttica estrutura tradicional (Dias, 2001, p.4). Com inspirao no texto de Jessica Milstead, em seu trabalho no Annual Meeting of The American Society for Information Science, edio 1999, pode-se afirmar que o paradigma da biblioteca digital diferente da biblioteca tradicional. Se por um lado, as bibliotecas h alguns anos tenham procurado transpor seus prprios muros para atender aos pedidos de seus usurios, j se utilizando de novas tecnologias eletrnicas para a organizao de seus catlogos, por outro lado a dependncia de acervos fsicos dispersos constitua-se no fator primordial de sua existncia. Com o advento das redes e sistemas de bibliotecas, ainda na forma tradicional, chegou-se a vislumbrar a existncia de bibliotecas sem acervo, sem paredes, sem livros, ou seja, j se podia conviver com a possibilidade de se prestar um servio de acesso a documentos primrios, localizando-se e acessando-se documentos por meio de catlogos online, obtendo-se os textos primrios atravs dos servios de comutao e emprstimos entre bibliotecas. Ampliando-se o escopo do conceito, poder-se-a considerar a biblioteca digital um termo genrico que simboliza todo o conjunto de objetos digitais existentes, aleatoriamente colocados na web. J num contexto mais limitado, afirma-se que uma biblioteca digital pode estar circunscrita a um segmento definido e identificvel de objetos, organicamente articulados e voltados para interesses especficos de um grupo. Ao invs de se acessar fisicamente os documentos utilizando-se de catlogos, sejam estes processados eletronicamente ou no, os objetos digitais na biblioteca digital se posicionam em sua completude, diretamente no ciberespao. As mudanas que ensejaram a existncia das bibliotecas digitais constituem-se em verdadeira ruptura com o status quo, considerada por muitos de forma semelhante inveno da imprensa por Gutenberg, por volta do ano de 1500. Atualmente, os principais problemas tcnicos e de utilizao relativos s bibliotecas digitais poderiam ser resumidos: a) nas dificuldades relacionadas ao financiamento de infra-estrutura e de acesso amplo pelas diversas camadas da sociedade, especialmente em pases em desenvolvimento; b) na organizao do enorme potencial de documentos disponveis na web; c) na modelagem e arquitetura de dados que viabilizem um melhor acesso dos usurios da rede digital, em meio massa exponencialmente crescente de recursos disponveis. Embora detentora de inesgotvel capacidade de memria, socializao e poder de comunicao, antes apenas vislumbrados, a internet vem sendo s vezes desqualificada, por ser composta de fontes transitrias e de provenincia pouco segura. Segundo Woodward, as fontes hoje existentes na internet perfazem numericamente muitos milhes de unidades, distribudas em milhares de servidores, cada um com seus hardware e software prprios. Constata-se, entretanto, que esse material pouco organizado, de qualidade e estabilidade varivel, sendo portanto difcil conceitu-lo, acess-lo, pesquis-lo, filtra-lo e referenci-lo utilizando-se dos processos tradicionalmente executados no mbito da biblioteconomia e da cincia da informao. Ao prever a evoluo do sistema de editorao eletrnica em meio digital, essncia das bibliotecas digitais, Lancaster ressalta que, num primeiro estgio, a publicao eletrnica portaria as mesmas caractersticas das publicaes convencionais, em papel, da mesma forma que os catlogos em linha nada mais so que catlogos em fichas em forma eletrnica. Uma verso eletrnica seria um anlogo direto de uma pgina impressa. As publicaes verdadeiramente eletrnicas somente surgiriam, segundo o autor, numa segunda fase, "uma fase na qual as novas publicaes sero projetadas ad initio para exclusiva distribuio eletrnica. Nessa fase sero exploradas as possibilidades reais da eletrnica e as novas publicaes se despojaro por completo das limitaes inerentes impresso e papel, quer dizer um modo de apresentao da informao esttico, essencialmente linear". Falando de possibilidades das publicaes digitais, o autor destaca que: "[...] elas sero dinmicas e multidimensionais, ao invs de estticas e unidimensionais. Uma descrio narrativa ser apresentada como um hipertexto, reorganizvel sob o controle do usurio. Muitas ilustraes estticas sero substitudas por animao ou por modelos analgicos eletrnicos (por exemplo, ilustraes de fenmenos fsicos, operaes de equipamentos, realizao de uma experincia). Tambm haver a complementao do texto ou das ilustraes por meio de sada de udio, caso sejam adotadas certas formas de distribuio eletrnica" (Lancaster, 1991,p.268). Cumpre ressaltar que as publicaes eletrnicas brasileiras parecem, em sua maioria, ainda se enquadrar na primeira fase prevista em que o uso das novas tecnologias acha-se muito aqum de sua potencialidade.

Conceito como elemento invarivel O que mudou com o advento das bibliotecas digitais no foram, portanto, os contedos nem a essncia das mensagens veiculadas, mas a forma e o meio atravs dos quais os documento passaram a ser produzidos e registrados: um meio mais leve, gil e dinmico em suas possibilidades de processamento e comunicao. O que na realidade mudou com o advento do meio digital foi a possibilidade de disponibilizao virtual de documentos multimdia completos, num espao amplo e interconectado de acesso remoto, assim como a capacidade de memria e a expanso das relaes entre documentos e componentes intervenientes nos conceitos neles expressos. Tambm se constitui em fator de mudana a possibilidade de abordagem intertextual presente nos sistemas de hipertexto. Os contedos dos documentos, sejam eles digitais ou no, no sofreram quaisquer alteraes; porquanto suas existncias se referem a objetos, pensamentos e idias presentes no mundo cognoscvel e no imaginrio da humanidade, em sua necessidade bsica de comunicao. No houve uma alterao no sistema de gnese e registro dos pensamentos, atravs de signos verbais lingsticos, sonoros ou grficos. Os autores continuam produzindo textos, sons e imagens, utilizando-se das linguagens disponveis e consensualmente aceitas. A parte substancial dos documentos que se refere a seu contedo, sua atinncia, ao seu significado, os enunciados que compem os conceitos neles contidos, tudo isso continua invarivel; tudo isso uma contingncia com a qual as mquinas tm que conviver e dai decorre a dificuldade primordial do processo de tratamento da informao, antes em ambientes tradicionais e hoje na web. De conceitos mais ou menos intensamente construdos so produzidos os documentos que, relativos aos referentes do mundo fsico, social e emocional observados, percebidos e sentidos pelo homem, caracterizam-se ao mesmo tempo como pertencentes igualmente s esferas especficas da unidade e da diversidade. Classificando-se ora como entes distintos entre si, ora portadores de caractersticas similares que lhes outorgam relaes de interdependncia e interdisciplinaridade, os conceitos que formam os documentos envolvem fatores que muitas vezes vm "sacudir" (na acepo foucaultiana do termo) a certeza de especificidade que pode decorrer de objetividades inadvertidas oriunda de nossos sentidos imediatos. O que na realidade se classifica em uma biblioteca tradicional ou digital no so os documentos, mas os conceitos contidos nesses documentos. Deve-se ressaltar que no somente os textos so formados de conceitos, mas tambm as imagens fixas e em movimento e os sons, fato que vem dificultar sobremaneira os projetos de classificao automtica de documentos na web. O estudo da gnese e formao dos conceitos vem sendo feito ao longo da histria do pensamento filosfico e cientfico, em diversos campos disciplinares, destacando-se a filosofia, a semntica, a psicologia, a biblioteconomia, a terminologia, sempre envolvendo as bases cognitivas e lingsticas do conhecimento e saberes humanos. Por teoria do conceito entende-se, neste trabalho, o conjunto de enunciados oriundos de pesquisas e reflexes pertinentes complexa regio epistemolgica interdisciplinar que compreende o ato de representao, comunicao e preservao de objetos e pensamentos e cujo conhecimento integra os campos da linguagem, da psicologia cognitiva, da comunicao e da cincia da informao. Neste estudo, o conceito e a compreenso do que seja conceito tema crucial, por pertencer essncia do trabalho de tratamento e organizao da informao, compreendendo os processos de anlise de assunto, classificao e recuperao da informao. Embora muito se fale sobre o conceito, nem sempre se tem clareza de seu significado. At mesmo partindo da prpria etimologia do termo, existem discusses que merecem ser resgatadas. Dahlberg chama ateno para um fato relacionado aos componentes essenciais de um conceito relativo a um referente qualquer.Considerando-se que, para Aristteles,o significado do conceito (horos) inclua trs elementos, logos, pragma e noema, Dahlberg ressalta que, no processo de traduo de horos, a partir do pensamento do filsofo grego, Boethius tenha vertido o termo para o latim utilizando-se o vocbulo terminus, que privilegia somente o logos, o lado lingstico do conceito; ficou portanto falha a correspondncia do termo. Esta confuso ensejou, segundo a renomada terica do conceito, a que filsofos posteriormente tenham preferido o uso de terminus, considerando estar includo neste termo o elemento conceitual e tambm o elemento meramente lingstico. Ainda segundo Dahlberg, sabido que Christian Von Wolff (1679-754) tenha traduzido corretamente por conceito o termo horos, que quer dizer conjuntamente signo (termo) e contedo. O tringulo de Ogden & Richards, publicado no clssico livro "O significado de significado...", publicado em primeira edio em 1923, edio brasileira de 1972, tem sido muito utilizado para se representar o conceito devido a sua clareza e facilidade de compreenso. O referido diagrama espelha-se em um tringulo em que, no vrtice superior encontra-se o objeto da realidade; no vrtice da direita o conceito, formado de todos os

enunciados que podem ser proferidos sobre o referente; e no vrtice da esquerda encontra-se o smbolo, o signo, termo, nmero, cone, designando o conceito sobre o objeto referente. So recorrentes, desde a antiguidade grega as discusses sobre as conexes entre as palavras e as coisas, entre os referentes (coisas, pensamentos), seus conceitos e respectivos smbolos usados para sua representao. Na Idade Mdia, as discusses sobre o uso de termos e conceitos, no intento de se definir as coisas, chegaram a dar origem a duas correntes diferentes de pensadores: os nominalistas e os conceitualistas. No pensamento de Aristteles, encontram-se contribuies bastante relevantes para a teoria do conceito, envolvendo o ato da cognio humana e a fatorao do conceito em categorias, dentre outras abordagens, ressaltando-se que sua influncia nesse campo de conhecimento tenha sido reconhecida e referenciada em quase todas as pocas da evoluo do pensamento filosfico e cientfico. Para Aristteles, "saber seria ter muitos conceitos e conhecer significava trs coisas": 1. formar conceitos, ou seja, constituir em nossa mente um conjunto de notas caractersticas para cada uma das essncias que se realizam na substncia individual.; 2. aplicar esses conceitos que formamos a cada coisa individual, colocar cada coisa individual sob um conceito. Chegar natureza; contemplar a substncia; olha-la e voltar para dentro de ns mesmos para procurar no arsenal de conceitos aquele que se ajustasse a uma singular substncia; e formular um juzo; 3. embaralhar entre si esses diversos juzos, em forma de raciocnios que nos permitissem chegar concluso acerca de substncias que no temos presentes. Esta seria uma forma de se abordar a natureza fsica e abstrata desvendando-lhe os mistrios e enunciando verbalmente sobre cada faceta ou ngulo relacionado ao objeto observado, reconstruindo-se finalmente o objeto por meio da sntese de todas as facetas a ele relativas. Um clssico trabalho sobre a gnese dos conceitos na mente humana e sua extrapolao para o campo da organizao e recuperao de informaes de autoria de Jesse Shera, um dos clssicos tericos da biblioteconomia. Shera publicou importante trabalho nos proceedings da Conferncia Internacional de Classificao e Recuperao de Informaes, realizada em Londres sob os auspcios da ASLIB, em 1957. Seu trabalho tem por objetivo o aperfeioamento da organizao e recuperao de registros grficos e ilustra muito bem como se desenvolve, no crebro humano, o processo de formao de conceitos. Cada nova sensao quer se origine da experincia ou da leitura de algum texto classificada no crebro humano, de acordo com o acervo de experincias passadas, ali registrado, possibilitando a ordem que levaria ao saber. A cincia seria o conhecimento coordenado, formado pela conjuno de duas ordens de experincias: a observao direta e a classificao dos resultados dessa observao, de acordo com as concepes j adquiridas sobre o tema. A primeira seria interpretada em termos da segunda, ou seja, de acordo com o acervo de conhecimentos (conceitos) j armazenados. Em outras palavras, cada nova experincia, cada nova sensao seria classificada no crebro, de acordo com um padro de relao, originrio das experincias passadas e dessa forma, haveria incorporao do novo saber, estabelecendo-se a ordem, diminuindo a incerteza, deixando mais satisfeito o homem em seu intento de sobreviver. A facilidade com a qual as novas percepes pudessem ser organizadas e classificadas, assimilando-se com a experincia passada, determinaria o processo de aprendizagem de uma pessoa. Se ao ler um texto uma pessoa fosse incapaz de classificar novas idias, pensamentos e sensaes, admitir-se-a a incompreensibilidade do texto para aquela pessoa. Da afirmao de que os atos de conhecer perceber e ter conscincia seriam funes da forma como o sistema nervoso humano se encontra estruturado. O homem tenderia a encontrar, desse modo, felicidade, conforto, segurana, atravs do reconhecimento de padres familiares e, a menos que ele fosse particularmente aventureiro e temerrio, ele se retrairia e se afastaria dos padres que lhe fossem pouco familiares. Os conceitos ou padres se constituem na matria do qual as classificaes so feitas. Os conceitos podem se referir s coisas concretas e abstratas. Os conceitos e a formao de conceitos so o material para a construo das classificaes bibliogrficas. Segundo Shera,

"Um conceito uma rede de padres de inferncias, associaes e relacionamentos que so predicados ou ditos de outra forma trazidos em cena atravs do ato da categorizao"[...] a cristalizao ou formalizao do pensamento inferencial, nascida da percepo sensorial, condicionada pela operao do crebro humano e delineada pela experincia humana. Ela repousa na fundamentao de todo pensamento mas ela pragmtica e instrumental. permanente e efmera. Permanente porque sem ela, a cognio impossvel; efmera porque ela pode ser rejeitada quando sua utilidade esgotada" (Shera, 1957). Livros e documentos so registros do conhecimento humano que formado de conceitos. Durante sculos o homem tem categorizado os conhecimentos em uma hierarquia taxonmica que associa semelhanas ou separa diferenas, constantes dos conceitos. Os conceitos e os diversos elementos que contribuem para a formao de conceitos, mais ou menos intensos, constantes dos livros e outros documentos constituem-se no material da classificao. So essas unidades de pensamento e as relaes entre elas, como esto presentes nas pginas dos documentos e na mente do usurio, que se constituem na primeira preocupao do bibliotecrio e o compele a sucessivas consideraes sobre o papel da classificao. Tratamento e organizao da informao na internet Nas bibliotecas digitais, as fontes no so catalogadas e classificadas como os bibliotecrios entendem esses termos. Observa-se que essas tcnicas nem sempre so citadas nos contextos de um possvel tratamento da internet, por serem ferramentas muito caras, envolvendo um tempo incompatvel com o universo de objetos digitais existentes na rede. O volume de informaes livremente colocados na web torna impossvel um tratamento da informao nos moldes tradicionais. Em nossos dias, muitos so os profissionais que trabalham no desenvolvimento de ferramentas de organizao e busca de informaes constantes nos objetos digitais. Como conseqncia natural advinda da prtica em situaes similares, os bibliotecrios deveriam constituir uma classe profissional com atuao mais marcante, na tarefa de organizar a internet. Na realidade entretanto o pessoal da rea da cincia da informao vem se mantendo tmido, apresentando contribuies muito aqum de suas possibilidades. No contexto da cincia da computao esforos vm sendo empreendidos no sentido de se classificar automaticamente objetos digitais dispersos, procurando tornar mais eficaz o processo de recuperao de informaes. Nesse sentido, muitos pesquisadores vm desenvolvendo motores de buscas (search engines) e agentes inteligentes para acessar informaes, fundamentando-se esse instrumental primordialmente em buscas por palavras, utilizando-se de sistemas vetoriais e estratgias booleanas, ou combinaes de mtodos de pesquisa. A linguagem natural vem sendo o meio de organizao do universo da web, pois, considera-se impossvel em um mbito mais amplo, um processamento dos objetos digitais utilizando-se de linguagens documentrias estruturadas, usadas para o um tratamento da informao a posteriori, nas quais termos, simbolizando conceitos, no unidades lexicais (palavras), seriam usados como chaves de recuperao. O campo da modelagem de dados, arquitetura de dados, especialmente no que se refere recuperao semntica ou por conceitos, acha-se fartamente referenciado na literatura de muitas disciplinas. O desafio de organizar a internet extrapola hoje fronteiras disciplinares e torna-se a busca de uma soluo para que realmente o valor do meio possa efetivamente ser usufrudo em toda a sua potencialidade. Dentre os profissionais que se atm a trabalhar nessa rea destacam-se filsofos, lingistas, profissionais da cincia da computao, da psicologia cognitiva, da lingstica e da semiologia, todos focalizando as dificuldades atuais e procurando "uma luz no fundo do tnel". A descrio do projeto CATRIONA, Cataloguing and Retrieval of Information Over Networks Applications, citado por Woodward (1996), inicia-se com a assertiva de que a biblioteca sem paredes est se tornando realidade e de que "o problema de como o usurio encontra as fontes e servios apropriados s suas necessidades devem ser primeiramente resolvidos". A resposta para essa pergunta poderia ser: "combinando uma adaptao de novas tecnologias de software com uma adaptao de mtodos e prticas biblioteconmicas j estabelecidas". A literatura tem sido vasta na cincia da informao sobre pesquisas e experincias de organizao da internet, utilizando-se ferramentas tradicionais da biblioteconomia. Por outro lado, muitos so os argumentos contrrios ao uso dos mtodos da biblioteconomia para o tratamento de documentos na internet. Na comunidade da computao e da eletrnica, muitos autores argumentam que, mesmo antes da internet,

especialistas no campo da biblioteconomia e da cincia da informao j admitiam que os esquemas de classificao, ento usados, j eram antiquados e imprprios para classificar os temas novos presentes na literatura atual. Outros recorrentes argumentos so evocados, tais como o que advoga que as classificaes tradicionais seriam teis apenas para arranjar estantes, mas consideradas imprprias para o tratamento dos documentos digitais dos nossos dias. Esses argumentos, entretanto, denotam no possurem seus defensores o conhecimento da existncia do trabalho de pesquisa que subjaz construo e atualizao dos sistemas de classificao tradicionais, e parecem desconhecer a classificao facetada, preconizada por Ranganathan, que permite uma grande multiplicidade de combinaes de conceitos, possibilitando uma estruturao semntica dos conceitos de um documento. certo que, classicamente, a formao do bibliotecrio convencional garante-lhe pouca fundamentao matemtica e computacional, o que de certa forma limita uma ao mais intensa e segura por parte desse. A soluo do estabelecimento de parcerias entre profissionais de diversas reas, h muito vem sendo praticada por alguns grupos e a conseqncia da inexistncia, especialmente no Brasil, de um trabalho mais integrado e contnuo de pesquisa do pessoal da cincia da informao com a cincia da computao e eventualmente da lingstica, faz com que se veja atrasado o desenvolvimento de bibliotecas digitais. Enquanto a internet se apresenta como novas possibilidades de disponibilizao e processamento de informaes eletrnicas, bibliotecrios e especialistas da informao se esforam para desenvolver mtodos para a descrio, organizao e recuperao de objetos digitais acessados remotamente. Eles no esto ss nesse desafio, porque criadores, provedores e usurios de fontes eletrnicas nos meios acadmicos, pblicos e comerciais tambm se acham dedicados pesquisa sobre esse vasto corpo de informaes. Cada grupo tem abordado o problema de organizao e acesso, a partir de seus prprios esquemas de referncia. Vellucci adverte para a importncia do reconhecimento das contribuies de cada um dos membros do grupo, para que o esforo cooperativo possa prover uma estrutura flexvel para a organizao e o acesso das fontes da internet. O ponto positivo da estrutura da web a sua habilidade para organizar, dispor e trocar dados descritivos originados de uma vasta variedade de criadores, em um sistema integrado de organizao, pautado pela liberdade que o meio propicia. A informao eletrnica em rede , na maioria das vezes, transitria e carente de desejveis controles de qualidade e estabilidade, providos pelos familiares sistemas de peer-review, praticados nos processos tradicionais de edio de publicaes. Classificao No processo de interao do ser humano com o universo, existem possibilidades infinitas de se perceber objetos concretos e abstratos e desse processo origina-se o conhecimento. Uma das grandes dificuldades que vem sendo ressaltada no processo de recepo, e de o tratamento do conhecimento, para fins de preservao e acesso, constitui-se no fato de que as tentativas de se classificar seres, coisas e textos que sobre estes so produzidos, revestem-se a priori da constatao de que as coisas, e portanto os conhecimentos, no se reduzem ao que deles pode ser visto explicitamente, mas, apenas podero vir a ser devidamente compreendidos, a partir da atitude filosfica do compreender que, segundo Paul Ricoeur, significa o ato da interpretao criadora de sentido. A esse problema pode-se acrescentar a situao delicada e complexa de intermediao em que se colocam os profissionais da informao entre esta e seus usurios. Assim sendo, ao se tentar classificar objetos, seres ou idias, no suficiente que se observe um objeto captando sua essncia e caractersticas, ou se considere, apenas, o nvel lexical que define essas realidades. absolutamente necessrio que se aprofunde no conhecimento das relaes entre as similitudes e diferenas entre esses objetos, extrapolando uma viso individual daquele objeto e, a partir dos termos que os simbolizam, fazendo o mesmo aprofundamento nos seus contedos semnticos ou conceituais. O processo compreende ainda uma atitude hermenutica ou interpretativa, igualmente indispensvel anlise e classificao de um universo de coisas.O ato de interpretar inerente a qualquer abordagem ao conhecimento, qualquer que seja o grau de suposta clareza com que este tenha sido produzido. Entretanto, a despeito dessa constatao o homem no deixa de classificar, perfeita ou superficialmente as coisas e pensamentos, at porque este o processo natural atravs do qual se torna possvel o entendimento dos

pensamentos expressos pelas pessoas, sejam de forma oral ou escrita. Nesse processo de comunicao amplo, estabelecido entre os homens em suas tentativas de compreenso e descrio do universo, a mediao da linguagem ocupa um papel primordial e, no contexto da biblioteconomia e da cincia da informao, o tratamento da informao e conhecimento registrado se depara com uma tarefa complexa que assim poderia ser resumida: a despeito de todas as fragilidades dos atos de conhecer e comunicar, envolvendo coisas, seres, palavras, imagens e sons, torna-se imperativo que se encontre uma forma de se construir interfaces entre os acervos de documentos e informaes e seus usurios. Considerando-se o aspecto da representao simblica do conceito, emerge o papel da terminologia, no contexto amplo da produo e organizao da cincia e da tecnologia. Sabe-se que nenhuma disciplina pode progredir sem a socializao da linguagem entre os membros da comunidade que a sustenta. Satija (2000), pesquisador e bibliotecrio indiano, detentor de vasta produo cientfica no campo da cincia da informao e estudioso da contribuio de Ranganathan, afirma que este considerava a terminologia cientfica duplamente importante para os profissionais e pesquisadores da rea da biblioteconomia e da cincia da informao: primeiramente, pela necessidade de que os bibliotecrios e cientistas da informao tm que entender a terminologia de sua prpria disciplina como professores e pesquisadores da rea; em segundo lugar, Ranganathan destaca a importncia da compreenso, pelo mesmo grupo de especialistas, para o entendimento da terminologia tcnica das demais disciplinas, com a finalidade de organizao do conhecimento dos diversos campos de conhecimento (p. 221). Deduz-se da complexidade do ato de classificar as implicaes nas tentativas de uma classificao automtica de documentos, independente da interveno humana. Alguns dizem que a matemtica capaz de representar todas as manifestaes do pensamento humano, embora hoje ainda estejamos rfos dessa linguagem universal aplicada a um entendimento amplo entre os homens. Ontologias e metadados Atualmente, em contextos externos cincia da informao, a palavra ontologia, muitas vezes usada no plural, ontologias, designa a faceta semntica da representao dos seres, dos entes, aquilo que se convenciona chamar de assuntos, contedos temticos dos registros sobre a realidade. Segundo o dicionrio Aurlio (Ferreira, 1986) a ontologia consiste "na parte da filosofia que trata do ser enquanto ser, isto , do ser concebido como tendo uma natureza comum que inerente a todos e a cada um dos seres". No comentrio sobre o verbete, recorrendo a uma frase do escritor Alexandre Herculano, o dicionrio aponta para as dificuldades imbricadas no problema ontolgico da existncia e essncia dos seres, ao evocar dois ilustres filsofos que no ocidente se dedicaram ao estudo da teoria do conhecimento: "Com Kant, o universo uma dvida; com Locke dvida nosso esprito; e num destes abismos vm precipitar-se todas as ontologias" (Herculano, Lendas Narrativas II, p.107, apud Ferreira, 1986). Complementando o que j foi discutido nos itens referentes teoria do conceito e classificao, o tratamento da informao dependente de uma abordagem ontolgica sofre, portanto, da eterna e intransponvel dvida metafsica que povoa as certezas da essncia do conhecimento humano... Segundo a teoria do conceito, esboada anteriormente, aos seres concretos e abstratos correspondem os conceitos compostos de enunciados sobre esses mesmos seres e a esses conceitos so atribudos seus respectivos nomes ou smbolos que, nos documentos textuais mais convencionais acham-se representados por termos. Da as relaes entre ontologias, conceitos e terminologia. O trabalho de Guarino guarino@ladseb.pd.cnr.it enfoca as ontologias do ponto de vista do desenvolvimento de sistemas baseados em conhecimento [Knowledge-Based Systems, KBS] e discute como os princpios da ontologia formal e engenharia ontolgica podem ser usados, na prtica da engenharia do conhecimento. Na realidade, os estudos hoje denominados ontolgicos vm sendo retomados como substrato para as pesquisa de modelagem cognitiva de conhecimentos. O citado autor aponta em seu trabalho uma forte conexo entre ontologia formal e anlise conceitual; e afirma que a engenharia do conhecimento pode contribuir para estabelecer as fundaes de um campo emergente, a engenharia ontolgica. Da leitura de trabalhos dessa natureza, pode-se constatar que novos campos esto surgindo, dedicados a tratar de realidades essencialmente presentes nos domnios da cincia da informao.Uma interpretao desse fenmeno

resultaria em concluso que aponta para a impossibilidade de hegemonia e manuteno dos domnios de velhos campos do conhecimento, desde que estes no apresentem resultados que atendam ao interesse do mercado ao qual a cincia contempornea tambm se acha a servio. Da a urgncia de desenvolvimento da pesquisa envolvendo os conhecimentos da rea da cincia da informao. Voltando linha de raciocnio do presente trabalho, verifica-se que metadado etimologicamente, quer dizer "dado sobre dado"; dado que descreve, a essncia, atributos e contexto de emergncia de um recurso (documento, fonte, etc.) e caracteriza suas relaes, visando-se seu acesso e uso potencial. O prefixo grego meta significa mudana, posterioridade, alm, trancendncia... (Ferreira, 1986). Metadado pode ser considerado sinnimo de ponto de acesso, termo da rea da catalogao, e parece ter sido cunhado em contextos externos cincia da informao. Os denominados padres de metadados, atualmente presentes no instrumental de software para criao de objetos digitais, so considerados as linguagens de marca que, segundo Bax: "identificam, de forma descritiva, cada 'entidade informacional'digna de significado presente nos documentos, como por exemplo pargrafos, ttulos, tabelas, grficos. A partir dessas descries os programas de computador podem melhor tratar ou processar a informao contida em documentos eletrnicos" (Bax, 2001, p. 32-3). Linguagens de marca diversas foram desenvolvidos por comunidades responsveis pela criao ou provimento de acesso a fontes eletrnicas interligadas, desenvolvidas utilizando-se de mtodos e padres diversos para a organizao de recursos digitais presentes na web. Deve estar claro que, tal como na catalogao, os metadados no se restringem a dados temticos, constantes no texto mas, podem tambm incluir outros tipos de pontos de acesso, relacionados descrio fsica e ao contexto de produo, dependentes do tipo de objeto em questo. A atribuio de metadados a priori, no momento de produo do objeto, por seus prprios autores ou a posteriori, aps a incluso do objeto no espao digital, parece ser o ponto focal da maior importncia na discusso sobre os metadados.Considerando que a organizao da www basicamente assunto de seus prprios organizadores, CRAIGMILE, citado por Woodward, acredita ser a internet uma fonte pouco estvel para permitir uma organizao a posteriori; essa constatao tambm se ancora no uso intensivo das novas tecnologias e no fato de serem as fontes da web, prioritariamente, produtos resultantes da competio do mundo dos negcios. Outra dificuldade na criao de sistemas automticos de recuperao da informao consiste na identificao pela mquina de conceitos presentes nas imagens e sons, que prescindem de uma escrita utilizando-se de termos convencionais da linguagem. Uma ressalva pode ser feita para os documentos sonoros, registrados atravs da msica escrita, que um smbolo lingstico bastante concreto e possvel de leitura pela mquina. Sintetizando, os metadados incluem pontos de acesso expressos igualmente nos prprios textos, nas imagens e registros sonoros, presentes no meio digital, muitos desses no sendo passveis de marcao do texto como nos padres baseados nas linguagens de marca mais tradicionais HTML e SGML. O trabalho de Bax (2001) publicado na revista Cincia da Informao trata das "markup languages", dentre as quais se incluem o padro Dublin Core desenvolvido a partir do padro MARC, criado originalmente para registros catalogrficos. A atribuio de metadados a partir da marcao dos textos em sua materialidade digital j se constitua em processo previsto, h dcadas, por bibliotecrios e pesquisadores. Lancaster afirma que a literatura do final da dcada de 1980, j fazia previses relativas ao futuro dos servios de recuperao de informaes, sintetizando o autor que um dos pontos de convergncia dessas previses seria a integrao entre as editoraes primria e secundria. As publicaes secundrias e catlogos isolados tenderiam a desaparecer, com o advento das bibliotecas inteiramente digitais. Lancaster afirma, retomando os pensamentos dos autores Goldhar e Burchinal que: "Na medida que se tornam disponveis em linha textos completos de peridicos, as fronteiras tradicionais entre editorao primria e secundria se tornam cada vez mais imprecisas. Burchinal (1977) predisse, na dcada de 1970, que por volta da dcada de 1990 os servios secundrios (servios de acesso) seriam

obtidos automaticamente, a partir de materiais primrios de base eletrnica e estariam disponveis simultaneamente com a edio da literatura primria. Os usurios poderiam mover-se entre essas ferramentas de acesso e os textos completos dos documentos, a partir do mesmo terminal em linha". (Goldhar, 1979; Burchinal, 1977, apud Lancaster,1991). Vellucci rev uma grande variedade de esquemas de metadados usados pelas comunidades da biblioteconomia e da cincia da informao, e examina seus prprios backgrounds, desenvolvimento e implementao.Alguns dos esquemas foram desenvolvidos dentro de uma comunidade especfica ou domnio, como por exemplo, IAFA templates, MARC, Text Encoding Iniciative (TEI) Headers, Encodea Archival Description (EAD), Computer Interchange of Museun Information (CIMI), Governmente Information Locator Service (GILS) e Content Standards fo Digital Geoespacial Metadata (CDSGM). O contedo e sintaxe de cada tipo de metadado varia, dependendo das necessidades especficas de seus usurios. O trabalho de Milstead e Feldman (2001), dentre outros, discorre sobre sistemas de padres de metadados em desenvolvimento sob os auspcios de diferentes grupos de pesquisa. As pesquisas no campo da classificao e da recuperao semntica na web A filosofia e a psicologia do conhecimento, denominao esta usada por Dahlberg, foram campos especficos, onde a gnese e a organizao do conhecimento constituram-se em objetos privilegiados de estudo do conceito. A biblioteconomia e a cincia da informao, que desde seus primrdios contou com a atuao de pensadores eruditos e com ampla viso do campo cientfico, incorporou esses conhecimentos em seu corpo terico, levantando as questes especficas da rea, ou seja, utilizando mtodos de pesquisas e princpios de reflexo, a partir de seus objetos especficos voltados aos processos de organizao e recuperao de informaes. Em nossos dias constata-se uma evoluo nas pesquisas nesse campo. Com a facilitao do tratamento de dados por computador, novos desafios vm sendo colocados aos pesquisadores que, mais do que nunca, vm formando equipes interdisciplinares com o objetivo de resolver problemas na rea da formao e representao de conceitos. Aos cientistas da informao se juntam pesquisadores do campo da informtica, da neurologia e da psicologia, no intuito de continuarem as pesquisa que em ltima anlise podem ser rotuladas de pesquisas no campo da representao do conhecimento e das idias, tendo como objeto componente do tringulo do conceito, a linguagem e o termo como instrumentos de comunicao humana. Se nas dcadas de 1950, 1960 estvamos preocupados com a linguagem de recuperao de informao, na construo de classificaes, de ndices para recuperao de informaes, antes mesmo de chegarmos soluo desejvel dessa problemtica, chegamos a pensar que a linguagem utilizada para designar os conceitos parece ter chegado ao seu limite, no dando mais conta de atender s necessidades de registro e recuperao de informaes, dado ao meio rpido e potente hoje disponvel - as redes eletrnicas de computadores. Essa tendncia aponta para um novo paradigma em que a linguagem, a representao do pensamento parece estar em busca de uma nova descoberta que venha transformar a maneira de se produzir e organizar conhecimentos. Os padres de registros que j privilegiam a abordagem de imagens, o uso de cones na comunicao e desenvolvimento dos sistemas especialistas e outras linguagens artificiais buscam intensamente encontrar superao do status quo,com a criao de novos processos que possam ser compatveis com a agilidade e capacidade de armazenagem e processamento de informaes das mquinas atuais. A teoria do conceito, na qual se fundamentam as categorias de Aristteles, retomadas com ligeiras alteraes por Ranganathan, e que propiciam a anlise dos conceitos em ngulos diversos de abordagem, as facetas, tem sido considerada por muitos a "luz no fundo do tnel" vislumbrada como insumo potencial para a criao de novas ferramentas destinadas resoluo do grande problema atual da cincia que pode ser identificado na confluncia dos processos de produo, representao e organizao de conhecimentos. Outra pista para uma proposta de sistematizao estrutural do conhecimento pode estar numa proposio lgica emanada do pensamento do filsofo Leibniz. Peter Jaenecke em artigo no peridico Knowledge Organization apresenta os fundamentos de uma pesquisa baseada no pensamento de Leibniz. Nesse projeto o resgate do pensamento de pensador, deve-se s suas reflexes sobre a sistematizao do conhecimento. De acordo com Leibniz: "A infinita variedade de pensamentos somente aparente; ela se origina do nmero infinito de

possibilidades por meio das quais os pensamentos bsicos podem ser combinados uns com os outros [...] todos os pensamentos humanos podem ser reduzidos a alguns poucos pensamentos originais que, quando identificados podem servir como um alfabeto dos pensamentos humanos. Similarmente ele insiste que a maioria dos conceitos podem ser subdivididos em subconceitos e esses em outros at que se atinja conceitos to elementares que no sejam mais possveis de qualquer decomposio" O Departamento de Cincia da Computao da UFMG vm desenvolvendo pesquisas na rea das bibliotecas digitais, desenvolvimento de ferramentas de modelagem de dados para documentos j existentes na web, ou em bases de dados referenciais on-line. So utilizados modelos matemticos vetoriais, tentando classificar documentos para fins de recuperao. Dissertaes e teses de doutorado tm sido defendidas. O Departamento de Cincia da Informao da mesma universidade mantm por sua vez, na linha de pesquisa tratamento da informao, projetos em andamento, relacionados especialmente criao de bibliotecas e arquivos digitais na UFMG e modelagem de dados, utilizando-se das categorias de anlise de Ranganathan e do uso de sintagmas nominais para classificao e recuperao de informaes na web. O projeto de modelagem de dados, a partir das categorias de Ranganathan, pretende propor um modelo de tratamento apriorstico, aplicado a um campo especfico de conhecimento, ou seja, um mtodo para disponibilizar para os criadores de hipertextos um instrumental que possibilite construir estruturas conceituais que orientem as relaes entre os conceitos e elementos formadores de conceitos expressos nos links dos hipertextos. As dificuldades encontradas so inmeras, especialmente considerando-se a inexistncia de arquivos para implementao das pesquisas. No Brasil as bibliotecas e arquivos digitais devem ser construdos, tambm com a finalidade de se constituir como universos de dados para possibilitar o desenvolvimento de pesquisas. O que se pretende na UFMG que as bibliotecas digitais dos acervos de teses e produo cientfica se constituam tambm em universos para testes de modelagem de dados, num trabalho em parceria entre os departamentos de computao e cincia da informao. Essa parceria j est de certa forma instituda por meio de um Grupo de Estudos sobre Bibliotecas Digitais, que mantm um frum virtual e vem compartilhando conhecimentos, atravs de encontros, participao em bancas de teses e dissertaes e projetos em comum apresentados a agncias financiadoras da universidade e do pas. O site do grupo de estudos : http:// gebd.eci.ufmg.br/frum Concluso O conceito pode ser visto como fator invariante envolvido na concepo e tratamento de documentos, quando se fala da evoluo das bibliotecas tradicionais para as digitais. Da a complexidade das propostas de tratamento automtico de objetos digitais, estando envolvidos nesse processo as chamadas ontologias, os metadados, cabealhos de assuntos, tesauros, pontos de acesso, dentre outros componentes. Mudam-se os meios, sofisticam-se os instrumentos e surgem nomes novos para designar coisas velhas. Entretanto, a essncia das coisas permanece. Os tempos digitais acenam para a concretizao de sonhos: da grande biblioteca universal, do conhecimento sem fronteiras, da extenso infinita dos limites da memria, do processamento eletrnico de dados complexos, coisas que embora profetizadas, h anos, dcadas, sculos, somente agora encontram as condies para se tornarem realidade. As pesquisas em andamento indicam que a teoria de Ranganathan, composta basicamente de um esquema categorial universal, possa vir a ser usada de muitas formas, contribuindo para o processo de modelagem de dados a priori. Oxal se possa presenciar o encontro de novos sonhos com velhas prticas e teorias que se encontravam espera de meios que as pudessem fazer frutificar. A biblioteconomia estaria pronta para esse desafio? E se no estiver, que outra disciplina melhor que ela estaria ? O que no pode ser ignorado que a mudana radical requerida parece se achar em nvel da linguagem, consistindo na descoberta de uma linguagem universal de domnio pblico, capaz de simbolizar textos sons e imagens e que esteja altura do novo meio digital, uma realidade j disponvel com toda a sua potencialidade e poder. Achamo-nos no limiar de uma grande ruptura epistemolgica?

NOTA [*] Complementao da frase de Vickery, entre parnteses, pela autora do presente artigo.

REFERNCIAS BIBLIOGRFICAS BAEZA-YATES, Ricardo, RIBEIRO-NETO, Berthier. Modern information retrieval. New York : ACM Press, 1999. BAX, Marcelo Peixoto. Introduo s linguagens de marcas. Cincia da Informao, v.30, n.1, p.32-38, jan./abr. 2001. DAHLBERG, Ingetraut. Knowledge organization and terminology; philosophical and linguistic bases. International classification, v.19, n.2, 1992, p.65. DIAS, Eduardo Jos Wense. Contexto digital e tratamento da informao. DataGramaZero: Revista de Cincia da Informao, v.2, n.5, out. 2001. p. 1-10. FERREIRA, Aurlio Buarque de Holanda. Novo dicionrio de lngua portuguesa.2ed. Rio de janeiro : Nova Fronteira, 1986. JAENECKE, Peter. Elementary principles for representing knowledge. Knowledge organization, v.23, n.2, 1996, p. 88-102. LANCASTER, F.W. Indexao e resumos: teoria e prtica. Braslia : Briquet de Lemos Livros, 1991. p.268-9. MILSTEAD, Jssica. Cataloguing by any other name. http://www.findarticles.com/cf_1/m1388/1_23/53457500 /p1/article MILSTEAD, Jessica; Feldman, Susan. Metadata projects and standards. http://www.onlineinc.com/onlinemag /OL1999/milstead1.html MORENTE, Manuel Garcia. Fundamentos de filosofia; noes preliminares. So Paulo : Mestre Jou, 1964. p. 114. OGDEN, C.K; RICHARDS, I.A. O significado de significado; um estudo da influncia da linguagem sobre o pensamento e sobre a cincia do simbolismo. Traduo de lvaro Cabral. Rio : Zahar, 1972. 349p. RASMUSSEN, Edie M. Libraries and bibliographical systems. In: BAEZA-YATES, Ricardo, RIBEIRO-NETO, Berthier. Modern information retrieval. New York : ACM Press, 1999. 513p. p. 397-413. SATIJA, Mohinder P. Library classification: an essay in terminology. Knowledge Organization, 27, n.4, 2000. SHERA, Jesse H. Pattern, structure and conceptualization in classification. In: International Study Conference on Classification for Information Retrieval, Proceedings, London : ASLIB, 1957. p. 3-13 VICKERY, D.C. Knowledge representation: a brief review.Journal of documentation, v.42, n.3, sept. 1986. p. 145-59. ZIMAN, John. Conhecimento pblico. Belo Horizonte : Itatiaia ; So Paulo : Editora da USP, 1979. 164p.

Sobre a autora / About the Author: Lidia Alvarenga lidiaalvarenga@eci.ufmg.br Professora da Escola de Cincia da Informao da Universidade Federal de Minas Gerais, rea de Tratamento da Informao e Bibliometria.