Vous êtes sur la page 1sur 11

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

Nadia Aurora Peres Vanti


Mestre em biblioteconomia e cincia da informao pela PUCCampinas, bibliotecria do Instituto Latino-Americano de Estudos Avanados da UFRGS. Professora do Departamento de Cincias da Informao da Faculdade de Biblioteconomia e Comunicao da UFRGS. E-mail: nvanti@ilea.ufrgs.br

Resumo
Este um estudo comparativo de quatro subdisciplinas que permitem medir os fluxos da informao, a comunicao acadmica e a difuso do conhecimento cientfico: a bibliometria, a cienciometria, a informetria e a webometria. Mediante a leitura de renomados autores que tm abordado estes temas, realizada uma discusso terico-conceitual e uma anlise das semelhanas e diferenas que unem e separam os quatro mtodos quantitativos no que diz respeito ao seu histrico, objeto de estudo, variveis, tcnicas, objetivos e campos de aplicao. Uma nfase maior dada caracterizao da webometria, por se tratar de uma rea emergente dentro da cincia da informao, ainda pouco explorada no Brasil e com grandes potencialidades derivadas da expanso mundial da Internet. Palavras-chave Bibliometria; Cienciometria; Informetria; Webometria; Mtodos quantitativos de avaliao

Nas ltimas dcadas, acompanhando a expanso da cincia e da tecnologia, tornou-se cada vez mais evidente a necessidade de avaliar tais avanos e de determinar os desenvolvimentos alcanados pelas diversas disciplinas do conhecimento. Neste sentido, apontou-se para a medio das taxas de produtividade dos centros de pesquisa e dos investigadores individuais, para a deteco daquelas instituies e reas com maiores potencialidades e para o estabelecimento das prioridades no momento da alocao de recursos pblicos. Existem diversas formas de medio voltadas para avaliar a cincia e os fluxos da informao. Dentre estas, cabe citar a bibliometria, a cienciometria, a informetria e a mais novel delas, a webometria. Estas subdisciplinas, apesar de apresentarem algumas semelhanas ou pontos de convergncia, possuem caractersticas, enfoques e funes dissmeis. O objetivo central deste artigo consiste, conseqentemente, em explorar e aprofundar o estudo destes conceitos desde uma tica comparativa, revisar e discutir suas principais aplicaes e aportar um maior esclarecimento sobre o tema, reservando uma ateno especial webometria, rea ainda pouco estudada no campo das cincias da informao no Brasil. INTRODUO A palavra avaliar vem do latim valere. Esta apresenta, entre outras acepes, a de ser merecedor ou digno de alguma coisa1 ,2,3 . A avaliao, dentro de um determinado ramo do conhecimento, permite dignificar o saber quando mtodos confiveis e sistemticos so utilizados para mostrar sociedade como tal saber vem-se desenvolvendo e de que forma tem contribudo para resolver os problemas que se apresentam dentro de sua rea de abrangncia. H, por parte de autores, como Oliveira et alii4 , a idia de que a avaliao da produtividade cientfica, por exemplo, deve ser um dos elementos principais para o estabelecimento e acompanhamento de uma poltica
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

From bibliometry to webometry: a conceptual exploration of several forms of measuring information and knowledge Abstract
This is a comparative study of four sub-disciplines that allow us to calculate the information flows, the academic communication and the dissemination of scientific knowledge: bibliometrics, informetrics, scientometrics and webometrics. Through the reading of well known authors who have approached theses matters, this work poses a theoreticalconceptual discussion and analyses the similarities and differences linking and separating these four quantitative methods regarding their historical trajectory, object of study, variables, techniques and objectives. More emphasis is given to the webometrics description, since this is an emergent area within Information Science that has not been researched very much and presents great opportunities as a result of world-wide expansion of the Internet. Keywords Bibliometrics; Scientometrics; Informetrics; Webometrics; Quantitative Methods for Evaluation

152

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

nacional de ensino e pesquisa, uma vez que permite um diagnstico das reais potencialidades de determinados grupos e/ou instituies. Questiona-se, entretanto, de que maneira possvel fazer este diagnstico. Uma das possibilidades consiste na utilizao de mtodos que permitam medir a produtividade dos pesquisadores, grupos ou instituies de pesquisa. Para tanto, torna-se fundamental o uso de tcnicas especficas de avaliao que podem ser quantitativas ou qualitativas, ou mesmo uma combinao entre ambas. As tcnicas quantitativas de avaliao podem ser subdivididas em bibliometria, cienciometria , informetria e, mais recentemente, webometria. Todas tm funes semelhantes, mas, ao mesmo tempo, cada uma delas prope medir a difuso do conhecimento cientfico e o fluxo da informao sob enfoques diversos. Existe, ainda, muita dificuldade em estabelecer onde termina uma e comea a outra. Para esclarecer melhor as semelhanas e diferenas entre estas tcnicas, buscam-se na literatura, alm de um breve histrico da utilizao dos diferentes termos, algumas definies elaboradas por pesquisadores no assunto. BIBLIOMETRIA, CIENCIOMETRIA E INFORMETRIA Embora, para autores como Lawani5 e Sengupta6 , o termo bibliometria tenha sido cunhado por Alan Pritchard7 em 1969, Fonseca 8 tem demonstrado que quem realmente utilizou pela primeira vez este termo foi Paul Otlet vrias dcadas antes, em sua obra intitulada Trait de documentatin , de 1934. Na verdade, Pritchard popularizou o uso da palavra bibliometria, quando sugeriu que esta deveria substituir o termo bibliografia estatstica, que vinha sendo utilizado desde a meno feita em 1922 por Edward Wyndham Hulme em uma conferncia na Universidade de Cambridge, reportandose a um estudo pioneiro de Cole & Eales de 1917, referente anlise estatstica de uma bibliografia de Anatomia Comparada9 . Em 1948, na Conferncia da Aslib em Leamington Spa, Ranganathan sugeria a necessidade de os bibliotecrios desenvolverem a bibliotecometria, j que as bibliotecas lidavam com grande quantidade de nmeros. Porm, foi somente em 1969, no seminrio anual do Documentation Research and Training Centre (DRTC), que ele apresentou um trabalho com alguns exemplos de aplicao da estatstica na biblioteconomia. Foi com base neste trabalho de Ranganathan e em pesquisas realizadas no DRTC que Neelameghan (1969) esboou a aplicabilidade
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

da bibliotecometria, ou bibliometria, como se tornou conhecida10. Dentro desta disciplina, h ainda trs nomes que se destacaram por suas importantes descobertas: Lotka, Zipf e Bradford. Cada um destes pesquisadores pode ser identificado com uma lei especfica. A Lei de Lotka, ou Lei do Quadrado Inverso, aponta para a medio da produtividade dos autores, mediante um modelo de distribuio tamanho-freqncia dos diversos autores em um conjunto de documentos. A Lei de Zipf, tambm conhecida como Lei do Mnimo Esforo, consiste em medir a freqncia do aparecimento das palavras em vrios textos, gerando uma lista ordenada de termos de uma determinada disciplina ou assunto. J a Lei de Bradford, ou Lei de Disperso, permite, mediante a medio da produtividade das revistas, estabelecer o ncleo e as reas de disperso sobre um determinado assunto em um mesmo conjunto de revistas13. No que diz respeito cienciometria, este termo surgiu na antiga URSS e Europa Oriental e foi empregado especialmente na Hungria. Entre os primeiros autores a utiliz-lo, esto Dobrov & Karennoi11, em uma publicao do All-Union Institut for Scientific and Technical Information (VINITI) . Originalmente, referia-se aplicao de mtodos quantitativos para o estudo da histria da cincia e do progresso tecnolgico (Egghe apud Spinak)12. As primeiras definies consideravam a cienciometria como a medio do processo informtico, onde o termo informtico significava a disciplina do conhecimento que estuda a estrutura e as propriedades da informao cientfica e as leis do processo de comunicao (Mikhilov et alii, apud Spinak)12. Este termo alcanou notoriedade com o incio da publicao, em 1977, da revista Scientometrics, editada originalmente na Hungria e atualmente na Holanda13. A partir da dcada de 80, depois de o Institut for Scientific Information (ISI) ter vendido sua base de dados para diferentes instituies, como uma ferramenta auxiliar na elaborao de polticas cientficas, foi que a scientometrics (quantificao da cincia) comea a ser rea de interesse acadmico. Atualmente, esta disciplina est sendo largamente utilizada para a medio do conhecimento cientfico. Cabe lembrar que o ISI, organizao fundada por Eugene Garfield na Filadlfia (EUA), constitui uma importante fonte para este tipo de medida, processando anualmente um nmero elevado de peridicos que abrangem mais de cem reas do conhecimento cientfico.

153

Nadia Aurora Peres Vanti

J o termo informetria, de acordo com Brookes14, foi proposto pela primeira vez por Otto Nacke, diretor do Institut fr Informetrie, em Bielferd, Alemanha, 1979. Este termo foi adotado imediatamente pelo mesmo VINITI, na antiga URSS, instituio que impulsionou a criao de um comit com este nome na Federao Internacional de Documentao: o FID/IM Comitte on Informetry, indicando o prprio Nacke como seu primeiro diretor. Sua aceitao definitiva data de 1989, quando o Encontro Internacional de Bibliometria passou a se chamar Conferncia Internacional de Bibliometria, Cienciometria e Informetria, seguindo a sugesto do prprio Brookes, feita dois anos antes na Conferncia de Diepenbeek, Blgica13. Sengputa 15 e Glzel & Schoepflin 16, por exemplo, apresentam tais termos como sinnimos, porm Gorkova (apud BROOKES)14, Russell17, Egghe18 e Tague-Sutckiffe13 j consideram que a informetria compreende um campo mais amplo que a cienciometria e que englobaria, tambm, a bibliometria. Da mesma forma, a webometria, conforme ser discutido mais adiante, poderia estar compreendida pela informetria. De acordo com as palavras de Tague-Sutckiffe 13 , traduzidas por Macias-Chapula19 (p. 134), pode-se definir a bibliometria como: [...] o estudo dos aspectos quantitativos da produo, disseminao e uso da informao registrada. A bibliometria desenvolve padres e modelos matemticos para medir esses processos, usando seus resultados para elaborar previses e apoiar tomadas de decises. O mesmo autor, em se tratando da cienciometria, e seguindo com a traduo de Macias-Chapula (p.134) 19, a define nos seguintes termos: Cienciometria o estudo dos aspectos quantitativos da cincia enquanto uma disciplina ou atividade econmica. A cienciometria um segmento da sociologia da cincia, sendo aplicada no desenvolvimento de polticas cientficas. Envolve estudos quantitativos das atividades cientficas, incluindo a publicao e, portanto, sobrepondo-se bibliometria. Segundo a definio de Tague-Sutckiffe13, a cienciometria estuda, por meio de indicadores quantitativos, uma determinada disciplina da cincia. Estes indicadores quantitativos so utilizados dentro de uma rea do conhecimento, por exemplo, mediante a anlise de publicaes, com aplicao no desenvolvimento de polticas cientficas. Tenta medir os incrementos de
154

produo e produtividade de uma disciplina, de um grupo de pesquisadores de uma rea, a fim de delinear o crescimento de determinado ramo do conhecimento. Para Van Raan20, a cienciometria se dedica a realizar estudos quantitativos em cincia e tecnologia e a descobrir os laos existentes entre ambas, visando ao avano do conhecimento e buscando relacionar este com questes sociais e de polticas pblicas. A cienciometria teria, portanto, um carter multidisciplinar no que diz respeito aos mtodos que utiliza. Tais mtodos provm tanto das cincias naturais quanto das cincias sociais e comportamentais (estatstica e outros mtodos matemticos, modelos sociolgicos, pesquisas e mtodos psicolgicos de entrevista, informtica, filosofia da cincia, lingstica etc.). Spinak (p.142) 12 , por outro lado, j confirma a interdisciplinaridade da bibliometria e o seu direcionamento para as fontes de informao quando apresenta sua definio: La bibliometra es, pues, una disciplina con alcance multidisciplinario y la que analiza uno de los aspectos ms relevantes y objetivos de esa comunidad, la comunidad impresa. Tentando fazer uma distino entre bibliometria e cienciometria, Spinak (p.143)12 ainda afirma que: La bibliometra estudia la organizacin de los sectores cientficos y tecnolgicos a partir de las fuentes bibliogrficas y patentes para identificar los actores, sus relaciones y sus tendencias. Por el contrario, la cienciometra trata con las varias mediciones de la literatura, de los documentos y otros medios de comunicacin, mientras que la bibliometra tiene que ver con la produtividad y utilidad cientfica. O mesmo Spinak (p.142)12, fazendo uma relao entre bibliometria e cienciometria, assevera: La cienciometra aplica tcnicas bibliomtricas a la ciencia [...] pero va mas all de las tcnicas bibliomtricas, pues tambin examina el desarollo y las polticas cientficas. [...] la cienciometra puede establecer comparaciones entre las polticas de investigacin entre los pases analizando sus aspectos econmicos y sociales. Por ltimo, fazendo aluso informetria, cujo surgimento posterior ao dos outros dois termos, pode-se dizer que esta tem um escopo tanto mais distinto e abrangente do que a cienciometria e a bibliometria, pois, ainda de acordo com a conceituao de Tague-Sutckiffe13 glossada por Macias-Chapula (p.134) 19,
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

Informetria o estudo dos aspectos quantitativos da informao em qualquer formato, e no apenas registros catalogrficos ou bibliografias, referente a qualquer grupo social, e no apenas aos cientistas. A informetria pode incorporar, utilizar e ampliar os muitos estudos de avaliao da informao que esto fora dos limites da bibliometria e cienciometria. O termo informetria designa, conforme Hjotgaard Christensen & Ingwersen21, uma extenso recente das anlises bibliomtricas tradicionais ao abarcar o estudo das modalidades de produo da informao e de comunicao em comunidades no acadmicas. Para estes autores, as anlises de difuso de determinados assuntos nos bancos de dados full-text dos jornais seriam uma das novas possibilidades que surgem neste campo. A informetria se distinguiria claramente da cienciometria e da bibliometria no que diz respeito ao universo de objetos e sujeitos que estuda, no se limitando apenas informao registrada, dado que pode analisar tambm os processos de comunicao informal, inclusive falada, e dedicar-se a pesquisar os usos e necessidades de informao dos grupos sociais desfavorecidos, e no s das elites intelectuais13. De acordo com Wormell (p. 2)22, ... a informetria um subcampo emergente da cincia da informao, baseada na combinao de tcnicas avanadas de recuperao da informao com estudos quantitativos dos fluxos da informao. Para Wolfram2 3, a informetria encontra sua utilidade na administrao de colees em bibliotecas, no desenvolvimento de polticas cientficas e pode ajudar na tomada de decises em relao ao desenho e manuteno de sistemas de recuperao de informao. As definies tericas ajudam na compreenso do que pode ser cada um dos mtodos mencionados anteriormente, porm, para o melhor entendimento, fazse necessrio tentar associar tais mtodos utilizao de aplicaes concretas. Em termos genricos, estas so algumas possibilidades de aplicao das tcnicas bibliomtricas, cienciomtricas e informtricas: identificar as tendncias e o crescimento do conhecimento em uma rea; identificar as revistas do ncleo de uma disciplina; mensurar a cobertura das revistas secundrias; identificar os usurios de uma disciplina;
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

prever as tendncias de publicao; estudar a disperso e a obsolescncia da literatura cientfica; prever a produtividade de autores individuais, organizaes e pases; medir o grau e padres de colaborao entre autores; analisar os processos de citao e co-citao; determinar o desempenho dos sistemas de recuperao da informao; avaliar os aspectos estatsticos da linguagem, das palavras e das frases; avaliar a circulao e uso de documentos em um centro de documentao; medir o crescimento de determinadas reas e o surgimento de novos temas. O uso de tcnicas bibliomtricas contribui de forma decisiva em pocas de recursos escassos, quando um bibliotecrio deve resolver que ttulos ou publicaes peridicas podem ou no ser suprimidas de uma biblioteca. Indicadores de uso so obtidos, assim, para definir uma lista de publicaes peridicas prioritrias e para prever a demanda futura. fundamental ter como detectar a utilizao real dos ttulos que constam em uma biblioteca, possibilitando determinar a obsolescncia das colees 24 . Os ndices bibliomtricos tambm so utilizados para avaliar a produtividade e a qualidade da pesquisa dos cientistas, por meio da medio com base nos nmeros de publicaes e citaes dos diversos pesquisadores25. Nesta mesma ordem de idias, tambm Braga (p. 162) 2 6 assinala que: Para generalizar estatsticas empricas [...] a Bibliometria examina, primeiramente, as relaes entre diferentes variveis: recursos humanos-documentos, artigosperidicos, produo-consumo, etc., que apresentam diversas regularidades de distribuio. O nmero de artigos que originam n citaes, o nmero de instituies produzindo anualmente n doutorados, o nmero de autores com n artigos, o nmero de revistas contendo n artigos constituem exemplos do mesmo tipo de distribuio.

155

Nadia Aurora Peres Vanti

No caso dos mtodos cienciomtricos, h uma grande variedade de aplicaes, tais como o uso do nmero de publicaes e citaes para auxiliar na avaliao do desempenho cientfico de pesquisadores, grupos e centros de pesquisa; na tomada de decises quanto distribuio de recursos financeiros por parte de organizaes governamentais e internacionais, fundaes e instituies de fomento a determinadas reas do conhecimento como a Organizao para a Cooperao e o Desenvolvimento Econmico (OCDE), a Unesco ou a National Science Foundation, dos EUA, para citar apenas alguns exemplos e, tambm, no estudo do desempenho comparativo entre as naes12, 27. Para Callon et alii 28 , a cienciometria se aplica, principalmente, ao tratamento e gerenciamento das informaes formais provenientes de bases de dados cientficas ou tcnicas. Inclusive, segundo estes autores, as empresas utilizariam os mtodos cienciomtricos para conseguir determinar qual a estratgia tecnolgica seguida por seus competidores. As empresas, desta forma, podem analisar as patentes, por exemplo, identificando os principais temas de investigao e atores significativos em um campo cientfico de seu interesse. Podem, igualmente, detectar as especialidades cientficas que servem de base para suas tecnologias-chave. Alm disso, documentos tais como teses tambm comeam a ser objeto de anlises cienciomtricas por parte das empresas, com o objetivo especfico de determinar quais os assuntos, temticas e caminhos que esto sendo explorados em um determinado momento no ambiente acadmico, constituindo-se em uma boa fonte de informao para aqueles que desejam descobrir os desenvolvimentos mais recentes. importante ressaltar, portanto, a crescente interao entre cincia e tecnologia como sendo um dos espaos mais f e c u n d o s p a r a a p e s q u i s a c i e n c i o m t r i c a. O mapeamento da interface entre a cincia e a tecnologia, como aponta Van Raan20, torna-se um dos setores mais ricos para o desenvolvimento e utilizao dos mtodos cienciomtricos. As tcnicas relativas s anlises de cocitao e co-ocorrncia de palavras, por exemplo, so usadas para traar um perfil dos campos cientficos (por meio de dados sobre publicao) e tecnolgicos (por meio de dados sobre patentes), possibilitando uma cartografia da cincia e da tecnologia que inclua as fronteiras de cada disciplina, a posio dos principais atores dentro do mapa e as representaes especficas de cada um dos ramos do conhecimento.

Os indicadores informtricos, por sua vez, oferecem novas possibilidades para quem deseje explorar as bases de dados como um instrumento de anlise. Podem ser aplicados para avaliar o desempenho de pesquisas, analisando no somente a recuperao da informao, mas tambm os resultados das buscas e a sua combinao com outras informaes, a fim de melhorar a prpria recuperao e a eficincia no acesso informao e ainda economizar tempo no processo de busca. Com o conhecimento das propriedades quantitativas da informao contida nos sistemas, da distribuio dos termos usados nas buscas e da freqncia de ocorrncia dos termos em uma base de dados, possvel estabelecer correlaes probabilsticas entre freqncia de uso e de ocorrncia dos termos que permitam melhorar sensivelmente o desempenho do sistema de recuperao. O sistema poder, assim, seguir aquele modelo de recuperao da informao que mais se adapte s necessidades do usurio, contemplando, tambm, as possibilidades de espao dos equipamentos, os recursos com que conte a unidade de informao e as facilidades de atualizao que cada modelo oferea22, 23, 29. A WEBOMETRIA As anlises quantitativas, com os avanos tecnolgicos, vem-se facilitadas e ao mesmo tempo encontram novos e estimulantes campos de atuao. o caso dos estudos que esto sendo desenvolvidos atualmente sobre o contedo e a estrutura das home-pages na Web. De acordo com Almind & Ingwersen30, est nascendo uma nova rea de interesse dentro da informetria: a webometrics. A webometrics ou webometria consiste, conforme a definio esboada por estes ltimos autores, na aplicao de mtodos informtricos World Wide Web. Nesta mesma linha, Cronin & McKim31 tm destacado que a Web est se tornando, cada vez mais, um importante meio de comunicao para a cincia e a academia, pelo qual lgico que os estudos quantitativos se estendam tambm a este ambiente. Alm do termo webometrics , cuja autoria pode-se adjudicar a Almind e Ingwersen, tambm se encontra na literatura a expresso cybermetrics, que, como destaca Smith32, corresponde ao nome da revista apresentada oficialmente durante a VI Conferncia Internacional de Cienciometria e Informetria, em Jerusalm, no ano de 1997. Esta revista, acessvel somente em formato eletrnico (http://www.cindoc.csic.es/cybermetrics), tem como proposta disponibilizar a todos os pesquisadores
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

156

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

do mundo anlises e medies da comunicao no mbito cientfico e, em especial, as medies do fluxo da informao na WWW. Esta nova rea de estudos tem sido tambm chamada de internetometrics por Quonian & Rostaing33, pesquisadores do Centre Scientifique St. Jerme de Marseille (CRRM), na Frana. Entretanto, por uma questo prtica e de padronizao, optar-se-, neste artigo, pelo termo webometria ( webometrics ), aquele que, dos citados, adquiriu maior difuso na crescente literatura internacional produzida sobre o tema. Entre as medies que podem ser realizadas no campo da webometria, encontra-se, por exemplo, aquela que diz respeito freqncia de distribuio das pginas no cyberespao. Esta medio aponta para o estudo ou anlise comparativa da presena dos diversos pases na rede, das propores de pginas pessoais, comerciais e institucionais. Como destacam Almind & Ingwersen 30, h classificaes importantes que podem ser estabelecidas a partir do tipo de pginas, as quais permitem medir o peso dos setores pblico e privado na rede tarefa que se v facilitada quando os nomes do domnio so .edu e .com. Segundo estes mesmos autores, ainda podem ser realizadas classificaes mais exaustivas. Classificaes que compreendam categorias tais como home pages pessoais, home pages institucionais ou organizacionais, home pages ad hoc ou sobre uma matria definida, pginas que apontam documentos ou pginas-ndice aquelas cuja principal funo tornar disponvel uma srie de hyperlinks e, por ltimo, as pginas-recurso aquelas que disponibilizam dados em forma de texto, som ou imagem. Pode-se realizar, tambm, uma mesma medio em tempos diferentes para comparar, assim, a evoluo da presena de uma determinada instituio ou pas na rede. Da mesma forma, possvel quantificar o crescimento ou perda de importncia relativa de um tema ou matria, o que aproxima, neste caso, a webometria cienciometria, segundo as definies e aplicaes j citadas. A cartografia espao-temporal da resultante estar, logicamente, baseada em informao retirada da Internet, e no de outros suportes eletrnicos ou impressos mais comumente utilizados pela cienciometria. Devem ser ressalvados, entretanto, os ritmos no que diz respeito s formas de cobertura e s polticas de atualizao. Nem sempre a rede reflete, com total fidelidade, a situao, avanos ou retrocessos que experimenta uma instituio ou centro de pesquisa e as variaes que um assunto,
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

tema ou disciplina apresentam fora da Web. De fato, existem reas onde a visibilidade maior na Web e outras onde a visibilidade maior se d no suporte impresso. Como afirma Smith32, os instrumentos fundamentais para a realizao de estudos webomtricos tm sido os motores de busca, que permitem trabalhar com grandes volumes de informao. Motores de busca como o Alta Vista, Yahoo, Hotbot ou Google, entre tantos outros, facilitam as tarefas de quantificao e avaliao dos fluxos de intercmbio de dados e informao na Web. Smith destaca que estes buscadores permitem contabilizar o nmero total de pginas em um espao Web e os links a tais espaos, entendendo o termo espao Web no sentido de domnio (seja um domnio de pas ou um domnio institucional). Pode ser calculado, tambm, nestas anlises, o tamanho mdio de uma pgina expressado em bytes, o nmero mdio de links por pgina e a densidade mdia por link. Para tal fim, h certos elementos que devem ser considerados, como o URL (Uniform Resource Locators), o ttulo, as palavras-chave, o tipo de home page, o domnio, o tamanho e o nmero de links. Como explicam Almind & Ingwersen30, a densidade mdia dos links consiste na ratio, ou relao que pode ser estabelecida entre o tamanho de uma pgina e a quantidade de links que esta aponta. uma medida que consegue reunir e normalizar em um s valor duas informaes: tamanho da pgina e quantidade de links. Os autores sustentam que quanto menor o tamanho da home page ou o nmero de bytes, mantendo igual o nmero de links, menor ser a taxa de densidade destes ltimos. Tanto as pginas pessoais quanto as organizacionais apresentam, freqentemente, uma grande quantidade de links, mesmo quando tm um tamanho pequeno (baixa densidade por link). J aquelas que esto direcionadas para um assunto especfico costumam ser pequenas e ter poucos links, o que faz com que ostentem uma densidade por link mais alta, tornando este ltimo tipo muito mais descritivo e auto-suficiente. Outro tema bastante explorado pela webometria que vem ocupando um lugar cada vez mais destacado dentro de suas anlises o das citaes entre pginas, conhecidas como links , hyperlinks ou weblinks . Estes so vistos cada vez mais como um indicador da importncia global de um site ou um espao Web para a comunidade externa 34, 32 . O nmero de links que levam a um determinado site usado como um fator de hierarquizao no momento de exibir, na tela, os sites recuperados por
157

Nadia Aurora Peres Vanti

alguns motores de busca (como o Google, por exemplo, ou o Lycos, mencionado por Larson)35. H um nmero crescente de estudos que contabilizam links e sites buscando identificar quais dentre estes ltimos so mais citados. Conforme expressa Smith 32 , os motores de busca fornecem possibilidades para a investigao de links ou relaes entre documentos semelhantes quelas oferecidas pelas bases de dados de citaes do ISI, de forma que pode ser estabelecida uma analogia entre as anlises dos hyperlinks e as tradicionais anlises de citaes em publicaes impressas. A utilizao de operadores booleanos permite resgatar as home pages que remetem a certas pginas ou sites previamente selecionados e calcular seu nmero. Existe um neologismo para definir a citao entre home pages: sitation, que poderia ser traduzido, em portugus, como sitao. McKiernan36 foi quem utilizou pela primeira vez este termo no sentido de sites citados, expresso tambm usada por Aguillo no Encontro de Bielefelb (outubro de 1996). Rousseau37 outro autor que recorreu a esta expresso em um trabalho publicado na Cybermetrics intitulado Sitations: an exploratory study, onde estudou os links entre websites e a distribuio de freqncias de sitaes. J tm sido pesquisadas, no campo da bibliometria, as razes que levam certos autores a citar outros autores. Egghe & Rousseau (apud Rousseau),37 por exemplo, tm desenvolvido trabalhos sobre o tema. Tambm Gilbert3 8 e Brooks (apud Rousseau)37 escreveram sobre o assunto, chegando concluso de que a persuaso , na maioria das vezes, o que explicaria a necessidade de invocar a autoridade daqueles que produziram investigaces e textos prvios sobre a matria. Porm, at onde se sabe, as razes pelas quais as pessoas linkam outras pginas nas suas ainda no tem sido investigadas, nem tem sido discutidas as diferenas entre sitaes na web e citaes nos artigos cientficos37. De qualquer maneira, pode-se inferir que os links so includos nas pginas com o intuito de oferecer mais informao aos usurios e redirecionlos, assim, para outras fontes. Com relao s citaes de sites ou sitaes, h um indicador que vem suscitando um grande interesse entre os estudiosos que atuam no campo da webometria: o fator de impacto da Web (Web Impact Factor WIF). Ingwersen34 foi um dos primeiros a sugerir a criao de uma medio anloga quela do fator de impacto de revistas calculado pelo ISI nas suas bases de dados de citaes que permitisse a comparao do grau de atratividade de sites ou domnios na Web.
158

Seguindo a definio dada por Ingwersen34, o fator de impacto na Web implica a soma do nmero de links contidos em pginas Web externas e internas que se referem a um determinado pas ou site dividido pelo nmero de pginas encontradas nesse pas ou site da Web em um certo momento. O numerador consiste, portanto, no nmero de pginas linkadas no no nmero de links. Em outras palavras, conforme Thelwall39, o fator de impacto , essencialmente, o nmero de pginas que levam a um determinado site ou rea da Internet dividido pelo nmero de pginas neste site ou rea, o que pode ser expressado na seguinte frmula: Fator de impacto da Web = N de pginas que linkam determinado site N de pginas do site linkado Este indicador serve para medir e comparar a atratividade e influncia que possam alcanar distintos espaos na Web. A natureza dinmica e em tempo real da rede sugere que a medio de fatores de impacto pode ser til para complementar as medies tradicionais. Ele permite evidenciar o grau de reconhecimento relativo que ostentam os pases ou sites de pesquisa na Web em um determinado ponto do tempo34, 32. H, basicamente, dois tipos de fatores de impacto da Web: os externos aqueles que refletem o nmero de pginas linkadas fora do espao Web que est sendo analisado e os internos ou autolinks aqueles que refletem os links existentes dentro do prprio espao Web analisado32. Concordando com Rousseau,37 um link interno pode, tambm, ser chamado de autositao (sic), ou seja, a sitao de uma outra pgina dentro do mesmo site ou conjunto de sites. Um exemplo disto seria o link listado na pgina ilea.ufrgs.br/cict que aponta para a pgina ilea.ufrgs.br/nerint: as duas compartilham a mesma raiz no endereo eletrnico. importante ressalvar, junto com Ingwersen (p. 237) 34, que, em comparao com as citaes cientficas de revistas, instituies ou indivduos as quais podem ser estveis ou aumentar , o nmero de links que remetem a um objeto particular dentro da Web pode diminuir ou at desaparecer. Isto ocorre devido ao eventual fechamento ou reestruturao de certas pginas que estavam disponveis em algum momento na rede e que mudaram ou que no esto mais. O que impossibilita, nestes casos, um clculo retrospectivo do fator de impacto.

Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

H, alm deste aspecto, alguns outros problemas que se apresentam para medir os fatores de impacto na Web. Um deles a equiparao de links ou referncias a sites de valores diversos: tm o mesmo peso, por exemplo, tanto os links listados em uma pgina por uma pessoa qualificada depois de uma avaliao sria, quanto aqueles que so produto de um procedimento mecnico, efetuado por um motor de busca39. Outra particularidade relacionada ao fator de impacto na Web, como destaca Smith32, diz respeito s revistas eletrnicas. Nestes casos, ele no conceitualmente igual aquele utilizado nas revistas convencionais os links que levam a revistas eletrnicas tendem a apontar para a revista como um todo mais do que para artigos especficos, portanto serve para medir o reconhecimento da revista mais do que o reconhecimento do seu contedo. No restam dvidas de que a Internet uma fonte inesgotvel de recursos que podem ser tanto utilizados pelos usurios que buscam informao quanto por estudiosos que se dispem a analisar a estrutura da rede e seu contedo. Existem, no entanto, certas dificuldades para a realizao de um estudo webomtrico, entre as quais podemos citar a natureza dinmica e em tempo real da Internet, a enorme massa de dados no padronizada que esta contm e inconsistncias nos servios e motores de busca. Como destacam Bar-Ilan40 e Olvera Lobo41, documentos desaparecem, h mudanas contnuas, novas pginas relevantes so constantemente agregadas e os buscadores demoram um tempo at incorporar tais mudanas, tornando mais difcil o processo de anlise e indexao destas pginas na rede. A isto, soma-se o problema citado por Lynch42, derivado do carter mutante da prpria estrutura de muitas pginas, as quais no trabalham com arquivos estticos, mas sim com contedos que variam com alta freqncia, como o caso de jornais eletrnicos ou das bases de dados interativas, o que configura mais um empecilho para a anlise e quantificao destes sites. O enorme volume de informao disponvel na Web faz com que seja difcil encontrar exatamente o que se procura. Como bem aponta Olvera Lobo41: [...] o crescimento de informaes eletrnicas, os projetos de bibliotecas digitais, o enorme volume de dados disponveis levam a que os tradicionais servios de indexao e resumo no sejam suficientes para a busca e recuperao de informao nestas grandes bases de dados hipermdia.
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

Nesta mesma linha de pensamento, Lynch42 pondera: Se por um lado os mtodos automticos fornecem um acesso uniforme e igual a toda a informao existente na rede, por outro lado, na prtica, este igualitarismo eletrnico pode produzir grandes misturas: trazer um excesso de informao sem hierarquias onde so recuperados sites irrelevantes enquanto material importante pode ficar relegado. Segundo Almind & Ingwersen30, a soluo para este problema seria usar as bases de dados indexadas da WWW. Sabe-se, de qualquer maneira, que a indexao e cobertura destas ainda muito misturada e errtica. No h padronizao na forma de indexao da informao: cada autor escolhe caminhos diversos. No que diz respeito, mais especificamente, aos motores de busca, estes apresentam uma srie de inconsistncias lgicas que dificultam a mensurao dos dados contidos em suas bases. Como explicam Judit Bar-Ilan 40 e Thelwall39, os motores costumam perder informao: URLs relevantes recuperados em um determinado momento por um determinado motor de busca no so encontrados por esse mesmo motor em um momento posterior (apesar de continuarem existindo e sendo relevantes). Por outro lado, o contedo destes tambm s vezes se perde, j que URLs semelhantes recuperados numa segunda vez no contm exatamente a mesma informao que na primeira. Tambm, quando so utilizados vrios buscadores e comparados entre si para avaliar seu desempenho, percebe-se que a sobreposio dos resultados mostrados por eles surpreendentemente pequena, o que pode afetar, de algum modo, a confiabilidade das anlises webomtricas. Seguindo com Bar-Ila40, cabe mencionar que as flutuaes e mudanas ao longo do tempo no nmero de resultados de uma busca j tm sido investigadas por Peterson em 1997, por Rousseau tambm em 1997 e por Notess e Aguillo em 1999. Entretanto, nestes trabalhos, s considerada a quantidade de resultados, e no os resultados em si mesmos. Seguindo com Bar-Ilan40, cabe mencionar que as flutuaes e mudanas ao longo do tempo no nmero de resultados de uma busca j tm sido investigadas por Peterson em 1997, por Rousseau tambm em 1997 e por Notess e Aguillo em 1999. Entretanto, nestes trabalhos, s considerada a quantidade de resultados, e no os resultados em si mesmos.
159

Nadia Aurora Peres Vanti

Conforme Notess43, as inconsistncias vo alm da incapacidade de contabilizao, incluindo problemas que tm a ver com o processamento das sintaxes de busca. O processamento pode levar a resultados esprios pelo fato de que os recursos utilizados para elaborar as estratgias de busca truncamento, pesquisa por campos e operadores booleanos bsicos , nem sempre trabalham de forma satisfatria, menos ainda quando so utilizados de maneira combinada. A seleo e hierarquizao de acordo com a relevncia dos documentos recuperados na Web dependem de avaliaes subjetivas, j que no houve na inteligncia artificial ainda desenvolvimentos suficientes que possam fazer uma busca qualitativamente mais acurada. Isto sem mencionar as dificuldades que os motores tm para identificar certas caractersticas de um documento na Web, como o contexto ou o tema geral em que tal documento se enquadra, assim como o tipo de documento (uma comunicao cientfica, uma informao profissional ou informal etc.)41, 42, 40.

TABELA 1 Comparao das aplicaes dos distintos mtodos quantitativos:

Fonte: adaptado de McGrath (apud Macias-Chapula, 1998).

Em definitivo, cabe reafirmar que para alcanar resultados consistentes e anlises webomtricas satisfatrias, deve-se tentar escolher motores de busca que renam as caractersticas mencionadas a seguir, ou que, combinados, permitam cumprir estes critrios, citados por Smith32 em um trabalho recente: contar com uma base de dados atualizada que tanto inclua as pginas mais novas, quanto que exclua aquelas pginas que esto fora do ar ou que j no existem mais; cobrir a maior proporo possvel da Web; ter a capacidade de delimitar a busca por domnio; oferecer a possibilidade de recuperao de todas as pginas que contenham links para um espao Web particular;

permitir a combinao de resultados de busca com operadores booleanos para, por exemplo, contabilizar o nmero de pginas que linkam um espao Web particular excluindo os links internos desse. Retomando, por fim, a comparao entre bibliometria, cienciometria e informetria, resulta pertinente reproduzir uma tabela apresentada por William McGrath (apud Macias-Chapula)19, onde so apresentados, de maneira esquemtica, o objeto de estudo, as variveis, os mtodos e objetivos destas subdisciplinas. Ao agregar a esta outras informaes complementares, incluindo tambm elementos relacionados mais recente rea de estudos das mtricas, a webometria, construiu-se uma nova tabela que facilita o entendimento das aplicaes j mencionadas e das semelhanas e diferenas que unem e separam estes subcampos (tabela 1). As definies levantadas e o quadro comparativo dos conceitos de bibliometria, cienciometria, informetria e webometria podem ser representados de forma a visualizar melhor a inter-relao entre estes subcampos dentro da cincia da informao, na figura 1, a seguir.
Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

160

Da bibliometria webometria: uma explorao conceitual dos mecanismos utilizados para medir o registro da informao e a difuso do conhecimento

CONCLUSO

Finalizando, pode-se afirmar que a representao, especialmente com relao aos primeiros trs subcampos citados, na figura 1, est de acordo com as anlises de Gorkova (apud Brookes) 14 , Russell 17 e Tague Sutckiffe13, que consideram que a informetria mais ampla e compreende a bibliometria e a cienciometria. Seguindo este raciocnio, a webometria tambm aparece, na mesma figura, representada como um subcampo dentro da informetria, j que nasceu e parte integrante desta. Cabe, portanto, A - Bibliometria B - Cienciometria considerar informetria como o C - Informetria termo guarda-chuva que consegue D - Webometria abarcar os outros trs conceitos dentro dele. A representao grfica reflete, tambm, a sobreposio que em algum momento se d entre a bibliometria, a cienciometria e a webometria, dado que esta ltima aplica tcnicas bibliomtricas e cienciomtricas para medir a informao disponvel na Web. Como apregoa Rousseau12, devemos consolidar a idia de que todas estas especialidades encontram sua ligao a partir da sua origem comum: todas elas indubitavelmente constituem-se em subcampos da cincia da informao. Considerando-as, desta maneira, poderemos compreender mais satisfatoriamente a aplicabilidade de cada uma e a utilidade que oferecem para as mais diversas reas do conhecimento.
Artigo aceito para publicao em 12-11-2001 REFERNCIAS 1. 2. 3. 4. TORRINHA, F. Dicionrio portugus-latino. Porto : Ed. Domingos, 1939. 1129 p. HECKLER, E.; BACK, S.; MASSING, E. R. Dicionrio morfolgico da lngua portuguesa. So Leopoldo, RS : UNISINOS, 1984. v. 4. ALVES, R. Professor no vale nada. Folha de So Paulo, So Paulo, 12 set. 1999. Caderno Especial Ranking da Cincia, p. 7. OLIVEIRA, A.. C.; DREA, J. G.; DOMENE, S. M. A. Bibliometria na avaliao da produo cientfica da rea de nutrio registrada no Cibran: perodo de 1984-1989. Cincia da Informao, Braslia, v. 21, n. 3, p. 239-242, set./dez. 1992. LAWANI, S. M. Bibliometrics: its theoretical foundations, methods and applications. Libri, v. 31, n. 4, p. 294-315, 1981.

FIGURA 1 Diagrama da inter-relao entre os quatro subcampos

6.

SENGUPTA, I. N. Bibliometrics, informetrics, scientometrics and librametrics: an overview. Libri, v. 42, n. 2, p. 99-135, 1992.

7 . PRITCHARD, A. Statistical bibliography or bibliometrics? Journal of Documentation, v. 25, n. 4, p. 348-349, Dec. 1969. 8 . FONSECA, E. N. Bibliografia estatstica e bibliometria: uma reivindicao de prioridades. Cincia da Informao, Braslia, v. 2, n.1, p. 5-7, 1973. 9 . FONSECA, E. N. (Org.). Bibliometria: teoria e prtica. So Paulo : EDUSP, 1986. 141 p. 10 . RAVICHANDRA RAO, I. K . Mtodos quantitativos em biblioteconomia e cincia da informao. Braslia : ABDF, 1986. 272 p. 11. DOBROV, G. M.; KARENNOI, A. A. The informational basis of scientometrics. In : MIKHAILOV, A. I.. (Ed.). On theoretical problems of informatics. Moscou : VINITI./FID, 1969. p. 165-191. 12. SPINAK, E. Diccionario enciclopdico de bibliometra, cienciometra e informetra. Montevideo, 1996. 245 p. 13. TAGUE-SUTCKIFFE, J. An introduction to informetrics. Information Processing & Management, v. 28, n. 1, p. 1-3, 1992. 14. BROOKES, B. C. Biblio, sciento, infor-metrics? What are we talking about? In: EGGHE, L.; ROUSSEAU, R. (Ed.). Informetrics 89/90 . Amsterdam : Elsevier, 1990. p. 31-43. 15. SENGUPTA, I. N. Bibliometrics, informetrics, scientometrics and librametrics: an overview. Libri, v. 42, n. 2, p. 99-135, 1992. 16. GLNZEL, W.; SCHOEPFLIN, U. Little scientometrics, big scientometrics... and beyond? Scientometrics, v. 30, n. 2/3, p. 375-384, 1994. 17. RUSSELL, J. M. Back to the future for informetrics? Scientometrics , v. 30, n. 1, p. 407-410, 1994. 18. EGGHE, L. Bridging the gaps: conceptual discussions on informetrics. Scientometrics, v. 30, n. 1, p. 35-47, 1994.

5.

Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002

161

Nadia Aurora Peres Vanti


19. MACIAS-CHAPULA, C. A. O papel da informetria e da cienciometria e sua perspectiva nacional e internacional. Cincia da Informao, Braslia, v. 27, n. 2, p. 134-140, maio/ago. 1998. 20. VAN RAAN, A. F. J. Scientometrics: state-of-art. Scientometrics, v. 38, n. 1, p. 205-218, 1997. 21. HJOREGAARD CHRISTENSEN, F.; INGWERSEN, P . Data set isolation for bibliometric online analyses of research publications: fundamental methodological issues. Journal of the American Society for Information Science, v. 48, n. 3, p. 205-217, 1997. 22. WORMELL, I. Informetria: explorando bases de dados como instrumentos de anlise. Cincia da Informao, Braslia, v. 27, n. 2, 1998. Disponvel em: <www.scielo.br/cgi-bin/fbpe/>. Acesso em: 16 jun. 1999. 23. WOLFRAM, D. Applying informetric characteristics of database to ir system file design. Part I: informetric models. Information Processing & Management, v. 28, n. 1, p. 121-133, 1992a. 24. RIVAS, L. M. Tcnicas bibliomtricas: seleccin y evaluacin de publicaciones peridicas para bibliotecas y bases de datos biomdicas especializadas. Bibliotecologa y Documentacin, v. 6, n. 6-11, p. 41-81, jul/dic. 1981. 25. MEIS, L. et al. Uso de indicadores exige cautela. Folha de So Paulo , So Paulo, 12 set. 1999. Caderno Especial Ranking da Cincia, p. 7. 26. BRAGA, G. M.. Informao, cincia, poltica cientfica: o pensamento de Derek de Solla Price. Cincia da Informao, Braslia, v. 3, n. 2, p. 155-177, 1974. 27. VELHO, L. M. L. S. Como medir a cincia? Revista Brasileira de Tecnologia , v. 16, n. 1, p. 35-41, jan./fev. 1985. 28. CALLON, M.; COURTIAL, J. P.; PENAN, H. Cienciometra : la medicin de la actividad cientfica - de la bibliometra a la vigilancia tecnolgica. Gijn : Trea, 1995. 110 p. 29. WOLFRAM, D. Applying informetric characteristics of database to ir system file design. Part II: simulation comparisons. Information Processing & Management, v. 28, n. 1, p. 135-151, 1992b. 30. ALMIND, T. C.; INGWERSEN, P. Informetric analyses on the world wide web: methodological approaches to webmetrocs. Journal of Documentation, v. 53, n. 4, p. 404-426, 1997. 31. CRONIN, B.; MCKIM, G. Science and scholarship on the World Wide Web: a North American perspective. Jounal of Documentation, v. 52, v. 2, 1996, p. 163-171. 32. SMITH, A. A tale two web spaces: comparing sites using web impact factors. Journal of Documentation , v. 55, n. 5, p. 577-592, Dec. 1999. 33. QUONIAM, L .; ROSTAING, H. From Scienciometrics, informetrics to internetometrics, cybermetrics or is it possible to neglect Internet nowadays? In : CYBERMETRICS97, 1997, Jerusalm, Israel. Comunicao Cientfica. Jerusalm, 1997. Disponvel em: <http://www.cindoc.csis.es/Cybermetrics>. Acesso em: 2 out. 2001. 34. INGWERSEN, P. The calculation of Web impact factors. Journal of Documentation, v. 54, n. 2, 1998. p. 236-243. 35. LARSON, R. R. Bibliometrics of the World Wide Web: an exploratory analysis of the intellectual struture of cyberspace. Berkeley : University of Califrnia, 1996. Disponvel em: <http : // sherloc.berkeley.edu/asis96.html>. Acesso em: 3 out. 2001. 36. MCKIERNAN, G. CitedSites(sm) : citation indexing of Web resources 1996. Disponvel em: <http://www.public.iastate.edu/ ~CYBERSTACKS/Cited.htm>. Acesso em: 5 out. 2001.37. 37. ROUSSEAU, R. Citations: an exploratory study. Cybermetrics,. v.1, n. 1, 1997. Disponvel em: <http://www.cindoc.csis.es/ Cybermetrics_ Volume 1_ Issue 1_ Paper 1_ Sitations: an exploratory study by R_ Rousseau.htm>. Acesso em: 25 set. 2001. 38. GILBERT, G. N. Referencing as persuasion. Social Studies of Science, n. 7, 1977, p. 113-122. 39. THELWALL, M. Web impact factors and search engine coverage. Journal of Documentation, v. 56, n. 2, 2000, p. 185-189. 40. BAR-ILAN, J. Search engine results over time: a case study on search engine estability. Cybermetrics , v. 2/3, n. 1, 1998/1999. Disponvel em: <www.cindoc.csic.es/cybermetrics/vol2iss1.html>. Acesso em: 23 set. 2001. 41. OLVERA LOBO, M. D. Mtodos y tcnicas para la indizacin y la recuperacin de los recursos de la World Wide Web. Boletin de la Asociacin Andaluza de Bibliotecrios, n. 57, 1999. 42. LYNCH, C. Searching the Internet: combining the skills of the librarian and the computer scientist may help organize the anarchy of the Internet. Scientific American , Mar.1997. Disponvel em: <http://www.sciam.com/0397issue/0397lynch.html>. Acesso em: 3 out. 2001. 43. NOTESS, G. R. On the net: search engine inconsistencies. Online, v. 24, n. 2, Mar. 2000.

162

Ci. Inf., Braslia, v. 31, n. 2, p. 152-162, maio/ago. 2002