Vous êtes sur la page 1sur 9

La diversidad cultural en Google y los motores de búsqueda: una aproximación conceptual

La diversidad cultural en Google y los motores de


búsqueda: una aproximación conceptual

Por Ernest Abadal y Lluís Codina

Resumen: Se analiza una preocupación expresada tanto de


forma implícita como explícita en diversos ámbitos, según la
cual los motores de búsqueda en general y Google en particu-
lar, podrían estar utilizando algún sistema para ocultar deter-
minados contenidos culturales o bien para destacar aquellos
que proceden del ámbito anglosajón en detrimento de los de
otras culturas y lenguas. Dicho de otro modo, se considera, en
una primera aproximación de modo exclusivamente concep-
tual, la idea de si el uso intensivo de los motores de búsque-
da, tan característico de nuestro tiempo, resulta una amenaza
para la diversidad cultural. Para ello, en primer lugar y con el
fin de contextualizar este trabajo, se lleva a cabo una presen-
tación de dos polémicas previas sobre el dilema proteccionis-
mo o libre flujo de los productos culturales y a continuación
Ernest Abadal es profesor Lluís Codina es profesor ti-
se analizan las características más relevantes de los motores titular de la Facultad de Bi- tular de universidad. Imparte
de búsqueda (centrándonos en Google en particular) con el blioteconomía y Documen- docencia en los estudios de
fin de valorar si éstos constituyen una amenaza creíble a la tación de la Universitat de periodismo y en la Facultad
Barcelona (UB); Adjunto al de Comunicación Audiovisual
diversidad cultural e idiomática de la Web.
vicerrectorado de Política de la Universidad Pompeu
Palabras clave: Google, Motores de búsqueda, Diversidad Docente para Sistemas de Fabra de Barcelona. Es el in-
Información y Documenta- vestigador principal del Grupo
cultural. ción (UB); y vicepresidente de Investigación DigiDoc de la
Title: Cultural diversity in Google and other del Consorci de Biblioteques misma universidad. Participa
Universitàries de Catalunya en el máster interuniversitario
search engines: A theoretical approach (CBUC). Es autor de diversos UB/UPF en gestión de conteni-
artículos y monografías so- dos digitales, en el programa
Abstract: In various contexts, a concern has been expressed,
bre recuperación de informa- de doctorado del Departa-
both implicitly and explicitly, that search engines in general, ción y sobre publicaciones mento de Periodismo y de Co-
and Google in particular, may be using some system that ob- digitales. municación Audiovisual y es
scures certain cultural content or emphasizes the Anglo-Sax- co-director del máster online
de documentación digital.
on perspective, to the detriment of other cultures and languages. To put it in other terms,
we present an exclusively theoretical approach to the idea that intensive use of search engines, which is so common now,
represents a threat to cultural diversity. First, with the goal of putting our study in context, we present two previous debates
on the dilemma of protectionism vs. the free flow of cultural products, and then analyse the most relevant characteristics
of search engines (with a focus on Google) to determine whether they constitute a credible threat to cultural and linguistic
diversity on the Web.
Keywords: Google, Search engines, Cultural diversity.
Abadal, Ernest; Codina, Lluís. “La diversidad cultural en Google y los motores de búsqueda: una aproximación concep-
tual”. En: El profesional de la información, 2008, marzo-abril, v. 17, n. 2, pp. 191-198.
DOI: 10.3145/epi.2008.mar.09

Introducción racterísticas tecnológicas. No obs- parece cada vez más necesario aña-
tante, los motores de búsqueda, en dir estas dimensiones de análisis a
NADIE DUDA QUE LOS MO-
tanto que partes fundamentales de
TORES DE BÚSQUEDA consti-
la Web entendida como un gran me-
tuyen uno de los elementos fun-
dio de comunicación y de difusión “Causa inquietud que
damentales de la Web. De hecho,
de contenidos, también se pueden Google sea el buscador
la búsqueda es, justo después del
considerar desde puntos de vista
correo electrónico, la principal utilizado de forma
sociales, culturales o políticos. La
actividad de los internautas. casi exclusiva por los
cuestión es que causa inquietud que
Desde el ámbito de la recupera- Google sea el buscador utilizado de ciudadanos de todo el
ción de la información se acostum- forma casi exclusiva por los ciuda- planeta”
bran a analizar sobre todo sus ca- danos de todo el planeta. Además,

El profesional de la información, v.17, n. 2, marzo-abril 2008 191


Ernest Abadal y Lluís Codina

las “meramente” técnicas (pero sin conceptos utilizados por parte de de sus búsquedas incluye algún me-
ignorarlas ni dejarlas tampoco de la teoría de la comunicación y los canismo que otorgue un trato privi-
lado). aplica al entorno de la Web. Una de legiado a los contenidos culturales
sus aportaciones se refiere a la dis- norteamericanos o anglosajones en
Buen ejemplo de esta preocu-
tinción entre contenidos existentes detrimento de los de otras culturas
pación son los trabajos de Lucas
(availables) y accesibles (accessi- o lenguas.
D. Introna y Helen Nissenbaum,
bles), siendo estos últimos los que
que exponen en sendos artículos Con el propósito de situar nues-
son fácilmente localizables por los
conjuntos (2000a, 2000b) los fun- tro trabajo en un contexto más am-
usuarios gracias a los mecanismos
damentos del posicionamiento web plio, comenzaremos por revisar dos
de priorización de los motores de
y de los algoritmos de relevancia polémicas políticas y económicas
búsqueda. Podría considerarse una
para resaltar cómo las presiones e que se han producido en el entor-
dicotomía comparable a la habitual
intereses del mercado condicionan no de los medios de comunicación
en nuestro ámbito entre contenido
las listas de resultados de los bus- social y que tienen que ver con la
indizable o web superficial y ma-
cadores. necesidad de establecer medidas
terial no indizable o web invisible,
proteccionistas o no al flujo cultural
Según estos investigadores los pero con un componente un tanto
y de información entre países con el
motores de búsqueda indexan espe- “conspirativo”.
fin de preservar la diversidad cultu-
cialmente los ámbitos en los cuales
La desconfianza sobre la ac- ral. En concreto, se trata de las dis-
existen intereses comerciales, en
tuación de los motores de búsque- cusiones sobre el nomic y sobre la
detrimento de aquel tipo de infor-
da no se limita al ámbito político y denominada “excepción cultural”.
mación o de público que no dispo-
ne de incentivos económicos. Esos económico, sino que también se ha A continuación se discutirán
autores realizan una aproximación formulado desde el punto de vista con detalle algunas características
desde el punto de vista político y cultural. Se trata de una cuestión re- y el modo de funcionamiento del
sin concesiones; su objetivo es cri- currente que va saltando a la pales- buscador de Google (hasta donde
ticar y poner de manifiesto supues- tra por motivos diversos, ya se trate la empresa propietaria los ha he-
tos intereses ocultos. La tesis de del anuncio de un buscador “euro- cho públicos y son conocidos por
fondo es que los buscadores (y la peo”1, o de los proyectos de digi- los analistas externos) para valorar
Web en general) tienen un carácter talización masiva de libros, y pone si estos elementos presentan algún
de bien público (public good) por lo sobre la mesa la discusión sobre la indicio o alguna evidencia de te-
cual no pueden estar guiados exclu- necesidad de Europa de defenderse ner capacidad para afectar a la di-
sivamente por intereses de mercado de un presunto sesgo cultural de los versidad cultural e idiomática en
sino en base a principios de interés motores de búsqueda de origen nor- este caso de los recursos presentes
público. En este sentido, se refieren teamericano, y muy en particular de en la Web. La fundamentación de
a diversas líneas de acción a lle- Google, dado su dominio del mer- este segundo apartado se basará en
var a cabo para que los motores de cado global. la presentación de los sistemas de
búsqueda estén abiertos a todos los indización y en los mecanismos de
En este texto nos proponemos
contenidos y a todos los públicos. ponderación de resultados (ranking)
analizar esta idea y presentar algu-
Se trata de unos textos de carácter del buscador.
nas bases conceptuales que puedan
teórico y con una toma de posición
ayudar a determinar su credibili-
previa. Aunque se puedan compar- Producción y difusión
dad, es decir, a establecer si los bus-
tir algunos de los presupuestos de cultural: ¿proteccionismo
cadores realmente constituyen una
fondo, es difícil estar de acuerdo o libre flujo?
amenaza para la diversidad cultural
con algunas de las explicaciones y
como puede suceder con otros ám- Está plenamente establecido que
justificaciones que ofrecen, ya que
bitos de la comunicación social (por la información y la cultura no son
no se basan en datos empíricos con-
ejemplo, con el flujo de informa- un producto comercial como cual-
trastados.
ción en los noticiarios televisivos, quier otro. Ciertamente, la difusión
Eszter Hargittai (2000), por su en la prensa escrita o con el cine masiva y en una sola dirección de
parte, destaca el papel de filtro de en los países donde el predominio información y cultura provoca con
los buscadores y otros servicios web de la producción hollywoodiense facilidad casos de colonización y
similares y los considera como unos puede llegar a eclipsar las produc- homogeneización culturales. Esta
nuevos “gatekeepers”, es decir, sis- ciones nacionales). Examinaremos, constatación ha generado al menos
temas facilitadores (o denegadores) por tanto, si el sistema que utilizan un par de polémicas internacionales
de acceso a la información. Toma los motores como Google para se- de profundo calado que están lejos
como referencia los principales leccionar y ordenar los resultados de haber sido resueltas. Nos referi-

192 El profesional de la información, v.17, n. 2, marzo-abril 2008


La diversidad cultural en Google y los motores de búsqueda: una aproximación conceptual

mos a la discusión sobre el “nuevo cado y la libre competencia. Como Las conocidas y polémicas cuo-
orden mundial de la información y consecuencia de las discusiones los tas de pantalla que afectan la exhi-
la comunicación” (nomic) y a la de- EUA y Gran Bretaña salieron de la bición cinematográfica en muchos
fensa por parte de algunos países eu- Unesco en 1984 y 1985, respectiva- países europeos (es obligado ex-
ropeos y en especial de Francia de la mente2, organización a la que con- hibir una determinada proporción
denominada “excepción cultural”. sideraron como un foro de propa- de cine europeo en todas las salas)
ganda anti-occidental. La crisis que eran el caballo de batalla de los es-
Las discusiones sobre el nomic
sufrió este organismo dependiente tadounidenses, que lo consideraban
arrancaron a finales de 1970 y reco-
de las Naciones Unidas fue pro- una medida proteccionista atentato-
gían las inquietudes de determina-
funda, y no sólo tuvo repercusiones ria contra los principios de libera-
dos países que, dado el sistema im-
a nivel institucional sino también lización del comercio mundial, es
perante de producción de noticias
económico (hay que recordar que decir, contra la filosofía de la Ronda
periodísticas y de otro tipo en aquel
los EUA sufragaban una cuarta par- Uruguay. El argumento de los fran-
momento, nunca eran difusores de
te del presupuesto total de la Unes- ceses se basaba en la especificidad
noticias. Lo que pretendían era no
co). La creación de algunos medios de la industria de la cultura que no
ser engullidos por el flujo proce-
de comunicación avalados y finan- tiene el resto de sectores producti-
dente principalmente de los países
ciados directamente por gobiernos vos. La discusión no está cerrada y
anglosajones, y de los EUA más
(Al Jezira y otras cadenas árabes, o de hecho muchos países europeos
concretamente (con sus poderosas
el canal teleSUR impulsada por Ve- mantienen todavía las cláusulas de
agencias de noticias y cadenas de
nezuela y otros gobiernos latinoa- protección para defenderse de la
televisión a la cabeza).
mericanos, son un buen ejemplo) penetración de productos culturales
La Unesco, entonces dirigida mostrarían que los motivos de los extranjeros (especialmente esta-
por el senegalés Amadou Mahtar debates aún siguen vigentes. dounidenses). Después de muchas
M´Bow, propició la realización de controversias y negociaciones den-
La “excepción cultural”, por su
diversos estudios para intentar co- tro del GATT se excluyeron tem-
parte, fue un término afortunado
rregir estos desequilibrios. Era lo poralmente las “creaciones del es-
acuñado por los franceses en me-
que se denominó nomic, una pro- píritu” de las normas vigentes para
dio de las negociaciones finales del
puesta presentada dentro del ámbito otras mercancías.
GATT (Ronda Uruguay)3 con el fin
de esta organización que pretendía
de preservar los productos audiovi-
reducir el colonialismo informa- Motores de búsqueda y
suales (cine y televisión) de la libe-
tivo propiciado “de facto” por los contenidos culturales
ralización comercial. Francia y los
países occidentales y favorecer la
EUA oficiaron de líderes de una y Las dos polémicas anteriores
difusión de la cultura de los países
otra postura, y el punto de discusión están ampliamente documentadas
del Tercer Mundo en los medios de
se centró en la industria audiovisual en la bibliografía especializada. No
comunicación. El político irlandés,
sobre la cual los americanos que- pasa lo mismo cuando se traslada
y premio Nobel de la Paz (1974),
rían que se eliminara cualquier ba- este debate a la web y más concreta-
Sean MacBride fue nombrado por
rrera arancelaria o proteccionismo mente al papel que ejercen los mo-
la Unesco en 1977 presidente de
legal, mientras que los franceses tores de búsqueda. En este apartado
una comisión encargada de analizar
defendían justo lo contrario. La ma- vamos a intentar demostrar que la
los problemas de la comunicación a
yoría de países de la UE (excepto posible amenaza a la diversidad
nivel internacional. El denominado
Gran Bretaña) estaban de acuerdo cultural de los buscadores estado-
Informe MacBride, presentado en
con los franceses en esta cuestión. unidenses contiene diferencias fun-
Belgrado en 1980, denunciaba un
El origen de la polémica hay que damentales con las dos polémicas
desequilibrio informativo entre nor-
situarlo en 1989, cuando se apro- antes descritas. Para ello, vamos a
te y sur que podía llegar a afectar
bó una directiva europea conocida examinar el funcionamiento de tres
la diversidad cultural. Una de sus
popularmente como “Televisión sin elementos sustanciales de la difu-
recomendaciones fue la creación de
fronteras”, que recomendaba a los sión de información por parte de
una agencia de noticias internacio-
países europeos que reservasen la los medios de comunicación social
nal independiente gestionada por la
mayor parte del tiempo de emisión y a comparar su aplicación en ellos
Unesco para contrapesar el poder de
televisiva para producciones euro- y en el caso de los buscadores.
las grandes agencias comerciales.
peas. Su aprobación fue denunciada
Los EUA y la mayoría de paí- dentro del GATT como un atentado Estos son: el tipo de selección
ses occidentales se opusieron fron- contra los principios que regían en previa de la información (lo que los
talmente a lo que consideraban una este organismo y que habían sido comunicólogos denominan agenda
forma de atentar contra el libre mer- también suscritos por la UE. setting y que se refiere a qué con-

El profesional de la información, v.17, n. 2, marzo-abril 2008 193


Ernest Abadal y Lluís Codina

tenidos se incluyen); la saturación rentemente ilimitado como la web, vamos a recurrir a un estudio de L.
de canal (es decir, cuáles se pueden los medios de comunicación selec- Vaughan y M. Thelwall (2004) en
llegar a distribuir); y la priorización cionan qué es noticia y qué no lo el que se analiza la cobertura geo-
de la información (en qué posición es. Se trata de la función denomi- gráfica de los motores de búsque-
de la lista se hacen aparecer los nada agenda setting según la cual, da con el objetivo de determinar si
contenidos). aunque los medios no dictan cómo existe algún sesgo político o cultu-
debe pensar el ciudadano, sin duda ral por parte de los buscadores ha-
establecen sobre qué corresponde cia los contenidos estadounidenses
pensar. o de otros países.
“La posible amenaza a El trabajo analiza la cobertura
Por su parte, los motores de
la diversidad cultural de de las sedes web comerciales de
búsqueda no disponen en general de
los buscadores contiene cuatro países (EUA, China, Taiwán
elementos para filtrar qué páginas
diferencias fundamentales incluyen o no en su base de datos y Singapur) por parte de tres moto-
con las polémicas del en función de sus contenidos (por res de búsqueda (Google, Altavista,
nomic y de la ‘excepción ejemplo, basándose en la calidad de Alltheweb) y en dos idiomas (inglés
cultural’” la misma, en su solvencia, su idio- y chino). Los resultados muestran
ma, etc.). Es decir, no se produce de que las sedes web de los EUA es-
forma intrínseca una exclusión de tán mejor representadas (83%) que
contenidos por motivos culturales las de China (61%), Taiwán (51%)
Es indudable que la combina- o lingüísticos (y no existe eviden- o Singapur (49%) y que Google es
ción de estos tres factores puede cia de que Google se aparte de ello el motor que incluye un mayor por-
amenazar la diversidad cultural, ya en este aspecto) ya que se limitan a centaje de sedes web de cada uno
que unos determinados contenidos indizar los documentos publicados de los países. Sin embargo, según
pueden no ser seleccionados para en la web, a volcar en un índice (y los autores, los motivos que expli-
su difusión, o no disponer de tiem- a generar metadatos) de forma au- can este diferente grado de inclusi-
po o canal para ser difundidos o re- tomática, con lo que los usuarios de vidad no se deben a causas políticas
legarse a ámbitos de bajo nivel de cualquier rincón del mundo pueden o sociales (es decir, a la existencia
consulta. Ahora bien, ¿pueden apli- encontrar recursos de su entorno de sesgos premeditados por parte de
carse esos elementos de análisis al cultural más próximo con el simple los buscadores) si no que tienen una
caso de los motores de búsqueda en uso del idioma propio. explicación técnica basada en que
general y de Google en particular? las sedes web de los EUA disponen
En lo que sigue, vamos a proceder a Las dudas sobre la cantidad de de un mayor número de enlaces que
su examen más detallado. contenidos que los motores pue- las apuntan y, por tanto, tienen ma-
den indizar constituye uno de los yor visibilidad y facilidad para ser
1. Selección previa de la informa-
principales argumentos de Introna encontradas por parte de los mo-
ción
(2000a) o Hargittai (2000, p. 19) tores de búsqueda. Se trataría, por
Los medios de comunicación para criticar la poca atención a la tanto, de una variedad de lo que en
social (tanto en su formato analógi- diversidad cultural y política por el campo de la bibliometría se co-
co como en el digital) deben selec- parte de los motores de búsqueda noce como “efecto Mateo” (men-
cionar la información por diversos y otros portales que caracterizan cionado por primera vez por Mer-
motivos. Incluso en un canal apa- la web. Para compensar esta idea ton en 1968, o “a quien más tiene

Medios de comunicación social Web

Selección previa Limitación en función del interés (político, Tan sólo existen algunos
social, cultural, etc.) del medio. límites técnicos (localización
de las páginas por parte del
buscador).

Saturación del canal Limitación en función de los horarios de emisión Sin limitación. Posibilidad de
(radio y televisión) o del número de páginas distribuir y acceder a todos
(prensa escrita). los contenidos indexados.

Priorización de la Mejores horarios (radio y televisión) o primeras Algoritmo de relevancia que


información páginas (prensa escrita) seleccionados en ordena los resultados en
función de criterios subjetivos. función de criterios objetivos.
Tabla 1. Comparación entre medios de comunicación social clásicos y la web respecto a los tres factores analizados

194 El profesional de la información, v.17, n. 2, marzo-abril 2008


La diversidad cultural en Google y los motores de búsqueda: una aproximación conceptual

más se le dará”). Tres años más tar- En el mundo digital (es decir, el contenido, privilegiarlo (o degra-
de, Vaughan y Zangh (2007) am- propio de los buscadores), en cam- darlo): primera página de un diario,
pliaron este mismo estudio a webs bio, no hay una limitación previa prime time en los informativos de
educativas, gubernamentales y de sobre la cantidad de contenidos que televisión, acceso a un gran número
organizaciones, llegando a resulta- puede soportar el canal. Se estima de salas de cine para distribuir un
dos similares. que puede haber en la web al menos film, etc.
varias decenas de miles de millones
La tesis de estos autores coinci- El aspecto correspondiente a
de páginas (se especula con unos 30
de con otros estudios que también la priorización de los resultados en
mil millones). Que un ciudadano de
señalan la importancia de los enla- los motores de búsqueda que po-
Manhattan o de Berlín publique un
ces (“links have economic power”), dría asimilarse con este apartado
nuevo blog no va en detrimento de
no tanto por el hecho de aumentar es el cálculo de relevancia. Como
los ya preexistentes, y que la Uni-
el tráfico de visitas que proviene de es sabido, Google no presenta los
versidad de Barcelona incorpore
ellos, sino porque permiten que una resultados de manera aleatoria ni
un nuevo repositorio de documen-
sede web sea incluida en los moto- cronológica, sino aplicando un cál-
tos académicos en su web no es
res de búsqueda. Así pues, si adop- culo de relevancia, mostrándolos en
perjudicial para lo que pueda hacer
tamos el principio que aconseja es- orden decreciente (ranking). Los
la Universidad de México, etc. A lo
coger de entre varias explicaciones componentes concretos del cálculo
sumo, será más difícil hacer consul-
la más simple (“navaja de Ockham” no solamente permanecen en se-
tas efectivas en la web para ciertos
o “en igualdad de condiciones la creto sino que además varían con
temas durante un período de tiem-
solución más sencilla es probable- frecuencia. No obstante, hay dos
po, pero todos los contenidos serán
mente la correcta”), todo parece cosas que se conocen con seguri-
accesibles al mismo tiempo y por
indicar que las causas que explican dad: en primer lugar, se trata de un
igual a todos los efectos prácticos
la presencia de unas sedes web con- conjunto de algoritmos que tienen
para quienquiera que introduzca
cretas en los motores de búsqueda en cuenta características intrínsecas
la url adecuada en el navegador (o
son exclusivamente técnicas y no de las páginas web de tipo estadísti-
formule la pregunta correcta en Go-
tienen una motivación política o co o posicional: frecuencia absoluta
ogle).
cultural. y relativa de la palabra clave, posi-
Durante un tiempo, la rumo- ción de la palabra en el cuerpo del
rología sobre Google especuló documento, etc. En segundo lugar,
sobre las dificultades de construir los motores de búsqueda aplican un
“Las causas que explican un índice con más de diez mil mi- análisis de enlaces de tipo recursivo
la presencia de unas llones de páginas. Puede que el que otorga más peso a las páginas
determinadas sedes límite existiera en algún momento que reciben mayor número de en-
web en los motores y durante un cierto tiempo, pero laces de otras que a su vez son muy
de búsqueda son Google pronto anunció contener enlazadas.
exclusivamente técnicas y en su índice información sobre 20
mil millones4. La cuestión es que En general, la combinación de
no tienen una motivación
no parecen existir fronteras tecno- ambos criterios (los intrínsecos de
política o cultural”
lógicas prácticas para la cantidad cada página con relación a cada
de información que es capaz de pregunta, más el peso obtenido
albergar la web. Por su parte, el como resultado del análisis de en-
precio por gigabyte almacenado laces) proporciona el índice de rele-
2. Saturación del canal
no deja de caer en picado desde vancia relativo de cada página para
En los medios “clásicos”, es de- hace años, así como el de las CPU cada pregunta concreta. Obsérvese
cir, en la prensa escrita y la radio y el del ancho de banda disponible que, en este sentido, en un motor
y la televisión analógicas, existen en internet. Estos tres elementos de búsqueda no se produce un or-
unos canales a cuya saturación se combinados eliminan las barreras den previo de cada página, no hay
llega con cierta facilidad. Por ejem- económicas al crecimiento del vo- por tanto lugares privilegiados, sino
plo, los diarios no pueden tener un lumen de la información disponi- la selección y el orden de presen-
número ilimitado de páginas en ble en formato digital. tación se establecen a posteriori,
cada edición, y el espectro televisi- como resultado de comparar el tex-
3. Priorización de la información
vo y radiofónico permite un núme- to (en rigor, la cadena de caracte-
ro limitado de canales de televisión Los medios clásicos disponen res) de cada pregunta concreta con
de emisoras de radio para cada zona (para bien y para mal) de diversas las entradas del índice del motor de
geográfica. formas para, una vez aceptado un búsqueda.

El profesional de la información, v.17, n. 2, marzo-abril 2008 195


Ernest Abadal y Lluís Codina

Existe en Google, eso sí, un ciales han llegado a las más altas que, sin embargo, parecen ser des-
indicador, denominado PageRank cúspides (por ejemplo, Wikipedia). mentidas por algunas ejemplifica-
que es estático, es decir, es propio ciones prácticas. Recientemente se
Vistos los elementos anteriores,
de la página independientemente de han invocado tres casos concretos
para que los buscadores pudieran
la pregunta. Aunque a este respec- para defender la teoría según la cual
representar una amenaza a la diver-
to deben considerarse a su vez dos los motores de búsqueda (y Google
sidad cultural en el mismo sentido
cosas: no es otorgado por un editor en especial) realizan algún tipo de
que en otras ocasiones lo han sido
(como en la prensa escrita) sino por manipulación de los resultados que
determinados medios de comuni-
el conjunto de los creadores de pá- podría representar un sesgo en per-
cación social, sería necesario negar
ginas web mediante sus decisiones juicio de culturas no anglosajonas.
sus tres características básicas y que
individuales cada vez que deciden Estos son: la censura de contenidos
ya hemos discutido, a saber:
a qué página enlazan (y a cuál no) en China, la priorización de resulta-
desde las suyas propias. En segun- –  Deberían discriminar conte- dos en función del idioma y el pro-
do lugar, el PageRank final de cada nidos en función de su origen geo- yecto Google Books.
página se computa de forma auto- gráfico o de alguna característica
mática para todas las páginas del cultural de su contenido, pero he- Sobre el primer caso, se sabe
índice de Google, como no podría mos visto que no es así. que Google alteró el funcionamien-
ser de otro modo cuando estamos to del algoritmo en su versión china
–  El canal digital, internet en para excluir los resultados que ha-
hablando de una base de datos de este caso, debería tener algún tipo
25 mil millones de páginas, cada cen referencia a asuntos “sensibles”
de saturación según el cual si exis- del gobierno chino (Tiananmen, Fa-
una con su PageRank propio. ten ya muchos contenidos de una lung Gong, etc.). Podemos señalar
En cambio, tanto Introna como cultura dominante, digamos la an- dos cosas sobre este tema: en pri-
Hargittai coinciden de nuevo en glosajona, estos materiales tapona- mer lugar, esto supone una altera-
dudar de que los intereses comer- rían el acceso a contenidos de otras ción consciente y reconocida (y por
ciales no prevalezcan de una forma culturas, pero de nuevo simplemen- supuesto, del todo lamentable) del
u otra en las listas que elaboran los te no sucede así. funcionamiento del algoritmo que
buscadores. Introna y Nissenbaum –  Por último, la priorización de no se ha detectado en ningún otro
se refieren a la ausencia en la Web los contenidos (es decir, el hecho caso. En segundo lugar, se aplica
de determinados contenidos porque de ocupar o no un lugar privilegia- igualmente de forma automática,
no tienen interés para el mercado. do en la lista de resultados) debería es decir, el sistema simplemente no
No obstante, no pueden ofrecer realizarse en función del origen del entrega resultados para determina-
pruebas concretas de que exista documento, de las características de das palabras clave que el gobierno
sesgo por parte de los motores de su autor o de la fuente, de la lengua chino ha censurado. No estamos
búsqueda5. Por su parte, Hargittai del mismo, de su pertenencia a un ante una priorización de resultados
también utiliza argumentos simi- tipo de cultura u otra, etc., cosas de de un origen cultural sobre otro,
lares (Hargittai, 2000, p. 23): “el las que, no solamente ningún ana- sino que aquí la censura actúa de
contenido producido por entidades lista ha detectado hasta ahora el más forma lamentablemente igualitaria.
con presupuestos suficientemente mínimo indicio, sino que contrade- Además, aunque sea un triste con-
grandes puede optar a una situación cirían el propio modelo de negocio suelo, cabe señalar que un ciudada-
prominente en portales muy visita- de estas herramientas, basado en no chino que utilice la versión de
dos. Esto privilegia tal contenido su capacidad de localización. Una Google en otra lengua, por ejemplo
sobre el de creadores más pequeños priorización como la que estamos en inglés, no se verá afectado por
y menos dotados financieramente”. discutiendo privaría a los motores esa censura (excepto que el aparato
de búsqueda estadounidenses de de Estado chino disponga de otras
De hecho, se llega a sugerir la formas de controlar contenidos de
la mayor parte de sus usuarios no
creación de portales igualitarios, la Web, por ejemplo, a través de los
anglosajones, y en cuanto a los de
alternativos (se pone a Dmoz por proveedores de acceso).
naturaleza local, serían una formi-
ejemplo), que no estén sujetos a
dable competencia para Google, lo
presiones comerciales. Los cambios El segundo caso consiste en
que (tal vez por desgracia) no suce-
que se han producido en el ecosiste- la denuncia de que las posibles
de en absoluto.
ma web desde entonces (en especial búsquedas de contenidos sobre
la web 2.0) creemos que han des- Goethe, Baudelaire, o Cervantes
La zona de sombras
mentido estas teorías, ya que se ha en Google sitúan en primer lugar
podido comprobar cómo proyectos Hasta ahora nos hemos referi- los recursos que están escritos en
colaborativos y sin intereses comer- do a cuestiones de carácter teórico inglés sin tener en cuenta que, en

196 El profesional de la información, v.17, n. 2, marzo-abril 2008


La diversidad cultural en Google y los motores de búsqueda: una aproximación conceptual

la mayoría de los casos, las mejo- está formando fundamentalmente Conclusiones


res páginas web para estos términos a partir de acuerdos con editores y
Hasta ahora hemos examinado
se encuentran en el idioma de los bibliotecas norteamericanos, aun-
desde un punto de vista conceptual
autores utilizados como ejemplo, es que no faltan convenios europeos6,
la credibilidad de la acusación de
decir, en alemán, francés o español, como se puede comprobar si se ha-
que el predominio de los buscado-
respectivamente. En esta cuestión se cen búsquedas usando lenguas dis-
res estadounidenses en general y de
tiene que tener en cuenta que existe tintas del inglés.
Google en particular es una amenaza
una priorización de los resultados
plausible para la diversidad cultural.
en función del idioma de la versión
Desde esta perspectiva, esta amena-
local de Google que se utiliza. Esto “Se entiende que cuando za es difícil de fundamentar porque
afecta a las distintas versiones, ya un usuario accede desde no hay nada en el funcionamiento
sea la alemana (.de), francesa (.fr),
una versión nacional de los motores de búsqueda que la
española (.es) o inglesa (.com).
quiere disponer de la justifique ni hasta la fecha nadie ha
Quiere decirse que se dará prio- interfaz en su idioma y podido presentar evidencias en este
ridad a la versión local en cada caso: de una cierta preferencia sentido. Como estudiosos del fenó-
si usamos Google en la versión fran- en los resultados que se meno nuestra obligación consiste
cesa, priorizará resultados en fran- en descartar teorías no fundadas y
encuentran en su idioma”
cés, si usamos la versión española sobre todo, en no aceptar conjeturas
lo hará con aquellos en español. La conspirativas, cuyo fundamento va
explicación es clara: se entiende directamente contra la filosofía de
que cuando un usuario accede des- Lo cierto es que, en este caso, no la ciencia.
de una versión nacional quiere dis- estamos ante un rastreador que in-
En relación con la comparación
poner de la interfaz en su idioma y, cluye contenidos de forma automá-
con el mundo de la comunicación
además, de una cierta preferencia en tica, sino que existe una selección
social y de los medios analógicos,
los resultados que se encuentran en ya que el número de objetos (libros
cabe señalar que en el mundo di-
su idioma. En el caso de la versión impresos) a digitalizar e introducir
gital los motores de búsqueda no
internacional, que está en inglés, se en la colección no es ilimitado, sino
actúan como los medios de comu-
presupone que el idioma del usua- que está condicionado, entre otros
nicación tradicionales (televisión,
rio que utiliza esta versión también factores, por los costes del proceso
prensa, cine, etc.). En primer lugar,
es el inglés. No obstante, lo anterior de digitalización. No sabemos si en
en el medio digital no existe una
solamente sucede con términos si- el futuro este desequilibrio se man-
limitación previa sobre la cantidad
milares en más de una lengua. Por tendrá, pero en estos momentos es
de contenidos que pueden ser pu-
ejemplo, comprobaremos cambios patente.
blicados; por otra parte, los moto-
en los resultados de diversas ver- En este sentido, es sabido que res de búsqueda no son creadores
siones locales si buscamos con la la Comisión Europea, con apoyo de contenidos, sino que se limitan
palabra clave “tv” que es igual para de los gobiernos de los diferentes a proporcionar acceso a los creados
varias lenguas. En cambio, si la países, planteó en marzo de 2005 por terceros. Si una lengua o zona
palabra clave se corresponde neta- el proyecto de Biblioteca digital geográfica es pobre en la creación
mente con una lengua, por ejemplo, europea (European digital library– de materiales, eso es exactamen-
“Juegos Olímpicos” vs. “Olympic EDL)7 que tiene por objetivo la pre- te lo que reflejarán las búsquedas
Games”, los resultados serán idén- servación y difusión del patrimonio comparadas. Una consulta formu-
ticos o muy similares en cualquiera documental europeo. De esta forma lada en una lengua con una amplia
de las versiones locales. se quiere asegurar una presencia re- base demográfica ofrecerá más re-
levante de los contenidos culturales sultados que otra en una lengua con
Google Books es el tercer caso
del viejo continente, lo cual parece una baja demografía, simplemente
que queremos comentar. Esta ini-
una actuación muy acertada. Más porque hay muchas más personas
ciativa trata directamente con con-
recientemente (abril 2007), la Bi- creando contenidos en el primer
tenidos (no con metadatos o índices
blioteca Nacional de Francia puso caso.
inversos) y es por ello que puede
en funcionamiento el portal Euro-
conllevar un desequilibrio cultural a Entendemos que es respon-
peana, una versión experimental
favor de las obras en lengua inglesa, sabilidad de los actores y agen-
para facilitar la consulta y navega-
ya que en este caso existe una labor tes culturales de cada lengua y de
ción por los fondos bibliográficos
de selección previa por parte de Go- cada nación promover la riqueza
de la Biblioteca digital europea.
ogle de las bibliotecas y editoriales. y la productividad culturales, pero
Hasta el momento, la colección se http://www.europeana.eu esa producción cultural solamente

El profesional de la información, v.17, n. 2, marzo-abril 2008 197


Ernest Abadal y Lluís Codina

aflorará, naturalmente, en los bus- mercio) era un organismo intergubernamental Calishain, Tara; Dornfest, Rael. Google: los
que pretendía, desde su fundación en 1948, fa- mejores trucos. Madrid: Anaya, 2004.
cadores cuando se usen palabras en vorecer el libre comercio entre los países redu-
esa lengua para realizar búsquedas. ciendo las trabas arancelarias. La última ronda de Chowdhury, G. Gobinda. Introduction to mod-
negociaciones, Ronda de Uruguay, acabó en di- ern information retrieval. 2nd ed. London: Facet,
Esto es algo tan básico que al pare- 2004.
ciembre de 1993 después de más de ocho años de
cer nos pasa desapercibido. Precisa- conversaciones. El GATT, como tal, se disolvió y Hargittai, Eszter. “Open portals or closed gates:
mente, los motores de búsqueda son dio paso a la Organización Mundial del Comer- channeling content on the world wide web”. En:
cio (OMC), que tiene por objetivo favorecer el Poetics, 2000, v. 27, n. 4, pp. 233-254.
la única forma de privilegiar conte- comercio mundial.
nidos de culturas minoritarias. Hock, Randolph. The extreme searcher’s guide
4. La Wikipedia estima en unos 25 mil millones to web search engines: a handbook for the seri-
el número de páginas a las que da acceso el ín- ous searcher. Medford: CiberAge Books, 1999.
dice de Google.
Introna, Lucas D.; Nissenbaum, Helen. “De-
“Si una lengua o zona http://en.wikipedia.org/wiki/Google_search fining the web: the politics of search engines”.
En: Computer, 2000a, pp. 54-62.
geográfica es pobre en la 5. En un determinado pasaje lo reconocen abier-
tamente: “Although we don’t have empirical evi- Introna, Lucas D.; Nissenbaum, Helen. “Shap-
creación de materiales, dence (...)”. En: Introna, 2000a, p. 59. ing the web: why the politics of search engines
eso es exactamente lo que 6. En el caso de las bibliotecas hay que desta- matters”. En: The information society, 2000b,
jul-sep, v. 16, n. 3, pp. 169-185.
reflejarán las búsquedas” car los recientes acuerdos con la Universidad
Complutense (2006) y la Biblioteca de Catalunya MacBride, Sean. Un solo mundo, voces múl-
(2007) para digitalizar sus fondos de reserva. tiples: comunicación e información en nuestro
7. Se puede consultar una explicación resumida tiempo: hacia un nuevo orden mundial más justo
de su alcance en la web. y eficaz de la información y la comunicación.
Así pues, la cuestión que se México: Fondo de Cultura Económica; París:
ha puesto a debate con motivo del http://libraries.theeuropeanlibrary.org/press/ Unesco, 1980.
edl-faq20060302.html
predominio del mercado por parte Mattelart, Armand. “Excepción o especifici-
8. Algo parecido se llevó a cabo en el caso de la dad cultural: los desafíos del GATT”. En: Telos,
de motores de búsqueda de origen industria aeronáutica, con la creación y el apo- 1995, n. 42, pp. 15-27.
norteamericano en general y de yo de distintos gobiernos europeos a la empresa http://www.campusred.net/telos/anteriores/num_
Google en particular es totalmente EADS (productora de los famosos Airbus). 042/opi_perspectivas5.html
diferente de las otras dos polémicas Mattelart, Armand. Diversité culturelle et
(nomic y excepción cultural) antes Bibliografía mondialisation. Paris: la Découverte, 2005.

planteadas. La intervención estatal Abadal, Ernest; Codina, Lluís. “¿Es Google Qiu, Feng; Cho, Junghoo. “Automatic identifi-
una amenaza para la diversidad cultural?”. En: cation of user interest for personalized search”.
para estimular una industria euro- En: Proceedings of the 15th International confer-
Anuario ThinkEPI 2007. Barcelona: El profesio-
pea propia en el campo de los mo- nal de la información, 2006, pp. 94-96. ence on world wide web, 2006. New York: ACM
tores de búsqueda está más que jus- Ackermann, Ernest; Hartman, Karen. The
Press, 2006, pp. 727-736
tificada8, pero debería buscar otros information specialist’s guide to searching and Ramonet, Ignacio. Internet, el mundo que llega.
Madrid: Alianza, 1998.
argumentos, como la necesidad de researching on the internet and the world wide
web. Wilsonville: ABF Content, 1998.
incrementar la competitividad de Thelwall, Mike. Link analysis: an information
Altman, Alon; Tennenholtz, Moshe. “Ranking science approach. Amsterdam: Elsevier, 2004.
las naciones dentro de las prácticas systems: the PageRank axioms”. En: Proceed-
internacionalmente aceptadas y sin Vaughan, Liwen; Thelwall, Mike. “Search en-
ings of the 6th ACM Conference on electronic
gine coverage bias: evidence and possible caus-
provocar un proteccionismo innece- commerce, 2005. New York: ACM Press, 2005,
es”. En: Information processing and manage-
pp. 1-8.
sario ni alentar, aunque sea involun- ment, 2004, n. 40, 2004, pp. 693-707.
tariamente, teorías conspirativas, ya Basch, Reba; Bates, Mary-Ellen. Researching
Vaughan, Liwen; Zhang, Yanjun. “Equal rep-
online for dummies. Foster: IDG, 2000.
que sería una vía garantizada hacia resentation by search engines? A comparison
Belew, Richard K. Finding out about: a cog- of websites across countries and domains”. En:
el fracaso. Las políticas culturales nitive perspective on search engine technology Journal of computer-mediated communication,
de futuro tienen que sostenerse en and the www. Cambridge: Cambridge University 2007, v. 12, n. 3, article 7.
ideas y datos contrastados. Press, 2000. http://jcmc.indiana.edu/vol12/issue3/vaughan.
html
Berry, Michael W.; Browne, Murray. Under-
standing search engines: mathematical modeling Williams, Joseph, et al. Bots and other internet
Notas beasties. Indianapolis: Sams.net, 1996.
and text retrieval. Philadelphia: SIAM, 1999.
1. El denominado proyecto Quaero (“preguntar”,
en latín), anunciado por los gobiernos francés y Bianchini, Monica; Gori, Marco; Scarselli,
alemán en 2005 y del que no se ha sabido nada Franco. “Inside PageRank”. En: ACM Transac- Ernest Abadal, Universitat de Bar-
más en concreto, a excepción del anuncio públi- tions on internet technology, 2005, February, v.
5, n. 1, pp. 92-128. celona.
co de la retirada del gobierno alemán a finales
de 2006. Brin, Sergey; Page, Lawrence. “The anatomy
abadal@ub.edu
2. En 1997 volvió a ingresar Gran Bretaña y en of a large-scale hypertextual web search engine”.
2004, los EUA. En: WWW7/Computer networks, 1998, v. 30, n. Lluís Codina, Universitat Pompeu
1-7, pp. 107-117.
3. El GATT (General Agreement on Tarifs and http://www-db.stanford.edu/~backrub/google. Fabra.
Trade, Acuerdo General sobre Aranceles y Co- html lluis.codina@upf.edu

198 El profesional de la información, v.17, n. 2, marzo-abril 2008

Vous aimerez peut-être aussi