Académique Documents
Professionnel Documents
Culture Documents
Se
conoce
como Internet
profunda o Internet
invisible (en ingls:Deepweb, Invisible
Web, Deep Web, Dark Web o Hidden Web)
a todo el contenido de Internet que no forma
parte del Internet superficial, es decir, de las
pginas indexadas por las redes de
los motores de bsqueda de la red. Esto se
debe a las limitaciones que tienen las redes
para acceder a todos los sitios web por
distintos motivos.
Ilustracin de la Internet profunda
Causas
La principal causa de la existencia de la Internet profunda es la imposibilidad
de los motores de bsqueda de encontrar o indexar gran parte de la
informacin existente en Internet. Se estima que la Internet Profunda es 500
veces mayor que la Internet Superficial, siendo el 95% de esta informacin
pblicamente accesible. Si los buscadores tuvieran la capacidad para acceder
a toda la informacin entonces la magnitud de la "Internet profunda" se
reducira casi en su totalidad; sin embargo, no desaparecera totalmente
porque siempre existirn pginas privadas.
Los siguientes son algunos de los motivos por los que los buscadores son
Tamao
La Internet profunda (Deep Web) es un conjunto de sitios web y bases de datos
que buscadores comunes no pueden encontrar ya que no estn indexadas. El
contenido que puede ser hallado dentro de la Internet profunda es muy
amplio.5Se estima que la Internet Profunda es 500 veces mayor6 que la Internet
Superficial, siendo el 95% de esta informacin pblicamente accesible.
Denominacin
Son pginas de texto, archivos, o en ocasiones informacin a la cual se puede
acceder por medio de la World Wide Webque los buscadores de uso general
no pueden, debido a limitaciones o deliberadamente, agregar a sus indices de
pginas webs. La Web profunda se refiere a la coleccin de sitios o bases de
datos que un buscador comn, como Google, no puede o quiere indexar. Es un
lugar especifico del Internet que se distingue por el anonimato. Nada que se
haga en esta zona puede ser asociado con la identidad de uno, a menos que
uno lo dese.
Bergman, en un artculo semanal sobre la Web profunda publicado en el
Journal of Electronic Publishing, mencion que Jill Ellsworth utiliz el trmino
"la Web invisible" en 1994 para referirse a los sitios web que no estn
registrados por algn motor de bsqueda.
Bergman cit un artculo de 1996 de Frank Garca:
Contenido de Acceso limitado: los sitios que limitan el acceso a sus pginas
de una manera tcnica (Por ejemplo, utilizando el estndar de exclusin de
robots o captcha, que prohben los motores de bsqueda de la navegacin
por y la creacin de copias en cach22 .
Contenido Dinmico: Las pginas dinmicas que devuelven respuesta a
una pregunta presentada o acceder a travs de un formulario,
especialmente si se utilizan elementos de entrada en el dominio abierto
como campos de texto.
Contenido No Vinculado: paginas que no estn conectadas con otras
pginas, que pueden impedir que los programas de rastreo web tengan
acceso al contenido. Este material se conoce como pginas sin enlaces
entrantes.
Contenido Programado: pginas que slo son accesibles a travs de
enlaces producidos por JavaScript, as como el contenido descargado de
forma dinmica a partir de los servidores web a travs de soluciones de
Flash o Ajax.
Sin contenido HTML: contenido textual codificado en multimedia (imagen o
video) archivos o formatos de archivo especficos no tratados por los
motores de bsqueda.
Web privada: los sitios que requieren de registro y de una contrasea para
iniciar sesin
Web contextual: pginas con contenidos diferentes para diferentes
contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes
o secuencia de navegacin anterior).
http://es.wikipedia.org/wiki/Internet_profunda