miércoles, 21 de octubre de 2015

WEB SUPERFICIAL Y WEB PROFUNDA



Podemos diferenciar:
- Web superficial o visible, porción de Internet que es indexada por los buscadores.
- Web profunda o invisible, parte de Internet que no forma parte de la Internet superficial. 
- Web oscura, hosts de la red inaccesibles, a los que no se puede acceder a través de medios convencionales.

Qué son la web superficial, web profunda y web oscura
Son conceptos sobre internet, que hacen referencia básicamente a la accesibilidad a los contenidos web, que se materializa en la posibilidad de acceso a los mismos por parte de los motores de búsqueda.

Web superficial o visible
Es la porción de Internet indexada en los motores de búsqueda. Cualquier enlace que encuentren es seguido e indexado a su vez, por lo que eventualmente todas las páginas web enlazadas mediante hipervínculos serán en un momento u otro indexadas.

Las características principales de los sitios de la Web visible son:
  • Su información no está contenida en bases de datos
  • Es de libre acceso
  • No se requiere la realización de un proceso de registro para acceder a la información.
  • Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace
Por diferentes motivos, como enlaces generados por JavaScript y Flash, sitios protegidos con clave o ficheros excluidos mediante robots.txt, una gran parte del contenido de la web no puede ser capturada por los buscadores, lo que impide a los buscadores indexarlas.

Según Lluis Codina: “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.
Esas páginas forman la denominada web profunda o invisible.

Web profunda o invisible
La Internet profunda o invisible (deep web, invisible web, hidden web) es la porción de Internet cuyos contenidos no pueden ser indexados por los motores de búsqueda, y se estima que representa en torno al 95% de los contenidos web, de tal manera que la Internet profunda es varios órdenes de magnitud más grande que la Internet superficial.
La Web profunda está compuesta por cuatro tipos de contenidos invisibles, se denominan web opaca, web privada, web propietaria y la web realmente invisible (web oscura). A estos sitios web no pueden acceder los motores de búsqueda, por diversos motivos como:
  • Contenido privado protegido con contraseña.
  • Documentos en formatos no indexables.
  • Enlaces generados mediante JavaScript o Flash.
  • Contenidos que usan protocolos diferentes a HTTP o HTTPS.
  • Contenidos no enlazado o dinámico generado como respuesta a un formulario.
  • Restricciones de acceso a documentos mediante robots.txt o captchas.
  • Información en bases de datos.
Web oscura o realemtne invisible
Es una parte de la web profunda formada por hosts inaccesibles, a los que no se puede acceder a través de medios convencionales, y generalmente se utiliza en entornos en los que es esencial proteger la identidad de los usuarios y el contenido de las comunicaciones.
La web oscura se caracteriza por el tipo de contenidos que la integran, usualmente relacionados con:
  • Actividades delictivas, terroristas, pederastas o violación de derechos de autor.
  • Información secreta relativa a actividades gubernamentales, militares o de espionaje.
  • Comunicación de información confidencial de índole comercial.
  • Censura en la difusión y acceso a ciertos tipos de contenido. 
Algunos ejemplos de recursos de la Web Profunda:

- The WWW Virtual Library, es el catálogo más antiguo de la web.
- Infoplease, Web de consulta con más de 57.000 artículos de la enciclopedia Columbia
- DeepWebTech, motores de búsqueda que abarcan ciencia, medicina y negocios.
- TechXtra, información basada en ingeniería, matemáticas e informática.

No hay comentarios:

Publicar un comentario