martes, 16 de agosto de 2016

CARACTERIZACIÓN DE LA WEB SUPERFICIAL Y DE LA WEB PROFUNDA


A la hora de buscar información no sólo disponemos de los buscadores tradicionales, sino que también tenemos otras fuentes específicas de información.

Cuando buscamos generalmente lo hacemos de manera superficial a través de los ya conocidos buscadores, pero... ¿qué hay del resto, de la web invisible? 

A continuación veremos definición y principales características.

WEB SUPERFICIAL
La Web superficial es aquella porción de Internet que es indexada por las arañas de los motores de búsqueda. 
  • Información no contenida en base de datos.
  • Libre acceso.
  • No necesita proceso registro.
  • Formada por páginas estáticas. Su URL es fija y accesible.
  • Web indizable.

WEB PROFUNDA
La Web profunda es aquella que no está indexada por los motores de búsqueda o directorios, es decir son repositorios de información, generalmente bases de datos dinámicas, cuyo contenido no puede ser revisado por los buscadores y por lo tanto incluido en sus resultados de búsqueda.
  • Información accesible en base de datos.
  • Parte de la información es "invisible" a los robots de los buscadores convencionales.
  • Formada por páginas dinámicas. Su URL no es fija.
  • Contenido no enlazados, es decir, con páginas que no tienen vínculos entrantes desde otras páginas.
  • Web no indizable.
A continuación comparto el siguiente video:


Sherman y Price dividen la Deep Web en cuatro tipo de invisibilidades la Web opaca, la Web privada, la Web propietaria y la Web realmente invisible.

  • WEB OPACA: las limitan la extensión y frecuencia de indización, número máximo de resultados visibles y URL desconectadas.
  • WEB PRIVADA: son páginas protegidas con contraseñas, presentan el archivo "robots.txt" y contienen un campo "noindex"
  • WEB PROPIETARIA: son aquellas páginas en la que es necesario registrarse.
  • WEB REALMENTE INVISIBLE: son aquellas que no pueden ser indizadas por limitaciones técnicas de los buscadores, se generan dinámicamente.


Algunos recursos de búsqueda de la Web profunda son:

  • The WWW Virtual Library se considera el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web.
  • TechXtra centra su información, en ingeniería, matemáticas e informática
  • Microsoft Academic Search el buscador académico de Microsoft.
  • Academia.edu s una red social 2.0 para investigadores que cuenta con un directorio de más de 12.000 publicaciones científicas de todo el mundo.
  • Infoplease es un portal de información con una serie de características. Usando el sitio, puedes dar con un buen número de enciclopedias, almanaques, un atlas y biografías. Infoplease demás posee ramificaciones algo agradables como Factmonster.com para niños y Biosearch, un motor de búsqueda para biografías.
  • Infomine es un buscador de bases de datos, diarios y libros electrónicos, boletines de anuncios, listas de correos, artículos, catálogos de librerías online, directorios de investigaciones y muchos otros recursos.
  • DeepPeep tiene como objetivo entrar a la deep Web a través de formas que consultan bases de datos y servicios web para información. Consultas que se abren en resultados dinámicos pero de corta duración que no pueden ser indexados por un motor de búsqueda normal. 

Para finalizar comparto:





1 comentario:

  1. Hola Claudia,

    Muy buen trabajo en el blog, todos los artículos posteados tienen una gran calidad tanto de redacción, como de contenido y presentación. Enhorabuena!!!

    Por otra parte decirte que he estado buscándote para agradecerte el comentario y valoración de mi actividad.

    He seguido tu consejo y he cambiado el fondo por uno que permite ver mejor el texto y además es muy chulo, palabra de friki!!
    Te dejo el enlace del blog en el foro para que puedas echarle un vistazo y decirme que opinas con el cambio.
    Gracias compañera.
    Un abrazo desde España

    ResponderEliminar