Connexion
7 474 Livres Blancs | | |

Deep Web : faire ressortir la valeur cachée

  • EditeurBrightPlanet
  • Version PDF - 17 pages - 2001 - Anglais

Obtenir le livre blanc

 

Introduction ou extrait du livre blanc

"Aujourd'hui, on peut comparer la recherche sur Internet à la traîne d'un filet sur la surface de l'océan. Bien que beaucoup puissent être pris dans le filet, il reste encore une mine d’informations profondes, et donc manquantes.

La raison en est simple: la plupart des informations du Web sont enfouies très loin sur des sites générés de manière dynamique, et les moteurs de recherche standard ne les trouvent jamais. Les moteurs de recherche traditionnels créent leurs index en parcourant des pages Web en surface.

Pour être découverte, la page doit être statique et liée à d'autres pages. Les moteurs de recherche traditionnels ne peuvent pas "voir" ou récupérer le contenu dans le Web profond. Ces pages n'existent pas tant qu'elles ne sont pas créées de manière dynamique à la suite d'une recherche spécifique. Étant donné que les robots des moteurs de recherche traditionnels ne peuvent pas sonder sous la surface, le Web profond était jusqu'alors masqué."

Texte d'origine :

"Searching on the Internet today can be compared to dragging a net across the surface of the ocean. While a great deal may be caught in the net, there is still a wealth of information that is deep, and therefore, missed.

The reason is simple: Most of the Web's information is buried far down on dynamically generated sites, and standard search engines never find it. Traditional search engines create their indices by spidering or crawling surface Web pages.

To be discovered, the page must be static and linked to other pages. Traditional search engines can not "see" or retrieve content in the deep Web — those pages do not exist until they are created dynamically as the result of a specific search. Because traditional search engine crawlers can not probe beneath the surface, the deep Web has heretofore been hidden."


 

Deep Web : faire ressortir la valeur cachée