Connexion
7 566 Livres Blancs | | |

Extraction automatisée d’actualités on line pour la veille stratégique

  • EditeurDigimind
  • Version Pdf - 14 pages - Février 2004 - Français

Obtenir le livre blanc

 

Introduction ou extrait du livre blanc

"Au cours des trois dernières années, Internet est devenu une source incontournable pour la publication de communiqués de presse. La plupart des organisations, qu’il s’agisse d’entreprises privées ou d’organismes publiques, utilisent leur site Internet pour diffuser des informations officielles les concernant.

Ce type d’information n’est bien sûr pas la seule source à prendre en compte dans le cadre d’un dispositif de veille stratégique. Les informations ne sont pas toujours très objectives, puisque c’est l’organisme en question qui décide ou non de les publier. Malgré cela, leur valeur est grande pour la veille stratégique, car cette information est considérée comme primaire : elle est prise directement à sa source.

Un certain nombre de technologies aujourd’hui disponibles sur le marché proposent la surveillance d’actualités on line. Elles présentent pour la plupart un inconvénient majeur : l’obligation de développer des fichiers de configuration pour chaque site surveillé. Ce livre blanc décrit l’algorithme iScrap, basé sur les théories de topologie et les espaces vectoriels normés, qui permet d’automatiser complètement l’extraction des actualités, avec un taux de réussite de plus de 90%.

Afin de rendre plus parlante cette présentation, elle est illustrée par des cas d’application à l’industrie pharmaceutique. Bien entendu, l’algorithme iScrap s’applique à toute autre industrie ou domaine d’activité."