Le problème des annuaires est de classer les documents dans des hiérachies conceptuelles.
Pour cela des opérateurs humains sont utilisé et ils lisent les document et les classent, l'organisation hérarchique des opérateurs permet de d'assuer un bon degrée d'expertise
Mais le travail est énorme est n'est pas toujours possible. Avez vous le temps d'organizer les documents stocker dans votre ordinateur ou dans l'ensemble de l'entreprise ?
La lettre que vous devez écire n'est elle pas déja écrite? comment la retrouver c'est un problème de GED .
Il est donc necessaire de trouver des systèmes de classement automatique
Deux approches: une hierachie pré définie qui sera utiliser par les utilisateurs pour trouver les documents, il ne reste plus qu'a placer les document dans les boites, pour cela on définie (on parle d'ontologie) pour chaque éléments de la hiérarchie les termes qui font associés a cet éléments
Une autre approche plus automatique se propose de classer de la même façon les documents et les requêtes.
>p>Cette approche a l'avantage d'être entièrement automatique, mais a le défaut de construire une hiérarchie de documentqui n'a pas de structure utilisable directement pour un utilisateur. Les plan de classement des entreprises sont en général difficilement consiliables avec ce type d'outilsLa solution utilisé par les pagesjaunes est de concilier ces deux approches, d'une part une hiérarchie prédéfinie, et un outil de classification automatique
Pour réaliser ce double avantage a été mis au point un réseaux sémantique qui est consitué de mots relies entre eux par des liens de type généralisation, synonymie, spécialisation
Les différentes catégories sont identifiés dans ce graphe avec des liens d'inclusion entre catégories, les mots ayant des liens d'appartenance vers les catégories.
Cette importante structure permet de classer les reqsuêtes dans la hiérarchie, les document eux meême étant classé par des opérateurs