Les annuaires sont des guides par sujet des ressources d'Internet.
Ils consistent en des classements arborescents où l'accès au thème souhaité s'effectue en parcourant une série de rubriques et de sous-rubriques de plus en plus pointues.
Ils incorporent également, d'ordinaire, un moteur de recherche par mot clé qui permet d'arriver directement à la bonne rubrique, Moteur pour Annuaire .
Ces listes thématiques de sites constituent en quelque sorte l'équivalent cybernétique (et moins élaboré) du plan de classification que l'on applique traditionnellement dans les bibliothèques et centres de documentation.
Elles présentent également des similitudes avec les bibliographies thématiques, info-guides et autres listes imprimées de ressources que les bibliothécaires mettent à la disposition de leur clientèle, et avec ces pages Web personnelles qui proposent en compilation les « meilleures » ressources d'Internet ou, tout simplement, les sites préférés de leur auteur Ici des pages sur l'informatique .
Quelques Annuaires (qualité décroissante) :
La plus part des annuaires sont fait de façon manuelle Yahoo en est le meilleur exemple. Cela a deux désavantages premièrement le coût de construction, d'ailleur progressivement les grands annuaire du web deviennent payant (a l'exception de dmoz qui est collaboratif) c'est à dire qu'il faut payer pour que site soit présent dans l'annuaire. Deuxièmement c'est un métier et de nombreux biais peuvent apparaitre en particulier une problèmatique de compétance quand les sujets deviennent trop pointus. Le point de vue marketing peut aussi l'emporter par rapport au point de vue scientifique dans l'organisation de l'information et des rubriques (les sites les plus rentables sont privilégiés par rapport à des site gratuits).
Une autre approche de la construction est la construction automatique, on les techniques de classement automatique la classification.
Cette approche automatique doit nous fournir un classement a
partir du contenu des documents. En effet un annuaire est organisé par groupes
de documents (ou d'entreprise pour les pages jaunes) qui parle du même sujet.
Pour réaliser un système manuel il faut utiliser un système de classement initial voire Recherche sur dmoz.org pour plus d'information sur le système Dewey. Ce système de classement doit permettre de classer toute la connaissance humaine se qui pose imédiatement des problèmes important. En effet imédiatement nous trouvons des sujets d'intérêt qui sont au carrefour de plusieurs science. Il est dopnc nécessaire de classer de façon multiple chaque document. D'autre part il faut définir des code de classement pour chaque élement de connaissance, cela impose un apprentissage de ces codes qui complique a la fois la construction et la recherche dans la base d'information, d'autre part les documents sont les seul éléments de sens qui sont stocker et parfois il est nécessaire de fournir des élèments didactiques pour rendre les documents utilisables. Ces problèmes font que pour les scientifiques le systeme dmoz est le plus utilisable. Un des gros avantages des annuaires bien qu'il y ai le problème marketing soit le fait que les documents sont noté par la personne réalisant le classement. Ainsi les documents classé pour un sujet donnée sont organisé par d'autre critère que le sujet abordé. La pertinence dans le sujet, le fait que cela peut ouvrir sur d'autre thèmes. La qualité, la lisibilité, l'acécibilité du document peuvent être ainsi évalué et ces informations proposé au chercheur.