Recherche d'Information : Traitement des résultats

Recherche d'Information : Le Traitement des résultats

Regrouper par sites
L'idée est ne montrer qu'une page par site.
Regrouper par clustering & classification
Ici le moteur vas utiliser l'ensemble des resultats optenus par la requète et faire un traitement de clustering dessus. Une autre approche que le clustering est la recherche de mots clefs dans les documents Exalead est un bon exemple de se qui est possible. Exalead recherche des termes et suites de termes qui ont une fréquence au dessus de la normal dans les documents trouvé par la requète initiale. Ces termes sont proposés en meme temps que les resultats de la requète, ces termes sont utile car ils permettent deux choses, ils informent sur le contenu des documents que la requète a trouvée et permettent de faire de nouvelles recherche avec des termes qui peuvent etres mieux ciblé que la requète initial.
Classer par ordre de qualité les documents
Ceci implique que les différentes pages ai une note qui permette de classer les résultats c'est en général fait dans les annuaires.
Classer en fonction des "match"
l'idée ici est de partir d'une requète complexe qui est découpé en sous requète. Différentes possibilité de traitement de ce découpage.
- Les différentes sous expression ont un poid qui dépend des termes qui la compose
  Linguisitique: Les noms ont plus de poids que les verbes.
  Sémentique : Les mots composé et certains termes important (sur un critère de dictionnaire)
  Statistique : les mots les moins fréquents ont plus de poids.
- L'expression complète n'a pas été trouvée et le moteur n'a trouver que des versions incomplètes de la requète
  Dans ce cas les documents sont triés dans l'ordre décroissant du nombre de mots éffectivement présents.
- Eventuellement les deux techniques sont utilisées conjointement : d'une part une expression dégradé et un calcul de poids qui dépends de termes effectivement présents.

Dominique Revuz email

Dernière publication :01/12/2003 09:41:32