On distingue les opérateurs suivants :
les opérateurs booléens
l'opérateur ET
Il
permet de rendre la présence d'un mot obligatoire. Il est
également symbolisé par son équivalent anglais
AND ou par le signe +. Exemple : commerce ET électronique
repérera toutes les entrées où ces deux mots
figurent.
l'opérateur OU
Il
permet de rendre la présence d'un mot optionnelle. Il est
également symbolisé par son équivalent anglais
OR ou par l'espace lorsqu'il est pris par défaut.
Exemple
: commerce OU électronique repérera toutes les
entrées qui comprennent au minimum un de ces deux mots.
l'opérateur SAUF
Il
permet d'exclure la présence d'un mot. Il est également
symbolisé par ses équivalents anglais NOT, BUT NOT ou
AND NOT, ou encore par le signe - .
Exemple : commerce SAUF
électronique repérera toutes les entrées où
figure le mot commerce mais sans qu'y apparaisse le terme
électronique.
les parenthèses ( )
Elles
permettent de limiter la portée des opérateurs
booléens et/ou d'introduire un ordre de priorité
entre les différentes parties d'une requête.
Exemple
: (commerce OU paiement) ET électronique repérera les
entrées qui contiennent à la fois électronique
et soit commerce soit paiement soit ces deux termes.
la troncature
Elle consiste à
recourir à l'emploi de masques (jokers ou wild cards).
Généralement symbolisée par les signes *, ? ou
$, la troncature permet d'effectuer des recherches sur des parties
de mots. Elle est moins flexible dans le contexte de la recherche
d'information sur le Web qu'en ce qui a trait aux logiciels
documentaires traditionnels (impossibilité de l'appliquer en
début de mot, nécessité fréquente de
saisir un nombre minimum de lettres, etc.). Elle est toutefois
intéressante en ce qu'elle permet de faire des recherches
sur des mots de même famille et sur les variations de genre
et de nombre.
Exemples : biblio* repérera bibliothèque,
bibliothèques, bibliothécaire, bibliophile, etc. La
troncature peut aussi s'utiliser à l'intérieur d'un
mot, pour remplacer un ou plusieurs caractère(s) : coll$sion
repérera collision et collusion.
la recherche de locutions
Elle
fonctionne habituellement à l'aide des guillemets " "
et permet la recherche exacte d'une séquence ordonnée
de mots adjacents.
Exemple : "commerce électronique"
repérera toutes les entrées où ces deux mots
figurent l'un à côté de l'autre et dans cet
ordre.
l'opérateur de proximité
Il permet de rechercher des entrées où les mots
désirés apparaissent à l'intérieur
d'une « fenêtre » de voisinage dont l'ampleur
varie selon les outils (généralement entre 10 et 100
mots, parfois beaucoup plus). Les formulations les plus habituelles
sont anglophones : NEAR ou FOLLOWED BY (dans ce dernier cas, on
tient également compte de la linéarité,
c'est-à-dire de l'ordre d'apparition des termes). Pour
rechercher des termes côte à côte (un peu comme
une recherche de locution), on emploie parfois également un
opérateur de proximité spécifique, dit
opérateur d'adjacence. Il est généralement
symbolisé par ADJ.
Exemples : commerce NEAR électronique
repérera les entrées où ces deux termes
figurent près l'un de l'autre. Commerce FOLLOWED BY
électronique exigera, de plus, que l'ordre de saisie des
mots soit respecté. Commerce ADJ électronique, pour
sa part, recherchera les entrées où ces deux termes
apparaissent immédiatement l'un à côté
de l'autre, peu importe l'ordre d'apparition.
De plus en plus les moteurs de recherche utilise des opérateurs flexibles. Qui évoluent en fonction de la réussite de la requête. Typiquement si le nombre de documents retournés est trop grand, seul les documents ou le AND est un NEAR sera retourné. Ou bien l'on cherche d'abord la suite de mots précisément dans l'ordre donné puis progressivement on accepte n'importe quel ordre puis des distances de plus en plus grandes entre les mots. Par exemple, si l'on recherche: Rapporteur Mr Intel, notre objectif est de trouver des thèses qui ont Mr Intel comme rapporteur, ce sont les premier "Hits" , puis les hits suivants sont des thèses ou il est Membre du jury, puis des thèses ou il est cité etc...
Bien sur il faut que la requête retourne au moins un match car l'absence de match pour une requête donné est une information.