Définitions et concepts.

Les principaux objets de Lucene sont : l'index, le document, le field (champs) et le term (Terme ou mot). Sachant qu'un index est une suite de document, un document est une suite de field et un field est un nom associé à une suite de term (un term est une String).


On parle d'indexation inversé (inverted indexing) quand à partir d'un term, on peut retrouver les documents. Le terme est alors "indexé". Dans les modèles classique, un terme est retrouvé grâce au document indexé, dans le cas d'indexation inversé, on peut retrouver le document a partir du terme.


Un segment est, comme son nom l'indique, un sous ensemble d'un index. Il représente néanmoins un index en lui même où peut s'opérer des recherches indépendamment des autres segments.

Lucene assigne à un document un numéro lors de son ajout.

En résumé un segment d'index se compose de :

Sun Seng Tan 2004-02-28