Installation de ht://Dig

 

Pub produit

Mon diaporama

Quelques liens pour mes sources:

Le site officiel avec la marque pas déposée car c'est tout gratuit. On peut même travailler sur les sources si on veut

 

Le diaporama de Mr CARON

Un peu trop d'informations, je pense qu'en assitant au cours c'est mieux.

Kit de francisation

Un site qui propose de franciser (est-ce français ?) Ht://Dig pour gérer les accents en autre.

   

     Htdig est un moteur de recherche développé en C++ adapté à de petits sites Internets (sites locaux : ecole, entreprise, ...). L'application est un logiciel libre (license GNU). La version de HtDig utilisée est la 3.1.5. Elle a été téléchargée  à partir du site principal http://www.htdig.org.

Ht://Dig repose sur Apache afin d'exécuter ses requêtes, son installation est donc nécessaire.

 

Installation d'Apache

     Avant de procéder à l'installation de ht://Dig, j'ai installé un serveur Apache pour pouvoir observer les résultats des requêtes via Netscape.

Voici les commandes que j'ai saisie:

  1. ./configure--prefix=/mnt/laureline/sdc3/app1/obaudoui/SYSTEME/dev/apache/bin 
  2. make 
  3. make install 
  4. /mnt/laureline/sdc3/app1/obaudoui/SYSTEME/dev/apache/bin/bin/apachectl start

Il a également fallu définir la racine dans le fichier de configuration httpd.conf d'Apache. Pour cela, il faut rechercher la section DocumentRoot et indiquer un chemin :

#
# DocumentRoot: The directory out of which you will serve your
# documents. By default, all requests are taken from this directory, but
# symbolic links and aliases may be used to point to other locations.
#
DocumentRoot "/home/app1/obaudoui/SYSTEME/dev/apache/bin/"

Vérification de l'espace disponible

 D'autre part, il a été  nécessaire de prévoir un espace disque suffisant. Celui-ci est fonction du nombre de document sera indexé, suivant cette formule : NB_DOCUMENT_A_INDEX X 12000 = ESPACE_DISQUE_REQUIS.

Éviter les pièges

Un problème que j'ai rencontré. Pourquoi le make install plante ?? Parce qu'il y a des alias ! Désactivez les alias, sinon, comme moi, les fichiers ou les répertoires ne peuvent pas être crées ou supprimés.

Installation de Ht://Dig

    J'ai suivi la procédure d'installation standard de HtDig: 

  1. ./configure --prefix=/mnt/laureline/sdc3/app1/obaudoui/SYSTEME/dev/htdig
  2. modification des paramètres du fichier de configuration CONFIG
  3. make
  4. make install

Voici le fichier CONFIG que j'ai utilisé. En rouge apparaît ce que j'ai modifié, en italique ce qui appartient au fichier et en gras, les commentaires.

Voilà le fichier htdig.conf que j'ai utilisé. En rouge apparaît ce que j'ai modifié, en italique ce qui appartient au fichier et en gras, les commentaires.

Après ces opérations, il suffit d'exécuter le rundig qui à son tour lance toutes les opérations nécessaires à la construction des bases de données. Ces opérations sont expliquées ci-après.

 

Description de Ht://Dig

     HtDig est composé de trois phases principales.

     HtDig suit tous les liens a partir de l'adresse internet que l'on veut indexer (sans jamais sortir du domaine) puis crée une base de donnée des mots rencontrés. Cette base de donnée contient pour chaque page une liste, non classée, des mots rencontrés. Deux fichiers sont crées, un contenant tous les mots et l'autre les URL ainsi que des informations associées. Il est necesaire de modifier du fichier htdig.conf pour préciser le domaine a indexer ainsi que le proxy utilisé.

     HtMerge reprend les fichiers crées par HtDig pour en faire un index et une base de données de mots utilisables par le moteur de recherche. Le programme peut aussi reprendre un base de donnée crée par lui-même pour effectuer une mise a jour sur les documents qui ont été modifiés.

     HtSearch est le moteur de recherche s'appuyant sur les databases générées par HtMerge. HtSearch produit une page html, contenant une liste d'URL, en réponse a la requête de l'utilisateur. Il effectue une recherche sur le(s) mot(s) recherché(s) ainsi que sur des dérivés du mot.