Projets tutorés
licence d'informatique et d'IUP

Organisation générale
Maxime.Crochemore@univ-mlv.fr
Université de Marne-la-Vallée, janvier 2001

Liste de sujets

Compression de textes

Tuteurs : Maxime.Crochemore@univ-mlv.fr et Marc.Zipstein@univ-mlv.fr
Langage de programmation : C ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à implanter deux méthodes de compression de textes (sans perte d'information).
La première basée sur l'utilisation d'un anti-dictionnaire (lexique de mots interdits) est décrite dans DCA Compression. L'architecture de l'implantation comprendra trois éléments principaux :
  • un module de calcul d'un anti-dictionnaire qui pourra servir d'essai pour étudier la statistique des mots interdits ;
  • un module de codage ;
  • un module de décodage.
La seconde méthode de compression consiste à établir un dictionnaire statique de mots (multigrammes) fréquents qui sont ensuite codés par des mots courts. On implantera la méthode selon le même type d'architecture logicielle que ci-dessus :
  • un module de calcul de dictionnaire ;
  • un module de codage sous forme de transducteur (automate à sortie) ;
  • un module de décodage.
Enfin, une phase du projet sera consacrée à des tests sur les taux de compression et à la comparaison des deux méthodes.

Documents

 

Analyseur de site Web

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C, Java ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à réaliser plusieurs outils pour la gestion et l'analyse d'un site Web.
Le point principal porte sur l'écriture d'un analyseur syntaxique du langage HTML 4.0. Il sera utilisé pour développer un outil de validation lexicale et syntaxique de documents HTML et un outil d'aide à la création de documents HTML.
Il pourra être la base d'autres outils logiciels pour la gestion de sites Web, comme un contrôleur de liens ou un aspirateur de site.
On pourra aussi étudier et réaliser des programmes de bureautique pour la création de calendrier et la gestion d'agenda sur la Toile, par exemple.

Documents

 

Traducteur LaTeX/MathML

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C, Java ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

L'objectif de ce projet est de développer un programme de traduction des expressions mathématiques du langage scientifique LaTeX vers le langage MathML. On prendra en compte un sous-ensemble significatif des expressions LaTeX dont on établira une traduction en MathML au sein d'une page élémentaire en XML en y associant une feuille de style respectant autant que possible le style LaTeX d'origine.
Les éléments principaux du projet comportent :
  • élaboration d'un analyseur des équations LaTeX ;
  • définition d'une traduction des équations LaTeX en MathML ;
  • écriture d'une feuille de style en XSL (ou de type CSS) associée au texte XML ;
  • élaboration d'un traducteur.

Documents

  • LaTeX par L. Lamport chez Addison-Wesley, 1985.
  • Recommandations du W3C sur MathML, XML et XSL ; voir aussi XML.COM.
  • Exemples de latex2html, tthmml ou tex4ht (voir W3C Math).
 

Analyseur XML

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C, Java ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

L'objectif de ce projet est de développer un analyseur du langage XML. On prendra en compte un sous-ensemble significatif du langage. On établira une traduction en XHTML (ou HTML) en y associant une feuille de style. On essaiera de développer une application associée à l'analyseur.
Les éléments principaux du projet comportent :
  • élaboration d'un analyseur de XML ;
  • définition d'une traduction en XHTML ;
  • écriture d'une feuille de style en XSL (ou de type CSS) associée au jeu de balises retenues ;
  • élaboration d'un traducteur.
  • développement d'une application.

Documents

  • LaTeX par L. Lamport chez Addison-Wesley, 1985.
  • Recommandations du W3C sur MathML, XML et XSL ; voir aussi XML.COM.
  • Exemples de latex2html, tthmml ou tex4ht (voir W3C Math).
Anciens : 1999.
Institut Gaspard-Monge, Laboratoire d'informatique, le 8 janvier 2001, Maxime Crochemore