Projets tutorés

licence d'informatique et d'IUP

Organisation générale
Maxime.Crochemore@univ-mlv.fr
Université de Marne-la-Vallée, janvier 2004

Liste de sujets

Plagiat

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C ou Java, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à implanter une méthode de comparaison de codes C ou Java basée sur la méthode décrite dans le document.

Document

Winnowing: Local Algorithms for Document Fingerprinting
S. Schleimer, D.S. Wilkerson, A. Aiken, in Proceedings of the ACM SIGMOD International Conference on Management of Data, 2003 (10 pages).

Composition du groupe : (correspondant)

  •  

Présentation : (site Web)

en local : (copie locale du site précédent)

 

Alignement de séquences

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C ou Java, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à implanter une méthode de comparaison de séquences moléculaires basée sur la notion d'alignement.

Document

Sparse LCS Common Substring Alignment
G.M. Landau, B. Schieber, M. Ziv-Ukelson, IPL 88 (2003) 259--270 (12 pages).

Composition du groupe : (correspondant)

  •  

Présentation : (site Web)

en local : (copie locale du site précédent)

 

Animation d'algorithmes

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : Java, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à réaliser en Java des animations d'algorithmes connus utilisés pour effectuer de la recherche approchée de motifs textuels. On pourra s'inspirer d'animations d'algorithmes voisins, telles celles accessibles depuis les pages Exact String Matching Algorithms et Sequence comparison.
Le travail consiste en :
  • étude du fonctionnement d'algorithmes du document de référence ;
  • collecte de site Web (ou logiciels) présentant des animations ;
  • proposition pour l'animation des algorithmes du document ;
  • réalisation des animations ;
  • suivi et documentation depuis un site Web.

Document

Chapitre du livre « Algorithmique du texte » portant sur la recherche approchées de motifs.

Composition du groupe : (correspondant)

  •  

Présentation : (site Web)

en local : (copie locale du site précédent)

 

Motifs textuels

Tuteur : Maxime.Crochemore@univ-mlv.fr
Langage de programmation : C, Java ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

L'objectif de ce projet est de développer un programme d'extraction de motifs (segments répétés) dans un texte. Ce programme devra être capable de calculer une base de motifs puis de traiter quelques applications faisant intervenir la base.
Les éléments principaux du projet comportent :
  • calcul d'une base de motifs ;
  • recherche d'examples de bases particulières ;
  • programmation de quelques applications.

Document

A Basis for Repeated Motifs in Pattern Discovery and Text Mining,

Composition du groupe : (correspondant)

  •  

Présentation : (site Web)

en local : (copie locale du site précédent)

 

Compression de textes

Tuteurs : Maxime.Crochemore@univ-mlv.fr et Marc.Zipstein@univ-mlv.fr
Langage de programmation : C ou C++, documentation en HTML
Environnement de développement : UNIX ou Linux

Sujet

Le projet consiste à implanter une méthode de compression de textes (sans perte d'information).
Elle basée sur l'utilisation d'un anti-dictionnaire (lexique de mots interdits) et décrite dans DCA Compression. L'architecture de l'implantation comprendra trois éléments principaux :
  • un module de calcul d'un anti-dictionnaire qui pourra servir d'essai pour étudier la statistique des mots interdits ;
  • un module de codage ;
  • un module de décodage.
Enfin, une phase du projet sera consacrée à des tests sur les taux de compression.

Documents

Composition du groupe : (correspondant)

  •  

Présentation : (site Web)

en local : (copie locale du site précédent)

Anciens : 1999, 2000, 2001, 2002.
Institut Gaspard-Monge, Laboratoire d'informatique, le 6 janvier 2003, Maxime Crochemore