SMILE |
PRÉSENTATION
SMILE est un outil d'inférence de motifs dans des jeux de
séquences. À l'origine, il a été concu pour
détecter des sites exceptionnels (sites de fixation ou de
régulation de facteurs de transcription) dans des
séquences d'ADN. L'intérêt de SMILE est de
permettre l'inférence de motifs structurés
séparés par des intervalles de distance contraints.
En particulier, SMILE permet de réunir sous un même modèle des occurrences constituées de plusieurs boîtes séparées par des spacers de longueurs différentes.
Depuis la version 1.4, SMILE gère des séquences écrites sur n'importe quel alphabet et recherche des modèles sur un alphabet également quelconque. On peut donc utiliser SMILE pour inférer des motifs protéiques, par exemple.
Vous trouverez des détails algorithmiques sur SMILE dans nos
publications et dans ma thèse.
DOWNLOAD
SMILE est écrit en C sous Unix. Il existe un package Debian de
SMILE,
créé et maintenu par Steffen Möller (merci
Steffen!). Pour
l'utiliser, ajoutez la ligne
Une version en ligne aux fonctionnalités réduites est actuellement disponible sur Bioweb (Institut Pasteur) (merci à Catherine Letondal pour son aide).
UTILISER SMILE
SMILE impose certaines connaissances des motifs à
inférer, qu'on communique au programme via un fichier de
paramètres. Son fonctionnement nécessite un apprentissage
afin de pouvoir exploiter pleinement ses possibilités.
Contrairement à d'autres outils, SMILE demande donc que son
utilisateur, informaticien ou biologiste, comprenne certaines de ses
caractéristiques algorithmiques. Afin d'aider les utilisateurs
débutants à franchir cette étape, voici un tutorial tiré
de la thèse. Vous trouverez de plus des exemples
commentés dans les packages de SMILE ou dans la man
page.
NOUVEAU!
Une version améliorée de SMILE, plus
puissante et rapide, a été développée par
Alexandra M.Carvalho dans le cadre de son doctorat: RISO.