Eric Laporte, Jeesun Nam, Jeannot Fils Ranaivoson, Takuya Nakamura. Support verbs that are not verbs. Language Sciences, 2025, 111, pp.101741. ⟨10.1016/j.langsci.2025.101741⟩. ⟨hal-05132407⟩
Accès au bibtex
2023
ref_biblio
Vimala Balakrishnan, Lee Zing Hii, Eric Laporte. COVID-19 Infodemic. Malaysian Journal of Computer Science, 2023, 36 (1), pp.1-13. ⟨10.22452/mjcs.vol36no1.1⟩. ⟨hal-04065253⟩
Accès au texte intégral et bibtex
ref_biblio
Changhoe Hwang, Jee-Sun Nam, Eric Laporte. Generating training datasets for legal chatbots in Korean. International conference on Law and Society, P. Suresh, Feb 2023, Hanoï, Vietnam. pp.1-4. ⟨hal-04006155⟩
Accès au texte intégral et bibtex
2022
ref_biblio
Suwon Choi, Shinwoo Kim, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, et al.. SSP-based construction of evaluation-annotated data for fine-grained aspect-based sentiment analysis. 29th International Conference on Computational Linguistics (COLING). Workshop on Pattern-based Approaches to NLP in the Age of Deep Learning (Pan-DL), Oct 2022, Gyeongju, South Korea. pp.38-44. ⟨hal-03818540⟩
Accès au texte intégral et bibtex
ref_biblio
Aggeliki Fotopoulou, Eric Laporte, Takuya Nakamura. 'L'idée nous est venue d'écrire ça pour Annibale'… Complex support verb constructions with 'idée'. Simona Messina; Virgilio d'Antonio; Antonio Scocozza; Giustino De Bueriis. Comunicazione, Linguaggi e Società. Studi in onore di Annibale Elia, Taurus, pp.237-253, 2022, 978-958-5165-23-6. ⟨hal-03697329⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Hybrid Language Processing in the Deep Learning Era. International Conference on Natural Language and Speech Processing, Dec 2022, Trento, Italy. ⟨hal-04449131⟩
Accès au bibtex
ref_biblio
Jeongwoo Yoon, On-yu Park, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, et al.. Building Korean linguistic resource for NLU data generation of banking app CS dialog system. 29th International Conference on Computational Linguistics (COLING), Workshop on Pattern-based Approaches to NLP in the Age of Deep Learning (Pan-DL), Oct 2022, Gyeongju, South Korea. pp.29-37. ⟨hal-03818541⟩
Accès au texte intégral et bibtex
2021
ref_biblio
Aggeliki Fotopoulou, Eric Laporte, Takuya Nakamura. Where Do Aspectual Variants of Light Verb Constructions Belong?. Proceedings of the 17th Workshop on Multiword Expressions (MWE 2021), Aug 2021, Online, France. pp.2-12, ⟨10.18653/v1/2021.mwe-1.2⟩. ⟨hal-03321618⟩
Accès au bibtex
ref_biblio
Eric Laporte, Christiane Marque-Pucheu, Takuya Nakamura. Le lexique-grammaire de noms sous-spécifiés. CORELA - COgnition, REprésentation, LAngage, 2021, Les noms sous-spécifiés en français: du lexique au discours, HS-34, ⟨10.4000/corela.13667⟩. ⟨hal-03475937⟩
Accès au texte intégral et bibtex
ref_biblio
Sébastien Paumier, Franz Guenthner, Eric Laporte, Friederike Malchok, Clemens Marschner, et al.. UNITEX 3.3 Manuel d'utilisation. 2021. ⟨hal-03589598⟩
Accès au texte intégral et bibtex
ref_biblio
Sébastien Paumier, Wolfgang Flury, Franz Guenthner, Eric Laporte, Friederike Malchok, et al.. UNITEX 3.3 User Manual. 2021. ⟨hal-03589580⟩
Accès au texte intégral et bibtex
ref_biblio
Larissa Picoli, Oto Araújo Vale, Eric Laporte. Aspecto verbal nas construções com verbo-suporte. Revista do GEL (Grupo de Estudos Lingüísticos do Estado de São Paulo), 2021, 18 (1), pp.204-229. ⟨10.21165/gel.v18i1.2897⟩. ⟨hal-03218180⟩
Accès au bibtex
2015-2019
2019
ref_biblio
Maria José Bocorny Finatto, Oto Araújo Vale, Eric Laporte. Recognizing the vocabulary of Brazilian popular newspapers with a free-access computational dictionary. Alfa Revista de Linguistica, 2019, 63 (1), pp.67-85. ⟨10.1590/1981-5794-1904-3⟩. ⟨hal-02103083⟩
Accès au texte intégral et bibtex
2018
ref_biblio
Jaeho Han, Changhoe Hwang, Seongyong Choi, Gwanghoon Yoo, Eric Laporte, et al.. DECO-MWE: Building a Linguistic Resource of Korean Multiword Expressions for Feature-Based Sentiment Analysis. 13th Workshop on Asian Language Resources, Kiyoaki Shirai, May 2018, Miyazaki, Japan. pp.14-20. ⟨hal-01795167⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Choosing features for classifying multiword expressions. Manfred Sailer; Stella Markantonatou. Multiword expressions: Insights from a multi-lingual perspective, Language Science Press, pp.143-186, 2018, 978-3-96110-063-7. ⟨10.5281/zenodo.1182597⟩. ⟨hal-01802489⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Fabrice Beltran. Continuum of Compositionality and Formal Description. I International Congress of Phraseology and Translation in Latin America, Sep 2018, Lima, Peru. ⟨hal-01890449⟩
Accès au bibtex
ref_biblio
Juliana P C Pirovani, Elias de Oliveira, Eric Laporte. Concordance Comparison as a Means of Assembling Local Grammars. Aline Villavicencio; Moreira Viviane; Alberto Abad; Helena Caseli; Pablo Gamallo; Carlos Ramisch; Hugo Ricardo Gonçalo Oliveira; Gustavo Henrique Paetzold. Computational Processing of the Portuguese Language. 13th International Conference, PROPOR 2018, Canela, Brazil, September 24–26, 2018, Proceedings, 11122, Springer, pp.57-65, 2018, Lecture Notes in Artificial Intelligence, 978-3-319-99721-6. ⟨10.1007/978-3-319-99722-3_6⟩. ⟨hal-01890393⟩
Accès au texte intégral et bibtex
2016
ref_biblio
Byoung-Yeol Chae, Dong-Hee Cho, Sairom Kim, Eric Laporte, Jeesun Nam. A semi-automatic method for constructing MUSE sentiment-annotated corpora. ICAL, Nguyen Tat Thanh University, Dec 2016, Ho Chi Minh City, Vietnam. pp.17-18. ⟨hal-01526827⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Annotating Text With Local Grammars. 2016. ⟨hal-01341146⟩
Larissa Picoli, Juliana Pinheiro Campos Pirovani, Elias Silva de Oliveira, Eric Laporte. Uso de uma ferramenta de processamento de linguagem natural como auxílio à coleta de exemplos para o estudo de propriedades sintático-semânticas de verbos. Linguamática, 2015, 7 (2), pp.35-44. ⟨hal-01252528⟩
Accès au texte intégral et bibtex
2010-2014
2014
ref_biblio
Jorge Baptista, Pushpak Bhattacharyya, Christiane Fellbaum, Mikel Forcada, Huang Chu-Ren, et al. (Dir.). Proceedings of Workshop on Lexical and Grammatical Resources for Language Processing (LG-LP). Takuya Nakamura. Association for Computational Linguistics, 2014, 978-1-873769-44-7. ⟨10.3115/v1/W14-58⟩. ⟨hal-01999889⟩
Accès au bibtex
ref_biblio
Eric Laporte. Interaction between Linguists and Machine Learning. 2014. ⟨hal-01118870⟩
Accès au bibtex
ref_biblio
Anthony Sigogne, Mathieu Constant, Eric Laporte. Intégration des données d'un lexique syntaxique dans un analyseur syntaxique probabiliste. Fryni Kakoyianni-Doa. Penser le Lexique-Grammaire. Perspectives actuelles, Honoré Champion, pp.505-516, 2014, Collection Colloques, congrès et conférences. Sciences du Langage, histoire de la langue et des dictionnaires. 30th International Conference on Lexis and Grammar, Nicosia, Cyprus, 2011, 978-2-7453-2512-9. ⟨hal-00621647⟩
Accès au texte intégral et bibtex
2013
ref_biblio
Eric Laporte, Elsa Tolone, Mathieu Constant. Conversion of Lexicon-Grammar tables to LMF. Application to French. Gil Francopoulo. LMF. Lexical Markup Framework, ISTE - Wiley, pp.157-187, 2013, 978-1-84821-430-9. ⟨hal-00803800⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Defining a verb taxonomy by a decision tree. Kozué Ogata. Autour des verbes. Constructions et interprétations, John Benjamins, pp.87-108, 2013, Lingvisticae Investigationes Supplementa, 978 90 272 3139 0. ⟨hal-00860386⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Aucione D. Smarsaro, Oto Araújo Vale (Dir.). Dialogar é preciso. PPGEL/UFES, 1, pp.268, 2013. ⟨hal-00804609⟩
Accès au bibtex
ref_biblio
Eric Laporte. Dictionaries for language processing. Readability and organization of information. Laporte, Éric ; Smarsaro, Aucione ; Vale, Oto. Dialogar é preciso. Linguística para processamento de línguas, PPGEL/UFES, pp.119-132, 2013, 978-85-8087-104-3. ⟨hal-00804606v2⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. O Léxico-Gramática, um método de descrição linguística. 2013, pp.1-125. ⟨hal-00823401⟩
Accès au texte intégral et bibtex
ref_biblio
Alexis Amid Neme, Eric Laporte. Pattern-and-root inflectional morphology: the Arabic broken plural. Language Sciences, 2013, 40, pp.221-250. ⟨10.1016/j.langsci.2013.06.002⟩. ⟨hal-00831338⟩
Accès au texte intégral et bibtex
ref_biblio
Wagner Lúcio Pacheco, Eric Laporte. Descrição do verbo cortar para processamento automático de linguagem natural. Laporte, Éric ; Smarsaro, Aucione ; Vale, Oto. Dialogar é preciso. Linguística para processamento de línguas, PPGEL/UFES, pp.165-176, 2013, 978-85-8087-104-3. ⟨hal-00804811⟩
Accès au texte intégral et bibtex
ref_biblio
Joro Ny Aina Ranaivoarison, Eric Laporte, Baholisoa Simone Ralalaoherivony. Formalization of Malagasy conjugation. Language and Technology Conference, Dec 2013, Poznań, Poland. pp.457-462. ⟨hal-00910883⟩
Accès au texte intégral et bibtex
2012
ref_biblio
Eric Laporte. Corpus linguistics and phraseo-paremiology. ALVAREZ, Maria Luisa Ortíz. Tendências atuais na pesquisa descritiva e aplicada em fraseologia e paremiologia. Anais, Pontes Editores, pp.255-268, 2012, 978-85-7113-422-5. ⟨hal-00797852⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Is the Lexicon-Grammar exploitable for language processing?. Zheng Ding-Ou (郑定欧). Lexicon-Grammar: 50 years, World Publishing Corporation, pp.261-270, 2012, 978-7-5100-4713-8. ⟨hal-00858302⟩
Accès au texte intégral et bibtex
ref_biblio
Myriam Rakho, Eric Laporte, Mathieu Constant. A new semantically annotated corpus with syntactic-semantic and cross-lingual senses. Language Resources and Evaluation (LREC'12), May 2012, Istanbul, Turkey. pp.597-600. ⟨hal-00762300⟩
Accès au texte intégral et bibtex
ref_biblio
Aucione D. Smarsaro, Eric Laporte, Lúcia Helena P. Rocha. Um recurso linguístico para processamento automático de linguagem natural. Descrição do verbo passar. CARMELINO, Ana Cristina; MEIRELES, Alexsandro Rodrigues; YACOVENCO, Lilian Coutinho. Questões linguísticas: diversidade teórica, PPGEL/UFES, pp.141-156, 2012, 978-85-66063-00-4. ⟨hal-00751425⟩
Sang-Taek Park, Ae-Lim Ahn, Eric Laporte, Jee-Sun Nam. Classification of non-analyzable word types in web documents to implement an effective Korean e-learning system. Doing Research in Applied Linguistics, Apr 2011, Bangkok, Thailand. pp.61-68. ⟨hal-01273394⟩
Accès au texte intégral et bibtex
ref_biblio
Anthony Sigogne, Mathieu Constant, Eric Laporte. French parsing enhanced with a word clustering method based on a syntactic lexicon. Second Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2011), Oct 2011, Dublin, Ireland. pp.22-27. ⟨hal-00722750⟩
Accès au texte intégral et bibtex
ref_biblio
Anthony Sigogne, Mathieu Constant, Eric Laporte. Integration of Data from a Syntactic Lexicon into Generative and Discriminative Probabilistic Parsers. International conference on Recent Advances in Natural Language Processing (RANLP'11), 2011, Hissar, Bulgaria. pp.363-370. ⟨hal-00621646⟩
Accès au texte intégral et bibtex
2010
ref_biblio
Ae-Lim Ahn, Eric Laporte, Jee-Sun Nam. Semantic Polarity of Adjectival Predicates in Online Reviews. Seoul International Conference on Linguistics (SICOL'10), 2010, Seoul, South Korea. 10pp., ⟨10.48550/arXiv.1211.4161⟩. ⟨hal-00621601⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Le lexique-grammaire est-il exploitable pour le traitement des langues ?. Takuya Nakamura, Eric Laporte, Anne Dister, Cédrick Fairon. Les Tables. La grammaire du français par le menu. Mélanges en hommage à Christian Leclère, Presses universitaires de Louvain, pp.207-218, 2010, Cahiers du Cental. ⟨halshs-00462422⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Preslav Nakov, Carlos Ramisch, Aline Villavicencio. Proceedings of the COLING Workshop on Multiword Expressions: from Theory to Applications (MWE 2010). COLING, Aug 2010, Beijing, China. Association for Computational Linguistics, 101 p., 2010. ⟨hal-00722851⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Questions/réponses sur la grammaire francaise. Conenna Mirella. La salle de cours, 11 (11), Peter Lang, pp.85-90, 2010, Etudes contrastives. ⟨hal-00639312⟩
Accès au bibtex
ref_biblio
Eric Laporte. Recension de "Description linguistique pour le traitement automatique du français", par Matthieu Constant et al. 2010, pp.295-296. ⟨halshs-00564535⟩
Accès au texte intégral et bibtex
ref_biblio
Takuya Nakamura, Eric Laporte, Anne Dister, Cédrick Fairon (Dir.). Les tables. La grammaire du français par le menu. Mélanges en hommage à Christian Leclère.. UCL, Presses Universitaires de Louvain, 384pp., 2010. ⟨hal-00695958⟩
Eric Laporte. Lexicons and grammars for language processing: industrial or handcrafted products?. Letícia Marcondes Rezende, Bento Carlos Dias da Silva, Juliana Bertucci Barbosa. Léxico e gramática: dos sentidos à construção da significação, Cultura acadêmica, pp.51-84, 2009, Trilhas Lingüísticas, 16. ⟨halshs-00400986⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Tendances actuelles en traitement des langues. 3e Colloque associé des Sociétés et Associations coréennes d'études françaises, Les Arts du spectacle de la Francophonie, Université SungKyunKwan, Seoul, Jun 2009, South Korea. pp.57. ⟨hal-00621634⟩
Accès au bibtex
2008
ref_biblio
Jacqueline Giry-Schneider, Eric Laporte, Annie Meunier, Jee-Sun Nam. Classification of Adjectives in French and in Korean. 18th International Congress of Linguists (CIL'08), 2008, Seoul, South Korea. 1 page. ⟨hal-00621491⟩
Accès au bibtex
ref_biblio
Eric Laporte, Takuya Nakamura, Stavroula Voyatzi. A French Corpus Annotated for Multiword Expressions with Adverbial Function. Language Resources and Evaluation Conference (LREC). Linguistic Annotation Workshop, 2008, Marrakech, Morocco. pp.48-51. ⟨halshs-00286541v2⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Takuya Nakamura, Stavroula Voyatzi. A French Corpus Annotated for Multiword Nouns. Language Resources and Evaluation Conference. Workshop Towards a Shared Task on Multiword Expressions, 2008, Marrakech, Morocco. pp.27-30. ⟨halshs-00286552⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Stavroula Voyatzi. An Electronic Dictionary of French Multiword Adverbs. Language Resources and Evaluation Conference. Workshop Towards a Shared Task for Multiword Expressions, 2008, Marrakech, Morocco. pp.31-34. ⟨halshs-00286546⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Exemplos atestados e exemplos construídos na prática do Léxico-Gramática. Revista (Con)textos Lingüísticos, 2008, 2, pp.26-51. ⟨halshs-00325926⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte, Elisabete Ranchhod, Anastasia Yannacopoulou. Syntactic variation of support verb constructions. Lingvisticae investigationes : International Journal of Linguistics and Language, 2008, 31 (2), pp.173-185. ⟨10.1075/li.31.2.04lap⟩. ⟨hal-00362241⟩
Accès au texte intégral et bibtex
2007
ref_biblio
Eric Laporte. Evaluation of a Grammar of French Determiners. Workshop on Technology on Information and Human Language (TIL), 2007, Rio de Janeiro, Brazil. pp.0167. ⟨halshs-00190861⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Exemples attestés et exemples construits dans la pratique du lexique-grammaire. Observations et manipulations en linguistique : entre concurrence et complémentarité, Jan 2007, Paris, France. pp.11-32. ⟨halshs-00352695⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Extension of a Grammar of French Determiners. 26th International Conference on Lexis and Grammar, 2007, Bonifacio, France. pp.65-72. ⟨halshs-00190859⟩
Accès au texte intégral et bibtex
2006
ref_biblio
Ivan Berlocher, Hyun-Gue Huh, Eric Laporte, Jee-Sun Nam. Morphological annotation of Korean with Directly Maintainable Resources. Poster session of 5th International conference on Language Resources and Evaluation (LREC'06), May 2006, Genoa, Italy. pp.1803-1806, 2006. ⟨hal-00621506⟩
Accès au texte intégral et bibtex
ref_biblio
Olivier Blanc, Mathieu Constant, Eric Laporte. Outilex, plate-forme logicielle de traitement de textes écrits. Cédrick Fairon. 13ème Colloque sur le traitement automatique des langues naturelles (TALN'06), 2(1) (1), UCL, Presses Universitaires de Louvain, pp.83-92, 2006, Cahiers du CENTAL. ⟨hal-00621507⟩
Accès au bibtex
ref_biblio
Maria Carmelita P. Dias, Eric Laporte, Christian Leclère. Verbs with very strictly selected complements. The First Nordic Conference on Syntactic Freezes, 2006, Joensuu, Finland. ⟨halshs-00190889⟩
Accès au bibtex
ref_biblio
Eric Laporte, Sébastien Paumier. Graphes paramétrés et outils de lexicalisation. Conférence internationale sur le traitement des langues naturelles (TALN), 2006, Louvain, Belgique. pp.532-540. ⟨hal-00189668⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Methodological provisions in the construction of idiom resources. Collocations and idioms 2006: linguistic, computational, and psycholinguistic perspectives, Nov 2006, Berlin, Germany. ⟨hal-00621632⟩
Accès au bibtex
ref_biblio
Eric Laporte, Christian Leclère, Maria Carmelita P. Dias. Very strict selectional restrictions. Workshop on Computational Processing of Written and Spoken Portuguese (PROPOR), 2006, Itatiaia, Brazil. pp.225-228, ⟨10.1007/11751984_27⟩. ⟨halshs-00190856⟩
Accès au texte intégral et bibtex
ref_biblio
Dusko Vitas, Cvetana Krstev, Eric Laporte. Preparation and exploitation of bilingual texts. Lux Coreana, 2006, 1, pp.110-132. ⟨hal-00190958v2⟩
Accès au texte intégral et bibtex
2005
ref_biblio
Marcelo C.M. Muniz, Maria das Graças V. Nunes, Eric Laporte. UNITEX-PB, a set of flexible language resources for Brazilian Portuguese. Workshop on Technology on Information and Human Language (TIL), 2005, São Leopoldo, Brazil. pp.2059-2068. ⟨halshs-00190857⟩
Accès au texte intégral et bibtex
ref_biblio
Hyun-Gue Huh, Eric Laporte. A Resource-Based Korean morphological annotation system. Poster session of International Joint Conference on Natural Language Processing (IJCNLP'05), Oct 2005, Jeju, South Korea. pp.37-42, 2005. ⟨hal-00621508⟩
Accès au texte intégral et bibtex
ref_biblio
Hyun-Gue Huh, Eric Laporte. Morphological annotation of Korean with Maintainable Resources. Dicora Annual Meeting, 2005, France. pp.14-18. ⟨hal-00621575⟩
Accès au bibtex
ref_biblio
Eric Laporte. Graphes paramétrés et lexique-grammaire. Interface lexique-grammaire et lexiques syntaxiques et sémantiques (Atala Workshop'05), Sylvain Kahane, Mar 2005, Paris, France. 10pp. ⟨hal-00621509⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. In memoriam Maurice Gross. Archives of Control Sciences, 2005, 15 (3), pp.257-278. ⟨halshs-00190841⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Lexicon management and standard formats. Archives of Control Sciences, 2005, 15 (3), pp.329-340. ⟨hal-00189711⟩
Accès au texte intégral et bibtex
ref_biblio
Eric Laporte. Symbolic Natural Language Processing. Lothaire. Applied Combinatorics on Words, Cambridge University Press, pp.164-209, 2005. ⟨hal-00145253⟩
2000. "Mots et niveau lexical",
in J.M. Pierrel, éd., Ingénierie des langues.
Série Informatique et systèmes d'information, Paris :
Hermès, pp. 25-49.
2000. "A Lingüística para o processamento das línguas",
Recortes Lingüísticos, A. Silva e M. Lins (eds.), Vitória,
Brésil : Saberes, pp. 67-75. Conférence prononcée
à l'Université fédérale de l'Espírito Santo, avril 2000.
2001. "Resolução de ambiguidades", in E. Ranchhod, éd.,
Tratamento das Línguas por Computador. Uma introdução à
Linguística Computacional e suas aplicações.
Lisbonne : Caminho, pp. 49-89
(une version anglaise est parue dans
Lingvisticae Investigationes XXIV:1).
Éric Laporte, Claude Martineau, Marc Zipstein, 2001.
Compactage des données,
Rapport final, Transweb 2, Université de Marne-la-Vallée, 12 p. + annexes.
Christian Leclère, Eric Laporte, Mireille Piot, Max Silberztein, eds., 2004.
Syntax, Lexis and Lexicon-Grammar. Papers in honour of Maurice Gross,
Lingvisticae Investigationes Supplementa 24, Amsterdam-Philadelphie : Benjamins, 22 + 659 p.
Compte-rendu par Thierry Fontenelle.Compte-rendu
par Sara Vecchiato dans Studi
Francesi 150 (2006).
2004. "Restructuration and the subject of adjectives", in
Syntax, Lexis and Lexicon-Grammar. Papers in honour of Maurice Gross,
Lingvisticae Investigationes Supplementa 24, Amsterdam-Philadelphie : Benjamins, pp. 373-388.
Fichiers comprimés (32
Ko).
2004. Préface de
Syntax, Lexis and Lexicon-Grammar. Papers in honour of Maurice Gross,
Lingvisticae Investigationes Supplementa 24, Amsterdam-Philadelphie : Benjamins, pp.
xi-xxi.
55 Ko.
2004. "Acceptability as the source of syntactic knowledge", Journal
of Applied Linguistics, October 2004, Special Issue on Lexicon-Grammar,
Pékin : Institut de Linguistique appliquée, pp. 9-22 (en chinois).
Eric Laporte, Cheng Ting-au, eds., 2004. Journal of Applied
Linguistics, October 2004, Special Issue on Lexicon-Grammar, Pékin :
Institut de Linguistique appliquée, 160 p. (en chinois).
2004. "Uma descrição sintática e semântica dos adjetivos
do francês para aplicações computacionais", PaLavra 12,
Série Langage, volume thématique : Processamento Automático do Português,
DIAS, Maria Carmelita & QUENTAL, Violeta (éd.),
ISSN 1413-7763,
Rio de Janeiro : Galo Branco,
pp. 91-105.
1996. "Évaluation de la levée d'ambiguïtés
lexicales", in
LINX
34-35, Lexique, syntaxe et analyse automatique
des textes. Hommage à Jean Dubois, Nanterre: Université
Paris X, pp. 291-305.
1996. "How many syllables are frequent?", Rapport technique
96-12, IGM, 10 p.
Éric Laporte, ed., 1996. Project Copernicus 621 GRAMLEX.
Deliverables. October 1995-June 1996. University Paris 7, LADL, 197
p.
Blandine Courtois, Éric Laporte, Alexis Némé, 1996.
Acquisition programs for lexical data. GRAMLEX report no. 1A2, 30 p.
Éric Laporte, Max Silberztein, 1996. Ambiguity rates. GRAMLEX
report no. 3A2, 7 p. [PDF
(1,7 Mo)]
1996. Construction of concordances sorted by lemmata of French text
corpora. GRAMLEX report no. 3A3, 5 p.
1996. Separation of homographic entries. GRAMLEX report no. 4A2,
16 p.
Blandine Courtois, Éric Laporte, 1996. Grammatical disambiguation
of French words using part of speech of words in context. GRAMLEX report
no. 3D1, 10 p. + 68 p. annex.
Éric Laporte, ed., 1996. Project Copernicus 621 GRAMLEX.
Deliverables. June-December 1996. University Paris 7, LADL, 206 p.
Éric Laporte, Mario Monteleone, 1996. Morphological dictionaries
in the framework of the two-level model. French and Italian. GRAMLEX report
no. 1G1-1J1, 39 p.
Éric Laporte, Mario Monteleone, 1996. Experimentation of
the two-level model for French and Italian morphology. GRAMLEX report no.
1G2-1J2, 6 p.
1997. "Noms appropriés à modifieur
obligatoire",
Langages 126, La description syntaxique des
adjectifs pour les traitements informatiques, Nam Jee-sun éd.,
Paris : Larousse, pp. 79-104. Version française de l'article de 1995 dans
Language
Research 31(2).
1997. "Phonology and Electronic Lexicon: Processing of Ambiguities",
Indo-French
Workshop on Natural Language Processing, Hyderabad, March 21-26, 10
p.
Éric Laporte, ed., 1997. Project Copernicus 621
GRAMLEX.
Deliverables. December 1996-May 1997. 2. Other tasks. University Paris
7, LADL, 137 p.
Éric Laporte, ed., 1997. Project Copernicus 621
GRAMLEX.
Deliverables. May-September 1997. University Paris 7, LADL, 179 p.
1998. Préface de Dictionary Based Methods and Tools for
Language Engineering, Vetulani (Z.) et al., Seria Jezykoznawstwo Komputerowe.
Poznan : Adam Mickiewicz University Press, pp. 11-12.
Éric Laporte, ed., 1998. Project Copernicus 621
GRAMLEX.
Deliverables. October 1997-April 1998. University Paris 7, LADL.
1998. Synthesis of results. GRAMLEX report no. 4E1-4E2, 6 p.
Éric Laporte, éd., 1999. Langages 133, Lexique-grammaire
des adjectifs, Paris : Larousse. Présentation, pp. 3-11.
1990. "Le dictionnaire phonémique DELAP",
Langue
française 87, Dictionnaires électroniques du français,
Blandine Courtois et Max Silberztein éds., Paris : Larousse, pp.
59-70.
Éric Laporte, éd., 1990. Recueil de tables de noms
prédicatifs, Rapport technique 22 du LADL, Paris.
1991. "A Formal Tool for Modelling "Standard" Phonetic Variations",
The
Phonetics and Phonology of Speaking Styles: Reduction and Elaboration in
Speech Communication, Joaquim Llisterri ed., Barcelona: ESCA, pp. 39-1
à 39-7.
Courtois, Blandine, Maurice Gross, Éric Laporte, Max Silberztein,
1991.
Étude
et développement d'extensions d'un système de vérification
orthographique, Rapport final du contrat de recherche 88 S075, LADL,
16 p.
1991. "Extending the Coverage of Derivatives in a Dictionary", 7p.;
"Phonetics and Transducers", 3p., Rapport technique 31 du LADL, Paris.
1991. "Une expérience de dépouillement de textes :
les mots non reconnus", 1991, Rapport inermédiaire de Genelex-Autogen,
pp.1-11.
1991. Règles de phonétisation : format, interprétation,
comptages, Rapport interne du CERIL, Évry.
1991. Dictionnaires de formes fléchies phonétiques
: présentation, Rapport interne du CERIL, Évry.
1992. "Adjectifs en -ant dérivés
de verbes", Langue française 96, La productivité
lexicale, André Dugas et Christian Molinier éds., Paris
: Larousse, pp.30-43.
1992. "Phonetic Syllables in French: Combinatorics, Structure and
Formal Definitions", Acta Linguistica Hungarica 41 (1-4), Budapest:
Akadémiai Kiadí, pp. 175-189.
Alcouffe, Philippe, Éric Laporte, Bruno Revellin-Falcoz, Laurence
Zaysser, 1992. Dictionnaire Dioxydes. Les données syntaxiques,
Rapport interne de Genelex, 215 p.
1992. "Genelex doit-il proposer un alphabet phonémique ?",
Enrichissement
de dictionnaires, Rapport interne de Genelex, 3 p.
1992. La constitution du dictionnaire de base Genelex, Rapport
interne de Genelex, 5 p. + 18 p. annexes.
1992. Phonétisation par transducteurs non déterministes,
Rapport interne de l'Institut Gaspard-Monge, Université de Marne-la-Vallée.
1993. Phonétique et transducteurs. Mémoire
d'habilitation, Université Paris 7, 21p. + articles.
1994. "Experiments in Lexical Disambiguation Using Local Grammars",
Papers
in Computational Lexicography, COMPLEX '94, Ferenc Kiefer, Gabor Kiss
and Julia Pajzs eds., Budapest: Linguistics Institute of the Hungarian
Academy of Sciences, pp. 163-172.
1986. "Applications de la morphophonologie à la production
automatique de textes phonétiques", Lexiques et traitement automatique
des langages, Actes du séminaire, GRECO "Communication parlée"
et GALF, Université Paul-Sabatier, Toulouse, 12 p.
1987. "Représentation formelle d'informations phonétiques",
Dictionnaires
électroniques et analyse automatique du français, Rapport
4 du Programme de recherches coordonnées "Informatique linguistique",
LADL, Université Paris 7, pp.21-57.
1987. Notice bibliographique sur Phonétique historique
du français, Gaston Zink, 1986,
Lingvisticae Investigationes
XI:2, Amsterdam-Philadelphie : Benjamins, p. 427.
1988. Phonétisation de textes par un réseau connexionniste,
Rapport interne, LIMSI, Orsay, 21 p.
1989. "Applications of Phonetic
Description", LNCS 377, Electronic
Dictionaries and Automata in Computational Linguistics, LITP Spring School
on Theoretical Computer Science, Saint-Pierre d'Oléron, France,
May 1987, Proceedings, Maurice Gross and Dominique Perrin eds., Berlin-New
York: Springer-Verlag, pp.66-78.
Gross, Maurice, Éric Laporte, Marcel-Paul Schützenberger, mai
1989.
"La réforme de l'orthographe. L'informatique linguistique teste
les qualités des réformes", Pour la science 139, Paris,
pp. 6-8.
Éric Laporte, Max Silberztein, 1989. "Vérification
et correction orthographiques assistées par ordinateur", Actes
de la Convention "Intelligence artificielle 1989", Paris : Hermès,
vol. 1, pp. 283-298.
1989. "La phonétisation automatique de textes français",
La
description des langues naturelles en vue d'applications linguistiques,
Actes du colloque, Conrad Ouellon éd., CIRB, Université
Laval, Québec, pp. 187-196.
1989. "La flexion en français : conjugaisons, pluriels, féminins",
Linguistica
communicatio, vol. 1, no. 2, Faculté de lettres, Fez, Maroc,
pp. 42-63.
Résumé. Un système de synthèse de parole à partir de
représentations sémantiques communique oralement les informations
codées dans une représentation sémantique. Un tel système doit
comprendre un module de génération de textes, un module de phonétisation,
un module prosodique et un synthétiseur de parole. Nous montrons comment
les informations syntaxiques élaborées par le module de génération de
textes sont utilisées pour la phonétisation et la prosodie, afin de
produire les données à fournir au synthétiseur de parole,
à savoir une chaîne phonétique augmentée d'informations prosodiques.
Mots-clés : langues naturelles, phonétique,
génération de textes, synthèse de la parole.
1987. "Prise en compte des variations phonétiques
en reconnaissance de la parole", Actes des 16es Journées d'étude
sur la parole, Société française d'acoustique,
Hammamet, pp. 153-156.
Résumé. Cet article est consacré aux méthodes de prise en compte
des variations phonétiques dans les systèmes de reconnaissance de la parole.
Nous nous intéressons à plusieurs méthodes de reconnaissance, mais
plus particulièrement aux systèmes fondés sur la reconnaissance de motifs et
dans lesquels l'unité de décision est la portion de parole comprise entre deux
centres syllabiques adjacents. Cette méthode nécessite des données phonétiques,
notamment une liste de références, qui devrait contenir
les variantes. Cette méthode met en évidence l'intérêt applicatif d'une
description précise et systématique des variantes. À titre d'exemple
d'une telle description, nous présentons une étude détaillée de certaines
alternances phonétiques liées aux hiatus en français.
Mots-clés : langues naturelles, phonétique, phonologie,
reconnaissance de la parole.
1988. Méthodes algorithmiques et lexicales
de phonétisation de textes. Applications au français,
Thèse de doctorat, Université Paris 7, 162 p. + vol. 2 (annexes).
Résumé. La phonétisation automatique est
la production de transcriptions phonétiques à partir de textes
ou de mots écrits. Les procédures qui effectuent cette transcription
sont destinées soit à permettre l'utilisation de la parole
dans la communication entre l'homme et la machine, soit à faciliter
la correction de certaines fautes d'orthographe.
Cette thèse expose les méthodes de phonétisation
automatique. Certaines de ces méthodes sont fondées sur des
algorithmes et des systèmes de règles, les autres sur des
dictionnaires phonétiques.
Un dictionnaire phonémique électronique a été
réalisé, ainsi que les algorithmes nécessaires à
sa gestion et à son utilisation. Nous exposons les solutions qui
nous ont permis de satisfaire deux exigences fondamentales :
- incorporer dans le dictionnaire un ensemble de mots représentatif
du français (64 000 entrées),
- élaborer le contenu phonétique du dictionnaire avec
la précision et la cohérence requises pour l'exploitation
informatique.
Un algorithme de phonétisation par règles a été
construit sous la forme d'un transducteur. Ce système spécifie
en détail la correspondance entre l'orthographe et la phonétique.
En relation étroite avec le dictionnaire, il inclut les règles
et les exceptions qui se dégagent de l'examen de ses 64 000 entrées.
Les conjugaisons et les variations en genre et en nombre ont été
prises en compte dans un programme qui produit des transcriptions phonétiques
de toutes ces formes. Par aileurs, nous donnons les représentations
formelles de plusieurs familles de variations phonétiques : l'effacement
de consonnes finales et les alternances entre synérèse et
diérèse.
Enfin, les algorithmes et les données sont été
expoités dans des applications informatiques : un système
de génération de messges oraux et un système d'aide
à la correction orthographique.
Un volume d'annexes regroupe l'algorithme de phonétisation et
des échantillons du dictionnaire.
Mots-clés : lexique, langues naturelles, phonétique,
phonologie, traitement de la parole.
1988. "La reconnaissance des expressions figées
lors de l'analyse automatique", Langages 90, Les expressions
figées, Laurence Danlos éd., Paris : Larousse, pp. 117-126.
Résumé. Les expressions figées empêchent
d'atteindre un niveau opératoire tout système de traitement
automatique des langues naturelles conçu à partir de la compositionnalité
des expressions libres. Cet article aborde le problème de la reconnaissance
des expressions figées, problème crucial pour tout système
de correction orthographique, de recherche documentaire, de traduction
automatique ou d'interrogation de bases de données, et problème
qui demande que le système ait accès à des descriptions
formelles telles que celles accumulées au LADL.
Résumé. Le Dictionnaire électronique du LADL
pour les représentations phonémiques (DELAP)
comporte les mêmes entrées que le DELAS,
mais il leur associe des informations concernant leur prononciation et
leurs variations phonétiques. Nous présentons le dictionnaire,
et discutons plus particulièrement certains problèmes posés
par les variations phonétiques, les relations entre transcriptions
phonétiques et la réalité observable, la correspondance
entre les transcriptions phonétiques et phonémiques ; nous
présentons ensuite les algorithmes qui formalisent et réalisent
cette correspondance.
Résumé. Nous étudions des points de vue syntaxique
et morphologique la transformation entre phrases verbales et phrases adjectivales
construites autour des adjectifs dérivés en -ant (L'ablette
frétille = L'ablette est frétillante). L'examen
de 1684 emplois verbaux définis dans des constructions intransitives
et transitives indirectes permet de recenser 280 exemples de ce type. Nous
constatons que cette dérivation transformationnelle est régulière
et productive dans la mesure où l'acceptabilité, la structure
et les propriétés de la phrase adjectivale se déduisent
le plus souvent de la phrase verbale. Mais cette régularité
et cette productivité ne sont pas absolues : certains empois verbaux
n'ont pas de dérivés en -ant (Cette plante végète,
*Cette plante est végétante), et dans de nombreux
cas, les propriétés de la phrase adjectivale ne sont pas
déductibles d'autres informations syntaxiques concernant la phrase
verbale. Il convient donc de noter, dans les tables, ces propriétés
des phrases adjectivales.
Abstract. One can note a growing need for natural language processing (NLP) systems able to cope with large texts. With this evolution, large NLP dictionaries are required. Constructors of dictionaries therefore have to pay attention both to extensive coverage and complete formalization of the data. An important type of lexicographical decision is whether to separate a set of homnographic words into distinct entries or to merge them into one entry. We examine criteria of separation in two cases: morpho-syntactic dictionaries and lexicon-grammars.
1994.
"Experiments in
Lexical Disambiguation Using Local Grammars", Papers
in Computational Lexicography, COMPLEX '94, Ferenc Kiefer, Gabor Kiss
and Julia Pajzs eds., Budapest: Linguistics Institute of the Hungarian
Academy of Sciences, pp.163-172.
Résumé. La levée d'ambiguïtés est l'un des principaux
défis auxquels sont confrontés les concepteurs de sustèmes d'étiquetage
de mots en vue du traitement du texte écrit. Les algorithmes de levée d'ambiguïtés
grammaticales réduisent le nombre d'étiquettes possibles. Nous considérons
dans cet article un cadre de travail dans lequel un
dictionnaire grammatical à large couverture est consulté pour associer
à chaque élément lexical du texte, mot simple ou mot composé, l'ensemble
des étiquettes grammaticales a priori possibles pour lui.
(Un tel cadre pout le français est maintenant intégré sous la forme
du système Intex.)
Ce problème a été exploré
par M. Silberztein (1989) et E. Roche (1992).
Nous donnons des descriptions formelles de leurs deux algorithmes.
Leur arrière-plan et leur objectif communs sont frappants.
Cependant, ils présentent de véritables différences formelles et pratiques.
Du point de vue formel, nous comparons la puissance expressive des
deux algorithmes. D'un point de vue pratique, nous examinons s'ils sont
plus particulièrement adaptés à un type spécifique d'ambiguïtés grammaticales.
Résumé. Cet article étudie un algorithme conçu et mis en oeuvre
par Roche pour l'analyse syntaxique de phrases en langues naturelles selon
une grammaire algébrique. Cet algorithme est fondé sur la construction
et l'utilisation d'un transducteur fini. Roche l'a appliqué avec
succès à une grammaire algébrique aux règles très nombreuses. En pratique,
habituellement, la complexité de l'analyse syntaxique de séquences
selon des grammaires algébriques est considérée, au contraire,
comme une fonction d'un unique paramètre : la longueur de la
séquence à analyser ; la taille de la grammaire est généralement
considérée comme une constante d'une taille raisonnable.
Dans cet article, nous expliquons d'abord pourquoi une grammaire
algébrique d'une couverture lexicale et grammaticale correcte
a nécessairement un très grand nombre de règles et nous évoquons les
travaux liés à ce problème. Nous illustrons le principe de l'algorithme
de Roche sur une petite grammaire. Nous définissons formellement la
construction de l'analyseur syntaxique et le déroulement de l'algorithme
et nous prouvons que la construction de l'analyseur syntaxique est
possible pour une importante classe de grammaires algébriques,
et qu'il donne comme résultat l'ensemble des arbres syntaxiques de
la séquence traitée.
Résumé. Nous présentons ELAG (élimination des ambiguïtés
lexicales par grammaires), un nouveau système de levée d'ambiguïtés
lexicales qui utilise des informations grammaticales sur les mots
du contexte. La levée des ambiguïtés s'effectue après l'analyse lexicale
du texte traité, mais avant l'analyse syntaxique. Les données linguistiques
du système sont organisées en modules séparés, compacts et lisibles,
que nous appelons des grammaires de levée d'ambiguïtés. Les effets
respectifs de plusieurs grammaires de levée d'ambiguïtés sur un texte
à traiter sont indépendants les uns des autres. Cette propriété
de la levée d'ambiguïtés est mathématiquement garantie par la formule
d'application des grammaires aux phrases. Les effets des grammaires
de levée d'ambiguïtés sont cumulatifs : si l'on écrit de nouvelles grammaires
et qu'on les utilise avec des grammaires existantes, les effets de
l'application de celles-ci ne sont pas modifiés. Plusieurs grammaires
peuvent s'appliquer à une même séquence, ou à des séquences qui
présentent un chevauchement, ou à des séquences incluses dans d'autres
séquences : leurs effets se cumulent. L'ordre d'application des grammaires
est indifférent. Les effets d'une grammaire sur les différentes analyses
d'une phrase sont indépendants. ELAG est compatible avec INTEX.
Résumé. La phonétisation, et d'autres problèmes de transcription
automatique liés à la phonétique, peuvent être effectués par des
outils fondés
sur les automates finis. Ce chapitre présente un système de transcription
par automates finis, BiPho, qui fait appel à des transducteurs et des
bimachines.
Les données linguistiques utilisées par ce système sont décrites dans un format
lisible et le calcul est efficace. Le système permet la phonétisation
du texte français écrit.
Résumé. La notion harrissienne de séquence appropriée
fournit un moyen syntaxique puissant d'analyser en détail le sens de nombreuses
phrases, y compris ambiguës. Dans une phrase adjectivale comme
Le lit était petit, l'introduction d'un nom approprié, ici
taille, spécifie la qualité décrite par l'adjectif.
Dans d'autres phrases adjectivales à nom approprié, ce nom joue le même
rôle que taille et semble pertinent à la description de l'adjectif.
Ces noms appropriés entrent généralement dans des phrases élémentaires
telles que Le lit avait une certaine taille, mais
ils ont souvent un modifieur plus ou moins obligatoire. Par exemple, on peut
difficilement mentionner qu'un objet a une certaine taille sans qualifier
celle-ci d'aucune manière. Environ 300 noms français sont appropriés dans au moins
une phrase adjectivale et ont un modifieur obligatoire. Ils entrent dans
un certain nombre de structures de phrases reliées par des transformations
syntaxiques. Le caractère approprié du nom et le caractère obligatoire
du modifieur se reflètent dans ces transformations. La description de
ces phénomènes syntaxiques fournit une base pour la classification de ces noms.
Elle concerne également les propriétés lexicales de milliers d'adjectifs
prédicatifs, et en particulier les relations entre la phrase sans nom :
Le lit était petit et la phrase adjectivale qui comporte le nom :
La taille du lit était petite.
Résumé. Nous passons en revue les objectifs utilisés,
les résultats atteints, les données construites et les méthodes
utilisées dans les domaines du traitement automatique des langues
où on peut considérer les mots comme l'unité fondamentale.
L'ambition de cette évaluation critique est de contribuer à
orienter les efforts de recherche et de développement dans une direction
aussi prometteuse que possible en termes de résultats applicatifs.
Résumé. Nous décrivons les modèles mathématiques sous-jacents à deux
méthodes de levée d'ambiguïtés lexicales par contraintes utilisant des
jeux d'étiquettes étendus et des automates finis.
Ce sont des variantes plus puissantes des méthodes décrites dans
Roche 1992 et Silberztein 1993. Toutes les deux ont un pouvoir
expressif équivalent à celui des automates finis.
Résumé. Nous présentons une structure de données très efficace
en espace et en temps d'accès pour stocker de très gros fichiers de données
sur les langues naturelles. La structure est décrite comme un arbre lexicographique
mis sous forme de liste chaînée et comprimé suivant la méthode de Ziv et
Lempel.
Cette technique de compression va au-delà de celle des automates finis acycliques.
Nous l'utilisons pour stocker le
DELAF,
un très grand dictionnaire du français qui associe à chaque mot
des informations lexicales grammaticales et syntaxiques. La structure comprimée
peut être produite en temps
O(N) en utilisant des arbres de suffixes pour trouver des répétitions
dans l'arbre lexicographique. Pour les grands fichiers de données, la consommation
de mémoire est plus préoccupante que le temps, c'est pourquoi nous utilisons plutôt des tableaux
de suffixes, avec un temps de compression de O(N log N)
pour tous les fichiers de données sauf le plus gros.
Résumé. Nous présentons un nouveau formalisme compatible avec
INTEX pour la description des
contraintes distributionnelles, ELAG. Ce formalisme permet de confronter les contraintes
à du texte et de lever ainsi une partie de son ambiguïté lexicale.
Nous décrivons les principales propriétés d'ELAG et nous les
illustrons par des exemples de règles simples formalisant des contraintes
exploitables. Nous spécifions en détail l'effet de l'application d'une
règle ou d'une grammaire ELAG à un texte. Nous examinons les
propriétés pratiques du formalisme du point de vue des auteurs de
règles. Nous décrivons notre procédure d'évaluation des
résultats de la levée d'ambiguïtés.
2000. "Mots et niveau lexical",
in J.M. Pierrel, éd., Ingénierie des langues. Série Informatique et systèmes d'information, Paris :
Hermès, pp. 25-49.
Résumé. Cet ouvrage fait partie d'un traité encyclopédique en 120 volumes,
intitulé Information - Commande - Communication et qui décrit l'état de l'art dans plusieurs domaines
de l'ingénierie. Le premier chapitre du volume sur l'ingénierie des langues est une synthèse qui montre
que le niveau lexical se trouve au centre des problématiques sous-jacentes à bon nombre d'enjeux applicatifs
(vérification et correction orthographiques, indexation, concordanciers etc.). Puis il présente les
principaux outils actuels, en termes de méthodes, de formalismes et de données, qui permettent de prendre
en charge ces aspects, avant de conclure en dessinant quelques directions de recherches actuelles, les
unes à forte dominante théorique, d'autres empiriques car fondées sur des travaux descriptifs "en vraie
grandeur", et d'autres encore qui misent sur la notion d'optimisation.
2000. "A Lingüística para o processamento das línguas",
Recortes Lingüísticos, A. Silva e M. Lins (eds.), Vitória,
Brésil : Saberes, pp. 67-75. Conférence prononcée
à l'Université fédérale de l'Espírito Santo, avril 2000.
Résumé. Ce chapitre est une synthèse à but pédagogique qui présente le lexique-grammaire et sa
place par rapport au traitement automatique des textes. Quelques exemples d'applications informatiques situent
les objectifs visés et les difficultés rencontrées. Le lexique-grammaire est introduit comme une méthode de
description syntaxique conçue pour donner des résultats suffisamment formels et suffisamment simples pour servir
de modèle sous-jacent à des traitements informatiques. Les principales notions qui permettent d'assurer cette
formalisation et cette simplicité sont :
- une orientation vers les faits directement observables, en l'occurrence l'acceptabilité ou l'inacceptabilité
des formes linguistiques, plutôt que vers le commentaire explicatif ou intuitif ;
- la notion de transformation syntaxique, qui permet de représenter des constructions syntaxiques de façon
différentielle par rapport à une construction prise comme référence ;
- la description systématique du lexique, rendue nécessaire par les différences de propriétés syntaxiques entre
entrées lexicales ;
- le choix de la phrase élémentaire, et non du mot isolé, comme cadre minimal de description.
Lorsqu'un traitement informatique du texte prend comme modèle sous-jacent le lexique-grammaire, les problèmes
informatiques rencontrés sont spécifiques, citons :
- la compression de lexiques avec accès rapide ;
- la traduction de tables de propriétés, élaborées à la main par les linguistes, en grammaires directement
applicables au texte ;
- la représentation compacte d'analyses hypothétiques concurrentes d'un même texte ;
- l'analyse syntaxique non déterministe, c'est-à-dire avec recensement des ambiguïtés.
Ce type de problèmes oriente vers certains domaines classiques de l'algorithmique plutôt que vers d’autres :
la théorie des automates finis, par exemple, intervient de façon récurrente, alors que le calcul des probabilités
n’est d’aucun secours.
Mots-clés : syntaxe, traitement des langues naturelles.
Résumé. Nous examinons plusieurs des problèmes rencontrés lors de
l'élaboration de systèmes de levée d'ambiguïtés lexicales, y compris des problèmes
liés aux analyses linguistiques sous-jacentes à ces systèmes, et nous les illustrons
par des exemples de contraintes grammaticales. Nous examinons
également plusieurs problèmes informatiques : l'influence de la granularité des jeux
d'étiquettes,
la définition d'objectifs réalistes et utiles, et la construction des données
nécessaires à la réduction des ambiguïtés, et nous montrons comment ils s'articulent
avec les problèmes linguistiques. Nous montrons pourquoi la réduction
automatique des ambiguïtés nécessite un formalisme, nous analysons sa fonction et nous
présentons une typologie de tels formalismes.
2001. Éric Laporte, Claude Martineau, Marc Zipstein.
Compactage des données,
Rapport final, Transweb 2, Université de Marne-la-Vallée, 12 p. + annexes.
Résumé. Ce rapport propose un algorithme de compression de textes permettant une interrogation
rapide des données comprimées. Cet algorithme est un élément essentiel d’un projet de traduction par textes mémorisés.
Nous avons adapté l'algorithme de Huffman à des données textuelles, en considérant les mots comme les éléments
d'un nouvel alphabet. Il a été nécessaire de distinguer deux sous-alphabets, l'un pour les mots de la langue,
l'autre pour les signes de ponctuation. Le texte comprimé est constitué de deux parties, l’une des deux servant
d’index d’accès à l’autre. L’index est comprimé sous la forme d’un arbre lexicographique, puis cet arbre est
à nouveau comprimé à l’aide de l’algorithme PPM d’ordre 2. Dans les essais effectués, le texte comprimé occupe
25 à 33 % du texte de départ, ce qui est comparable à l’algorithme PPM d’ordre 3 (24 à 32 % pour les mêmes textes),
mais avec l’accès rapide.
Mots-clés : compression de textes.
Maria Carmelita P. Dias, Éric Laporte, Christian Leclère, 2006. "Verbs with very strictly selected complements",
Collocations and Idioms: The First Nordic Conference on Syntactic
Freezes, University of Joensuu, Finland.
Résumé. Nous
étudions les caractéristiques et le comportement de deux classes
parallèles de verbes dans deux langues romanes, le français et le portugais.
On
peut citer comme exemples de ces classes le port. abater
[gado] et le fr. abattre [bétail],
qui ont le même sens. Dans les deux langues, la définition de la classe de
verbes inclut plusieurs propriétés :
- Ils ont un complément essentiel unique, qui est un objet direct.
- La distribution nominale du complément est très limitée, c'est-à-dire
que peu de noms peuvent être sélectionnés comme nom tête du complément.
Cependant, cette sélection n'est pas réduite à un nom unique, comme ce serait
le cas pour des expressions verbales figées telles que le fr. monter
la garde .
- Nous avons exclu de la classe les constructions qui sont des réductions
de constructions plus complexes, comme le port. afinar
[instrumento] com "accorder [instrument] avec".