Séminaire au DIC: «Génération bilingue de textes à partir de données» par Guy Lapalme
Séminaire ayant lieu dans le cadre du doctorat en informatique cognitive, en collaboration avec le centre de recherche CRIA et l'ISC
Guy LAPALME
Jeudi le 24 octobre 2024 à 10h30
Local: PK-5115 (Il est possible d'y assister en virtuel en vous inscrivant ici)
TITRE : Génération bilingue de textesà partir de données
RÉSUMÉ
Après avoir rappelé ce qu'est la génération de texte, nous présenterons une méthode pour créer un texte en anglais et un autre en français à partir d'une unique source de données. Les étapes cruciales telles que la sélection des informations pertinentes et l'organisation du texte sont effectuées conjointement, tandis que le choix des termes et la structuration des phrases varient selon la langue. Les deux textes transmettront donc le même message. Cette approche s'appuie sur pyrealb, un réalisateur de phrases bilingue anglais-français. Son utilisation sera illustrée par quelques applications, p.ex. bulletins météo ou descriptions de matches sportifs. Nous terminerons en comparant ces résultats avec ceux obtenus avec un "grand modèle de langue"
BIOGRAPHIE
Guy LAPALME est professeur à l’Université de Montréal, spécialisé en traitement automatique du langage naturel (TALN). Ses recherches portent sur la génération de texte, la traduction automatique et l’interaction homme-machine dans les technologies linguistiques. Il a contribué au développement de systèmes de TALN et est reconnu pour son travail sur les outils facilitant la communication entre humains et ordinateurs.
RÉFÉRENCES
Lapalme, G. (2023). Data-to-Text Bilingual Generation. arXiv preprint arXiv:2311.14808.
Lapalme, G. (2020). The jsRealB Text Realizer: Organization and Use Cases--Revised version. arXiv preprint arXiv:2012.15425.
Date / heure
Lieu
Montréal (QC)
Prix
Renseignements
- Mylène Dagenais
- dic@uqam.ca
- https://www.dic.uqam.ca