Le projet Asadera (Automatic Summarization for the All Digital ERA), financé intégralement par l’Agence Nationale de la Recherche et coordonné par Aurélien Bossard, maître de conférences à l’IUT de Montreuil – Université Paris 8, vise à étudier de nouvelles formes de résumé automatique afin de répondre à de nouvelles problématiques introduites par la mondialisation de l’information numérique ou numérisée, et le passage au numérique de documents de spécialité, notamment dans les systèmes d’information.
Le projet Asadera court du 01/10/2016 au 31/09/2019. Il est divisé en trois parties distinctes :
- WP1 : un outil open source pour le résumé automatique ;
- WP2 : résumé comparatif cross-lingue et multilingue ;
- WP3 : ressources spécifiques pour le résumé automatique de documents spécialisés.
WP1 : un outil open source pour le résumé automatique
Le WP1 consiste à développer un outil open source pour le résumé automatique. Il n’existe en effet aujourd’hui aucune plateforme de résumé automatique qui intègre les méthodes statistiques de l’état de l’art, ni qui propose d’intégrer une nouvelle méthode afin de l’évaluer aisément.
La plateforme de résumé automatique proposée répondra aux manques évoqués ci-dessus et servira de point de départ aux WP2 et WP3. De plus, cette plateforme sera accessible sous forme de webservice sur ce même site dès juillet 2017.
WP2 : résumé comparatif cross-lingue et multilingue
La mondialisation de l’information numérique apporte à la fois son lot de nouvelles possibilités et de défis. Parmi les nouvelles possibilités offertes par l’aspect international et massif de l’information numérique, l’analyse automatique de documents rédigés dans des langues différentes est sûrement l’une de celles qui ouvrira le plus de débouchés tout en apportant son lot de difficultés scientifiques.
Des documents rédigés dans des langues différentes (tout comme des documents rédigés dans une seule et même langue) peuvent exhiber des différences frappantes de traitement d’une même information. Pouvoir identifier ces différences, et les proposer à un utilisateur sous la forme d’un résumé peut avoir des retombées intéressantes dans le domaine de la veille d’information et dans les sciences humaines et sociales en général.
Le WP2 tente de répondre à ces questions : comment identifier des différences dans le traitement d’une même information au sein de documents écrits dans des langues différentes mais traitant du même sujet, et comment présenter efficacement ces différences à l’utilisateur final.