Visualisations des thématiques d’un centre de recherche - IMT - Institut Mines-Télécom Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Visualisations des thématiques d’un centre de recherche

Résumé

Les mécanismes de financement et d’évaluation de la recherche ont conduit à une très forte croissance de la production d’articles scientifiques. Cette croissance a rendu difficile la recherche d’informations dans cette masse de données. Divers travaux dans le monde s’attachent à améliorer cette situation. Dans ce cadre, le département Traitement du Signal et des Images de Telecom ParisTech a entrepris un travail d’analyse sémantique des publications scientifiques de cet organisme au cours des cinq dernières années. Des méthodes assez classiques de traitement des langues naturelles combinées avec les travaux récents de description sémantique d’articles scientifiques permettent de proposer des regards nouveaux sur ces productions. Par exemple, il est possible des thématiques communes à des groupes chercheurs qui ne recoupent pas nécessairement la structure organisationnelle, essentiellement arborescente, des départements de recherche ou les rapprochements entre co-auteurs de publications. Il est également possible, par exemple, de visualiser l’évolution des thématiques pour des chercheurs ou des groupes de chercheur. Les visualisations proposées sont destinées à faciliter en interne les collaborations, notamment pour les nouveaux arrivants, et, à donner à l’extérieur une meilleure visibilité sur les résultats produits : recherche de spécialistes, coopération sur des projets… Le travail porte sur environ 4000 publications. Seulement 1200 environ sont directement disponibles sur la base de donnée interne à l’école. Pour les autres, divers problèmes, dont des problèmes de copyright, rendent l’accès plus complexe. La question de l’accessibilité des publications scientifiques sera abordée, mais pas traitée en profondeur. Nous verrons la chaine de traitement mise en œuvre, les données intermédiaires produites et les visualisations qui en sont issues. Nous montrerons comment la chaîne de production retenue se prête bien à l’ajout progressif des nouvelles publications et comment celle-ci pourrait être transposée à d’autres organismes ou d’autres activités.
Fichier non déposé

Dates et versions

hal-01546072 , version 1 (23-06-2017)

Identifiants

  • HAL Id : hal-01546072 , version 1

Citer

Jean-Claude Jc Moissinac. Visualisations des thématiques d’un centre de recherche. SemWebPro, Nov 2016, Paris, France. ⟨hal-01546072⟩
191 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More