Visualisations des thématiques d’un centre de recherche

Résumé :

Les mécanismes de financement et d’évaluation de la recherche ont conduit à une très forte croissance de la production d’articles scientifiques. Cette croissance a rendu difficile la recherche d’informations dans cette masse de données. Divers travaux dans le monde s’attachent à améliorer cette situation. Dans ce cadre, le département Traitement du Signal et des Images de Telecom ParisTech a entrepris un travail d’analyse sémantique des publications scientifiques de cet organisme au cours des cinq dernières années. Des méthodes assez classiques de traitement des langues naturelles combinées avec les travaux récents de description sémantique d’articles scientifiques permettent de proposer des regards nouveaux sur ces productions. Par exemple, il est possible des thématiques communes à des groupes chercheurs qui ne recoupent pas nécessairement la structure organisationnelle, essentiellement arborescente, des départements de recherche ou les rapprochements entre co-auteurs de publications. Il est également possible, par exemple, de visualiser l’évolution des thématiques pour des chercheurs ou des groupes de chercheur. Les visualisations proposées sont destinées à faciliter en interne les collaborations, notamment pour les nouveaux arrivants, et, à donner à l’extérieur une meilleure visibilité sur les résultats produits : recherche de spécialistes, coopération sur des projets… Le travail porte sur environ 4000 publications. Seulement 1200 environ sont directement disponibles sur la base de donnée interne à l’école. Pour les autres, divers problèmes, dont des problèmes de copyright, rendent l’accès plus complexe. La question de l’accessibilité des publications scientifiques sera abordée, mais pas traitée en profondeur. Nous verrons la chaine de traitement mise en œuvre, les données intermédiaires produites et les visualisations qui en sont issues. Nous montrerons comment la chaîne de production retenue se prête bien à l’ajout progressif des nouvelles publications et comment celle-ci pourrait être transposée à d’autres organismes ou d’autres activités.

Type de document :
Communication dans un congrès
SemWebPro, Nov 2016, Paris, France. SemWebPro, 2016
Liste complète des métadonnées

https://hal-imt.archives-ouvertes.fr/hal-01546072
Contributeur : Admin Télécom Paristech <>
Soumis le : vendredi 23 juin 2017 - 13:10:32
Dernière modification le : dimanche 25 juin 2017 - 01:07:17

Identifiants

  • HAL Id : hal-01546072, version 1

Citation

Jean-Claude Moissinac. Visualisations des thématiques d’un centre de recherche. SemWebPro, Nov 2016, Paris, France. SemWebPro, 2016. 〈hal-01546072〉

Partager

Métriques

Consultations de la notice

56