Nom du Projet logiciel: Camomile Polymer Client
Page web :https://github.com/camomile-project/camomile-polymer-client
Code source :https://github.com/camomile-project/camomile-polymer-client
Axe & tâche scientifique DigiCosme : DataSense
Porteur(s) du projet : Bredin Hervé
Nom & Prénom du Candidat : BEAUMONT Romain
Institition: LIMSI
Laboratoire gestionnaire: LIMSI
Équipes impliquées : TLP
Durée et dates de la mission : 01/11/2016 —> 30/06/2017
Contexte :
La plateforme Camomile d’annotation collaborative de documents multimédia (image, audio, vidéo et texte) a été développée dans le cadre du projet CHISTERA éponyme (www.chistera.eu/projects/camomile) qui est arrivé à échéance en 2016. Elle répond au besoin grandissant qu’ont différents domaines scientifiques de l’axe DataSense en données annotées manuellement (traitement de la parole et du langage, vision par ordinateur, etc.).
Basée principalement sur les technologies Node.js, MongoDB et Docker, la plateforme fournit une API REST facilitant la production d’interface (mobile ou web) de création, d’édition et de partage d’annotations de document multimédia (audio, vidéo, image, texte).
En 2015 et 2016, la plateforme Camomile a servi de support à l’organisation d’une campagne d’évaluation portant sur l’identification de personnes dans les flux télévisées (tinyurl.com/zyq5cal).
Les projets CHISTERA JOKER (www.chistera.eu/projects/joker) et FUI GUIMUTEIC (www.guimuteic.fr/) ont aussi choisi la plateforme pour annoter leurs propres données vidéos. Dans chacun de ces différents cas d’usage, un des développeurs de la plateforme était impliqué de près ou de loin dans la mise en place de l’outil d’annotation.
Objectif :
L’objectif principal de cette mission doctorale est de pérenniser la plateforme en fournissant les outils permettant de faciliter son apprentissage, pour ainsi réduire au maximum le délai entre le premier contact avec la plateforme et son utilisation dans un cas d’usage réel. L’API REST fournie par la plateforme Camomile est déjà documentée à l’adresse suivant : camomileproject.github.io/camomileserver. En outre, deux clients (Javascript et Python) sont aussi disponibles pour simplifier l’interaction avec cette même API.
Malgré la disponibilité de la documentation et des deux clients, un développeur cherchant à concevoir sa propre interface d’annotation basée sur la plateforme Camomile sera confronté à une courbe d’apprentissage assez pentue. Il s’agit donc de concevoir un kit de démarrage fournissant une interface web simple et modulaire interagissant avec la plateforme Camomile, ainsi qu’une documentation pédagogique.
Résultats attendus :
La réalisation de ce kit de démarrage vise à augmenter la diffusion de la plateforme Camomile, en permettant de multiplier les cas d’usage de la plateforme qui a été, jusqu’alors, essentiellement utilisée à des fins d’annotation pour le traitement automatique de séquences audiovisuelles. En particulier, la communauté “traitement du langage naturel” pourrait largement bénéficier d’une telle plateforme d’annotation de ses corpus de texte. Nous anticipons aussi son utilisation en sciences humaines et sociales où l’aspect collaboratif de la plateforme pourrait faciliter son usage dans un contexte de “crowdsourcing”.
Plus-value apportée par ce financement :
Au travers de cette mission doctorale, l’étudiant a pu se familiariser avec de nombreuses nouvelles technologies très populaires dans le monde du développement web (Javascript, WebComponent, etc.) — ce qui sera un atout non négligeable pour le jeune chercheur qui vise une carrière industrielle.
Côté Camomile, ce financement a permis de pérenniser le travail effectué dans le projet éponyme et de relancer les activités d’annotation qui étaient en pause forcée depuis la fin du projet CHISTERA initial.