2016 | Plateforme Camomile d’annotation collaborative de documents multimédia

Nom du Projet logiciel: Camomile Polymer Client
Page web :https://github.com/camomile-project/camomile-polymer-client
Code source :https://github.com/camomile-project/camomile-polymer-client
Axe & tâche scientifique DigiCosme : DataSense
Porteur(s) du projet : Bredin Hervé
Nom & Prénom du Candidat : BEAUMONT Romain
Institition: LIMSI
Laboratoire gestionnaire: LIMSI
Équipes impliquées : TLP
Durée et dates de la mission : 01/11/2016 —> 30/06/2017


Contexte :
La plate­forme Camomile d’annotation collaborative de documents multimédia (image, audio, vidéo et texte) a été développée dans le cadre du projet CHISTERA éponyme (www.chistera.eu/projects/camomile) qui est arrivé à échéance en 2016. Elle répond au besoin grandissant qu’ont différents domaines scientifiques de l’axe DataSense en données annotées manuellement (traitement de la parole et du langage, vision par ordinateur, etc.).
Basée principalement sur les technologies Node.js, MongoDB et Docker, la plate­forme fournit une API REST facilitant la production d’interface (mobile ou web) de création, d’édition et de partage d’annotations de document multimédia (audio, vidéo, image, texte).
En 2015 et 2016, la plate­forme Camomile a servi de support à l’organisation d’une campagne d’évaluation portant sur l’identification de personnes dans les flux télévisées (tinyurl.com/zyq5cal).
Les projets CHISTERA JOKER (www.chistera.eu/projects/joker) et FUI GUIMUTEIC (www.guimuteic.fr/) ont aussi choisi la plate­forme pour annoter leurs propres données vidéos. Dans chacun de ces différents cas d’usage, un des développeurs de la plate­forme était impliqué de près ou de loin dans la mise en place de l’outil d’annotation.

Objectif :
L’objectif principal de cette mission doctorale est de pérenniser la plate­forme en fournissant les outils permettant de faciliter son apprentissage, pour ainsi réduire au maximum le délai entre le premier contact avec la plate­forme et son utilisation dans un cas d’usage réel. L’API REST fournie par la plate­forme Camomile est déjà documentée à l’adresse suivant : camomile­project.github.io/camomile­server. En outre, deux clients (Javascript et Python) sont aussi disponibles pour simplifier l’interaction avec cette même API.
Malgré la disponibilité de la documentation et des deux clients, un développeur cherchant à concevoir sa propre interface d’annotation basée sur la plate­forme Camomile sera confronté à une courbe d’apprentissage assez pentue. Il s’agit donc de concevoir un kit de démarrage fournissant une interface web simple et modulaire interagissant avec la plate­forme Camomile, ainsi qu’une documentation pédagogique.

Résultats attendus :
La réalisation de ce kit de démarrage vise à augmenter la diffusion de la plate­forme Camomile, en permettant de multiplier les cas d’usage de la plate­forme qui a été, jusqu’alors, essentiellement utilisée à des fins d’annotation pour le traitement automatique de séquences audiovisuelles. En particulier, la communauté “traitement du langage naturel” pourrait largement bénéficier d’une telle plate­forme d’annotation de ses corpus de texte. Nous anticipons aussi son utilisation en sciences humaines et sociales où l’aspect collaboratif de la plate­forme pourrait faciliter son usage dans un contexte de “crowd­sourcing”.

Plus-value apportée par ce financement :
Au travers de cette mission doctorale, l’étudiant a pu se familiariser avec de nombreuses nouvelles technologies très populaires dans le monde du développement web (Javascript, WebComponent, etc.) — ce qui sera un atout non négligeable pour le jeune chercheur qui vise une carrière industrielle.
Côté Camomile, ce financement a permis de pérenniser le travail effectué dans le projet éponyme et de relancer les activités d’annotation qui étaient en pause forcée depuis la fin du projet CHISTERA initial.