2018 | Extraction, Représentation et Visualisation de connaissance pour l'Enseignement Numérique ERVEN

Axe: DataSense; Tâche 2
Coordinateur : Anne-Laure Ligozat (LIMSI, CNRS)
Objectif : L’objectif de ce groupe de travail est d’étudier comment exploiter ces données dans des environnements pédagogiques pour l’enseignement supérieur : quelles possibilités s’ouvrent d’un point de vue pédagogique si l’on intègre les ressources et méthodes informatiques permettant d’exploiter ces données ? Quelles pistes de recherche les applications pédagogiques créent-elles ? Quelle prise en compte des traces des apprenants ? De plus, l’idée est de partager et collecter des corpus par leur implémentation dans une plate-forme de e-education, afin de produire un cadre expérimental venant en support au groupe de travail.
Productions Scientifiques :
Financement Labex en : 2017-2018

Présentation :
Nous nous concentrerons dans le groupe de travail sur les travaux de recherche qui ont été menés en informatique, plus particulièrement dans le domaine du traitement automatique des langues (TAL), de la représentation des connaissances, de la visualisation d’informations et des EIAH (Environnements Informatiques pour l’apprentissage Humain), et qui pourraient permettre d’améliorer l’expérience des apprenants voire des enseignants. Comme cadre d’application, nous envisageons les applications pédagogiques suivantes, dans la mesure où elles requièrent de faire collaborer des approches relevant des différents domaines cités :

génération de QCM;
correction semi-automatique de réponses ouvertes ;
modélisation de l’évolution de l’acquisition des connaissance par les étudiants lors de leur parcours dans la plateforme ;
visualisation des connaissances du domaine d’apprentissage.

Équipes concernées et liste des participants:

Équipes du LIMSI :
- Équipe ILES (Brigitte Grau, Gabriel Illouz, Anne-Laure Ligozat)
- Équipe AMI (Frédéric Vernier)
- Équipe TLP (Alexandre Allauzen)
Équipes du LRI :
- Équipe LaHDAK du LRI : Philippe Dague, Yue Ma, Brigitte Safar, Fatiha Saïs
- Équipe MODHEL du LRI : Yolaine Bourda, Fabrice Popineau
SAMOVAR, Telecom SudParis :
- Amel Bouzeghoub

Productions Scientifiques/ Publications :

Séminaires

Jeudi 22 novembre 2018
- Le GT ERVEN reçoit le professeur Mathieu d’Aquin, spécialiste en analyse de données et des technologies sémantiques au Insight Centre for Data Analytics de la National University of Ireland Galway. Son intervention sera centrée sur « l’analyse de données pour l’analyse de l’apprentissage en ligne ».
Jeudi 27 septembre 2018
Kick-off – Mercredi 31 janvier 2018 à 14h au LIMSI en salle du conseil

Certains participants à ce groupe de travail étaient par ailleurs impliqués dans l’axe e-Education dans le cadre de ISN (Institut de la Société Numérique). L’axe e-Education ne nous semble plus représenté dans Paris-Saclay, alors qu’il s’agit d’un axe sociétal et économique très important. Le groupe de travail ERVEN permettrait de reprendre ce positionnement au niveau De DIGICOSME. Enfin, le groupe de travail permettrait de renforcer ces collaborations en les ancrant dans un cadre applicatif qui est destiné à se développer très rapidement.Ce groupe de travail présentera des proximités avec le groupe de travail D2K sur les aspects extraction d’information, mais appliqués au domaine pédagogique, ainsi qu’avec le groupe de travail TALSEM pour les aspects reconnaissance de similarités textuelles.

Perspectives :
CDD ingénieur de recherche adossé au GT – Développement d’interfaces Moodle avec programmes de recherche

Responsable Scientifique :
- Gabriel Illouz
Candidat(e) : à déterminer
Période du contrat (date de début et fin): mi-2018
Objectif : Développement d’interfaces Moodle avec programmes de recherche
Outils développés : Les résultats attendus sont la mise en place d’une plateforme expérimentale partagée, qui permettra de mener des expériences. Les développements prendront la forme de programmes soit intégrés à la plateforme, soit permettant d’intégrer facilement des développements effectués dans des laboratoires au code de Moodle.
Perspectives : Les utilisateurs finaux ciblés sont les enseignants utilisant Moodle, et les chercheurs et enseignants-chercheurs pour l’intégration de leurs programmes de recherche. Dans un premier temps, il s’agira des enseignants de l’Université Paris Saclay, mais nous souhaitons étendre ensuite l’utilisation plus largement. Le code sera testé par plusieurs participants du groupe de travail, à la fois d’un point de vue recherche (par exemple, ajout d’une nouvelle mesure de similarité textuelle), et d’un point de vue enseignement.

Les spécifications, le suivi de l’avancement, les tests et les remontées des utilisateurs seront gérés via un environnement de gestion de développement logiciel adapté (gitlab par exemple).

Résumé du projet :
La mission principale du CDD ingénieur sera l’animation du volet expérimental du Groupe de travail ERVEN. Cette mission s’articule selon 2 axes principaux : la maintenance de la plateforme Moodle commune permettant de partager données et code et le développement de modules spécifiques (passage de l’état de prototypes à celui de modules finalisés et robustes). Il s’agira également de créer des interfaces entre Moodle et des programmes de recherche en traitement automatique des langues, représentation de connaissances et visualisation d’information.

Maintenance de la plateforme

Il s’agira de maintenir à jour la plateforme Moodle, de communiquer avec la communauté de développeurs Moodle, et de garantir la sécurité, le stockage et l’accessibilité des expériences.

Il sera envisagé une réflexion sur la distribution plus large (en dehors du groupe de travail) des données ayant été anonymisées. Cette distribution permettrait de mettre au point des défis de correction automatique que ce soit dans le cas des masters d’apprentissage, ou encore pour confronter nos méthodes automatiques à d’autres équipes de recherche.

Développements spécifiques

De nombreux prototypes existent, correspondant à plusieurs types de travaux, et pourraient être intégrés à Moodle ou finalisés:

Intégration d’ontologie de connaissances (rendre possible l’import et l’export) depuis protégé (https://protege.stanford.edu/) par exemple;
Module de visualisation d’apprentissage qui permettra des visualisations pertinentes d’un apprentissage selon une représentation d’un domaine de compétence (représenté sous forme d’ontologie). %des réflexion autour d’un espace pourront être envisagé.

Cela permettra à l’enseignant ou à l’étudiant de choisir des tests portants sur tout ou partie des concepts que l’étudiant ne maîtrise pas; %Il s’agira d’un nouveau module.

Aide à la correction automatique en utilisant des méthodes de reconnaissance de paraphrases;
Module de génération de test selon une liste de concepts à valider. Ce module devra, en fonction d’une liste de concepts, générer des questions portant sur ces concepts.

Certains prototypes seront intégrés à la plateforme sous forme de plugins. C’est notamment le cas des prototypes de gestion des ontologies, qui constitueront les modules prioritaires. D’autres pourront faire appel à des programmes externes, ce qui impliquera la mise en place d’une architecture adaptée.