2020 | Rinaldo José de Lima

Mai – Juin 2020

Rinaldo José de Lima holds a PhD in Computer Science from the Computing Center (CIn) of the Federal University of Pernambuco (UFPE) 2014. He is currently Prof. Deputy of the Department of Statistics and Infomation (DEINFO) of the Federal Rural University of Pernambuco (UFRPE). He was a Fellow, funded by CAPES, in the Sandwich Program Abroad (PDSE) held at the Laboratoire des Sciences de lnformation et des Systèmes in Marseille (LSIS), France. He completed his Master’s Degree in Computer Science at CIn / UFPE in 2009, part of which was held as a sandwich period at the LSIS. Participated in the Teaching Internship program in the years 2008 (in the undergraduate course) and 2012 (in the postgraduate course) CIn / UFPE in the discipline of Intelligent Systems under the guidance of Dr. Frederico Freitas. He has professional experience as a consultant in the Business Intelligence area, mainly in the Data Warehousing and Data Mining area, having developed Decision Support Systems for telecommunications companies. It has several publications in periodicals, magazines and international conferences.

He is coordinator of a research group in Text Mining at UFRPE, where he guides students of TCC and master’s degree. He acts as a coordinator of doctoral theses and dissertations at CIn / UFPE and is part of the ASSISTIVE research group that promotes the development of assistive and augmented communication applications.
His research areas of interest include: Information Extraction, Automatic Summarization of Texts, Feeling Analysis, Machine Learning, Data Mining, Database, Information Retrieval and Semantic Web.

Cours: Introduction to Information Extraction, 2h
Description: L’Extraction d’Information (EI) consiste à extraire automatiquement des informations structurées à partir de données textuelles, c.à.d., non-structurées. En tant que sous-domaine de la recherche en Fouille de Textes (FT), l’EI aussi concerne le traitement de textes en langage naturel en s’appuyant sur des techniques de Traitement Automatique des Langues (TAL). Parmi les tâches de base de grande pertinence pour de nombreux travaux de recherche en FT, on trouve la Reconnaissance d’Entités Nommées (REN) et l’Extraction de Relations (ER).Ce séminaire présentera brièvement les aspects historiques et évolutifs d’EI, puis on verra plus en détail les principales approches de REN et ER. Finalement, quelques travaux de l’état de l’art concernant ces sous-tâches seront discutés. Finalement, des outils d’EI en Python seront montrés et discutés.

Cours: Introduction to Inductive Logic Programming, 3h, (travaux pratiques en laboratoire)
Description: La Programmation Logique Inductive (PLI) combine l’apprentissage automatique et le formalisme basé sur la logique pour induire automatiquement des règles (prédicats en logique du premier ordre) à partir d’exemples multi-relationnels. De plus, la PLI permet également d’intégrer des connaissances préalables (Background Knowledge) représentées par des clauses en logique du premier ordre. Dans ce cours, nous offrons un aperçu général de la théorie de la PLI et ses aspects pratiques au travers de plusieurs articles scientifiques aussi discutés dans ce séminaire. Les étudiants seront incités à implémenter un modèle d’apprentissage supervisé avec la PLI en utilisant des outils PLI disponibles.

Séminaire: Ontology-Based Information Extraction with OntoILPER, 2h (1,5h présentation +0,5h discussion)
Description: Ce séminaire commence par présenter la recherche en Extraction d’Information et Peuplement d’ontologies menée avec la coopération du Professeur Bernard Espinasse du Laboratoire d’Informatique & Systèmes (LIS) de l’Université Aix-Marseille. Cette recherche propose une approche d’apprentissage supervisé de règles symboliques (logique du premier ordre) pour l’Extraction d’Entités Nommées et de Relations appelé OntoILPER. OntoILPER a été évalué sur plusieurs ensembles de données de référence avec des résultats compétitifs par rapport à d’autres systèmes EI basés sur des approches statistiques.

Séminaire: Aspect-based and Concept-based Sentiment Analysis, 2h (1,5h présentation + 0,5h discussion)
Description: Après un aperçu général de l’état de l’art en Analyse de Sentiments (AS) en Text Mining, nous nous focaliserons sur trois problématiques plus spécifique en AS de plus en plus étudiées récemment: (i) AS à base d’aspects qui comprend deux étapes principales : l’extraction d’aspects et la classification du sentiment relatif à chaque aspect, et (ii) les approches d’AS basées sur les ontologies et les ressources sémantiques.

Séminaire: Introduction to Automatic Summarization, 2h (1,5h présentation + 0,5h discussion) et Séminaire: Research works on Automatic Summarization at UFRPE/UFPE, 2h (1,5h présentation + 0,5h discussion)
Description: Le Résumé Automatique (RA) de texte consiste à faire la compression textuelle d’un document en ne conservant que les informations primordiales. Un RA est une version condensée d’un document textuel, obtenu au moyen de techniques informatiques qui préserve son contenu principal. Dans le premier séminaire, on discutera les concepts fondamentaux et les approches de résumé automatique. On présentera non seulement les aspects concernant l’évaluation de la tâche de RA mais aussi les différents types de RA, et leurs possibles applications. De plus, quelques publications sur le RA et les aspects concernant la redondance, la cohérence et la cohésion seront discutés.Dans le deuxième séminaire, nous allons présenter les principaux travaux de recherche sur le résumé automatique mono-document et multi-document menés par les équipes des universités UFPE/UFRPE. Cet exposé présentera aussi des ensembles de données de résumé automatique proposé par ces équipes.

Séminaire: Text Mining applications at TMG-UFRPE, 2h(1,5h présentation + 0,5h discussion)
Description: Ce séminaire présentera les travaux principaux de recherche (master/doctorat) menés dans l’Équipe Text Mining Group de l’Université Fédérale Rurale de Pernambuco (Brésil).Parmi ces travaux déjà publiés dans desrevues et conférences internationales, on distinguera les systèmes d’extraction d’entités et relations, analyse de sentiments, résumé automatique, communication améliorée et alternative, et cadre logiciel (framework) d’intégration d’annotation linguistique.