Information
Thesis supervisor :
Start year :
End2018
University :
Université Constantine 2
Viva defense
Viva defense date :
14 February 2024
Jury members :
Prof. Nacereddine ZAROUR
Prof. Abdelkrim BOURAMOUL
Prof. Hacene BELHADEF
Prof. Zineddine KOUAHLA
Prof. Brahim FAROU
Details
Titre :
Analyse des Sentiments dans un Contexte Multilingue à l'Aide de Techniques d'Apprentissage Automatique et de Traitement Automatique des Langages

Résumé :

L’analyse des sentiments est un domaine de recherche en constante évolution qui aborde une multitude de problématiques visant à fournir des solutions robustes et adaptées pour améliorer la performance dans divers contextes. Dans le cadre de cette thèse nous traitons la problématique du multilinguisme dans le domaine de l’analyse des sentiments, en présentant une série de contributions, à savoir Wilevel, GraLexi et SentiCode.

Dans la contribution Wilevel, nous avons proposé une taxonomie des contenus issus des médias sociaux en tenant compte de leurs caractéristiques linguistiques, suivie d’une approche pour segmenter ces différents types de contenus. Dans notre deuxième contribution, GraLexi, nous avons proposé une approche automatisée pour exploiter et unifier diverses ressources linguistiques en vue de créer un lexicon multilingue. Quant à notre troisième contribution, SentiCode, elle consiste en une approche permettant d’entrainer des modèles avec des algorithmes d’apprentissage automatique en une seule fois, en les rendant réutilisable dans d’autres langues, sans nécessité de réentraînement ni d’ajustement ou de faire appel à la traduction automatique.

L’objectif global est de développer un Framework, composé de modules caractérisés par nos contributions, pour une analyse des sentiments multilingues.


Mots clés :
Analyse des Sentiments Multilinguisme Apprentissage Automatique Traitement Automatique des Langues Lexicons Médias Sociaux Ressources Linguistiques.
Title:
Sentiment analysis in a multilingual context using machine learning and natural language processing techniques

Abstract:

Sentiment analysis is a continuously evolving research field that addresses a multitude of challenges with the aim of providing robust and tailored solutions to enhance performance in various contexts. In this thesis, we focus on the issue of multilingualism in sentimentanalysis and introduce a series of contributions, namely Wilevel, GraLexi, and SentiCode.

In our first contribution, Wilevel, we presented a taxonomy for social media content, taking into account its linguistic characteristics, followed by an approach to segment various types of content. In our second contribution, GraLexi, we proposed an automated approach to leverage and unify diverse linguistic resources to create a multilingual lexicon. As for our third contribution, SentiCode, it involves an approach for training models using machine learning algorithms in a one-time fashion, making them reusable in other languages without the need for retraining, adjustment, or relying on machine translation.

The overarching objective is to develop a comprehensive framework, comprised of modules characterized by our contributions, for multilingual sentiment analysis.


Keywords:
Sentiment Analysis Multilingualism Machine Learning Natural Language Processing Lexicons Social Media Linguistic Resources.