Dans le cadre du cycle d’ateliers Migrations et Big Data, le département Dynamics de l’ICM vous propose une troisième et dernière formation intitulée :
« Analyse automatique de données textuelles »
Intervenant : Thomas Renault, maître de conférences à l’Université Paris 1 Panthéon-Sorbonne
Objectif : Introduction aux outils et méthodes pour l’analyse automatique de données textuelles
Descriptif : A travers cette formation, nous verrons comment analyser de manière automatique des textes et documents (articles, rapports, tweets…) afin de construire des indicateurs quantitatifs qui pourront ensuite être utilisés dans diverses applications empiriques.
Nous apprendrons à utiliser des méthodes d’analyse textuelle pour identifier les mots et groupes de mots les plus utilisés dans un corpus de texte. Nous utiliserons ensuite un dictionnaire contenant une liste de mots positifs et une liste de mots négatifs afin de calculer un indicateur de sentiment à partir de la fréquence relative des mots contenus dans un document. Les méthodes plus avancées (machine learning, modèle de langage, topic modeling) seront présentées en fin de formation afin de donner un aperçu de l’état de l’art de l’analyse textuelle.
Cette formation sera centrée sur la transmission de savoir-faire pratiques – les participant-es seront invité-es à manipuler les données, à coder – et sur l’utilisation du langage de programmation Python et une librairie d’analyse textuelle (NLTK).
Public et pré-requis : chercheur-euses en Sciences humaines et sociales – ayant si possible des bases en programmation informatique - souhaitant intégrer de l’analyse textuelle à leurs propres protocoles de recherches.
Durée : 3 heures
Date et lieu de la formation : Vendredi 21 octobre 2022 de 14h à 17h, site Ulm du Collège de France, Paris 5ème.
Inscriptions obligatoires : Vous pouvez vous inscrire via ce formulaire. Les places pour assister à la formation en présentiel étant déjà toutes prises, vous pouvez néanmoins vous inscrire via ce lien si vous souhaitez suivre la formation à distance via Zoom.