Ateliers Migrations et Big Data : Formation « Web scraping avec Python » – 11 mai 2022

Dans le cadre du cycle d’ateliers Migra­tions et Big Data, le dépar­te­ment Dyna­mics vous propose une forma­tion inti­tulée « Web Scra­ping avec Python » 

Inter­ve­nant : Thomas Renault, maître de confé­rences à l’Uni­ver­sité Paris 1 Panthéon-Sorbonne

Objectif : Intro­duc­tion aux outils et méthodes pour l’ex­trac­tion auto­ma­tique de données en ligne (web scra­ping)

Descriptif : A travers cette forma­tion, nous verrons comment consti­tuer des bases de données à partir de contenu publié sur Internet et comment ce contenu peut être analysé afin de répondre à des ques­tions de SHS.

Nous appren­drons à utiliser une méthode de web scra­ping afin d’ex­traire de manière auto­ma­tique le contenu d’une page Web. Nous réali­se­rons un exer­cice pour extraire le contenu d’une page Wiki­pédia et d’une page d’un média en ligne (Le Monde).

Cette forma­tion sera centrée sur la trans­mis­sion de savoir-faire pratiques – les parti­ci­pant-es seront invité-es à mani­puler les données, à coder – et sur l’utilisation du langage de program­ma­tion Python et une librairie de web scra­ping (Beau­ti­ful­Soup).

[NB : L’analyse des données extraites à l’aide d’ou­tils de trai­te­ment auto­ma­tique des langues sera traitée dans une autre formation]

Public et pré-requis : cher­cheur-euses en Sciences humaines et sociales – ayant si possible des bases en program­ma­tion infor­ma­tique - souhai­tant inté­grer de nouvelles données issues du web scra­ping à leurs propres proto­coles de recherches.

Durée : 4 heures

Date et lieu de la forma­tion : Mercredi 11 mai 2022 de 14h à 18h, site Ulm du Collège de France, Paris 5ème

Inscrip­tions obli­ga­toires : Vous pouvez vous inscrire via ce formu­laire. Le nombre de places étant limité, seront inscrits en prio­rité à cette forma­tion les fellows Dyna­mics et les docto­rants de l’ICM.

Notes : Les parti­ci­pant-e‑s devront venir avec leur ordi­na­teur portable et avoir préa­la­ble­ment télé­chargé et installé Python.

Cette forma­tion aura lieu en présen­tiel. Il vous sera précisé ulté­rieu­re­ment s’il sera possible de suivre la forma­tion à distance en cas d’im­pos­si­bi­lité d’être présent.

Si vous avez des ques­tions sur le contenu de la forma­tion, n’hésitez pas à me contacter (audrey.​lenoel@​college-​de-​france.​fr).