Thématique PUD

Le 1er et 2 juin 2022 a eu lieu deux demi-journées d'études sur le thème des données en SHS et plus particulièrement sur l'intérêt de Wikidata dans le monde de la science (voir le site de l'événement).

Cet événement est le premier organisé par la PUD de Clermont-Ferrand, depuis sa création le 1er septembre 2021. Le directeur de L'IR* PROGEDO, Sébastien OLIVEAU ainsi que Nicolas VIGNERON ont également fortement contribué à la tenue de ces journées.

Le déroulement a été le suivant :

  • 1 demi-journée de conférences avec 3 interventions de chercheurs expliquant comment ils ont obtenu leurs données pour ensuite produire des résultats.
  • 1 demi-journée d'atelier pratique, où le public va s'initier au langage SPARQL permettant d'extraire des données sur Wikidata à partir de requêtes. Le logiciel R sera également utilisé pour importer les données Wikidata pour ensuite réaliser plusieurs sorties graphiques.

Des retours d'expériences (1er juin 2022, 14h-17h)

Une après-midi fut consacrée exclusivement aux témoignages de 3 intervenants. Tout d'abord Baptiste COULEMONT, professeur en sociologie qui a notamment travaillé sur la sociologie des prénoms. Victor GAY, un enseignant chercheur en histoire économique dont l'intitulé de son intervention est : "L'Écosystème TRF-GIS : un système d'information géographique de la Troisième République". Enfin la journée a été conclue avec l'intervention de Yoann DOIGNON, maître de conférences à l'université de Strasbourg. Il a notamment expliqué comment il a réussi à construire une base de données spatio-temporelle et multi-sources pour comprendre l'évolution de la population belge.

Ces présentations ont bien entendu été suivies d'échanges avec le public et notamment avec Nicolas VIGNERON, wikimédien en résidence qui a apporté des solutions/améliorations/remarques avec ce que permet de faire Wikidata dans la recherche et la collecte de données.

Atelier pratique : SPARQL & Visualisation sur le logiciel R (2 juin 2022, 9h-12h)

Durant tout une matinée, la vingtaine de personnes présentes dans le public a pu découvrir (ou revoir) le langage SPARQL rendant possible l'extraction de données depuis Wikidata.

Nicolas VIGNERON a fourni quelques exemples de requêtes bien précises, comme par exemple compter le nombre de naissance de toutes les femmes s'appelant "Maria" dans le monde. Ou encore afficher toutes les rues de paris ayant un nom genré et où l'on précise le genre et la personne à laquelle fait écho la rue.

Dans un deuxième temps, c'est moi-même (Axel DELARUE, ingénieur à la PUD de Clermont-Ferrand) qui a fait une démonstration sur le logiciel R dans laquelle j'ai montré comment importer des données Wikidata dans R et comment les visualiser.