WikiArchives/Crotos-et-Palladia
Nous remercions notre intervenant Benoît Deshayes d’avoir accepté notre invitation à nous présenter Palladia, moteur de recherche et d’exploration d’une partie des collections du Musée Saint-Raymond, qui s’appuie sur Wikidata et Wikimedia Commons. Au travers de ce cas de réutilisation, nous remonterons sur les projets Wikimedia, les ressources disponibles et les structurations documentaires. Nous tâcherons d’aborder l’apport essentiel que les institutions patrimoniales peuvent apporter à ce bien commun.
Intervenant·e·s
[edit]Benoît Deshayes à l’état civil, né en 1977, est Shonagon sur les projets Wikimédia. Il contribue, surtout depuis 2012, sur les contenus culturels essentiellement, au sein des projets Wikidata et Wikimedia Commons. De 2002 à 2015, il a travaillé à la Réunion des musées nationaux, notamment en charge de sites web et de catalogues de collections en ligne. En 2015-2016, il a passé un peu plus d’une année à la Bibliothèque nationale de France. Depuis 2016, il travaille au musée du Louvre, en charge de la maintenance des sites louvre.fr et copilote le futur site des collections du musée. Depuis 2015, il donne un cours Wikidata et SparQL à l’École de bibliothécaires documentalistes (EBD). Il fait régulièrement des présentations publiques sur le sujet des GLAM et des projets Wikimedia (Wikidata en particulier). Les quelques billets de son blog Dozo portent essentiellement sur les problématiques des données culturelles et Wikidata : http://zone47.com/dozo/
Présentation du projet
[edit]Palladia est un moteur de recherche et d’exploration d’une partie des collections du Musée Saint-Raymond qui s’appuie sur Wikidata et Wikimedia Commons sur le modèle de Crotos.
Les origines de Crotos :
- 2012 Une expérimentation a été réalisée en 2012 sur DBpedia [fr] sur les œuvres d'art.
- début 2014 une première version version de Crotos est publiée dans le contexte du concours Sémanticpedia. Cette version s'appuie sur DBpedia [fr].
- printemps 2014 Crotos bascule de DBpedia [fr] à Wikidata. La réalisation s'accompagne d'un important mouvement de contribution sur Wikidata d'identification d'éléments, de typage, d'ajout d'images, de métadonnées. Par exemple, Crotos utilise un ordre chronologique. Or sur ~9000 œuvres repérées, il y en avait ~300 avec date ; en quelques semaines, on passe à 8000 grâce aux données de DBpedia
- été 2015. Mise à jour majeure de Crotos avec ajouts (visionneuse, autocomplétion, mise en page, enrichissements documentaires...)
- Dwynwen, le moteur de recherche d'images de la Bibliothèque nationale du pays de Galles réalisé à la demande de Jason Ewans est sorti en mars 2019.
- Palladia est sorti en mars 2020.
Fonctionnalités
[edit]- multilinguisme : il est possible d'effectuer des requêtes dans différentes langues dans la mesure où les items Wikidata possèdent des traductions.
- notices riches : les métadonnées sont récupérées de Wikidata. La logique d'entités permet la mise en place de liens transverses (indexation iconographique, nature de l'objet, artiste, exposition,...)
- visualisation sous forme de cartes : par lieux de découverte ou de création des objets pour Palladia, par lieux représentés pour Dwynwen.
- reconstitution d'expositions via Crotos. ex : exposition Claude, un empereur singulier à Lyon
- liens d'accès aux bases sources faisant autorité : éléments liées aux notices du catalogue de la bibliothèque nationale du Pays de galles pour Dwynwen, à la base Joconde et aux sites du Musée Saint-Raymond pour Palladia.
- mise en place de liens vedettes. Wikidata faisant hub de ressources, sur un élément sont souvent référencés de nombreux liens externes. Un mécanisme de lien vedette a été mis en place. Sur Crotos, le lien renvoie de façon privilégiée vers la ressource en ligne de l'institution de conservation. Par exemple La Madone d'Alba de Raphaël renvoie vers la page dédiée de National Gallery of Art.
- images Haute-Défintion. Crotos offre un filtre permettant de limiter les résultats aux œ uvres avec images en HD. Exemple : Œuvres avec image HD de Sandro Botticelli
Questions lors du live
[edit]Palladia c’est un sous-projet de Crotos ? Ou c’est une instance différente ?
- Crotos, Palladia et Dwynwen sont des instances différentes. Chaque site a par exemple son rythme de mise à jour. Une partie des scripts sont communs, d'autres sont spécifiques.
Comment ça marche ces moteurs de recherche ? Comment on extrait les données de Wikidata et Wikimédia pour les inclure dans cette base ?
- Le moteur de recherche s'appuie sur les données récoltées de Wikidata. Il y a une compilation préalable qui permet de favoriser l'autocomplétion en s'appuyant sur les données (nombre d’œuvres, nombre d'articles wikipédia).
Les données sont récupérées de Wikidata en utilisant différentes API des projets Wikimedia (SparQL Endpoint, Wikimedia API, API Commons). Les fichiers images ne sont pas récupérés mais les dimensions et le ratio hauteur/largeur sont récoltés et nécessaires pour le mode de mise en page des résultats. Il faut bien connaître la structure des données sur Wikidata pour les réutiliser. Une granularité trop fine ne facilite pas les réutilisations.
Pour l'affichage général, l'affichage des résultats. Est-ce récupérable, paramétrable ?
- Le site a plutôt vocation à être un moteur de recherche et d'exploration. Il existe néanmoins une interface pour récupérer des données en forme tabulaire (CSV). Celle-ci a été développée avant la sortie du point d'accès SparQL de Wikidata. Comme ce service SparQL répond très bien au besoin de récupérer des données structurées, le service dédié de Crotos n'est plus maintenu mais fonctionne encore (exemple : liste paramétrable et téléchargeable des œuvres de Botticellli)
OpenArtBrowser est un autre (rare) exemple de frontend sympathique réutilisant les données d'oeuvres d'art publiées sur les projets Wikimedia.
Propriétés utilisées pour les éléments du Musée Saint-Raymond : cette requête a permis de définir les différents critères de recherche et de créer un accès spécifique pour les objets possédant par exemple un modèle 3D, des inscriptions, un article Wikipédia, un lieu de découverte...
Pareillement, sur Dwynwen, les entrées ont été déterminées en rapport avec les richesses éditoriales d'ensemble. Ainsi le site présente une carte présente les lieux décrits, il y a notamment des entrées d'exploration sur les œuvres par publication ou par collection.
Contribution des institutions patrimoniales aux projets Wikimédia
[edit]Dwynwen a été réalisé sur la judicieuse suggestion de Jason Evans. Palladia a été fait spontanément peu de temps après. C'est après coup, que s'est révélé le point commun entre ces deux institutions, pourtant déjà évoqué : il y a en leur sein des personnes qui œuvrent directement à la contribution sur les projets Wikimedia. Ces deux interfaces ne font que révéler et utiliser une documentation riche produite par les personnels des institutions en collaboration avec les wikimédiens et les wikimédiennes. L'important travail documentaire sur les métadonnées s'est accompagné de versements massifs d'images sous licence libre sur Wikimedia Commons.
Ces contributions institutionnelles sont le signe d'une nouvelle pratique professionnelle, évoquée notamment par Marie D Martel dans son billet Le modèle d’une pratique professionnelle alternative à bâtir avec les GLAMs et Jason Evans dans Becoming a National Wikimedian: Jason Evans and the National Library of Wales. En complément, on peut remarquer que l'open data et l'open content ne suffisent pas. Certes il manque encore des contenus –on ne peut traiter correctement l'art pariétal faute d'images libres disponibles par exemple– mais les fonds libres disponibles sont déjà très importants, trop pour espérer que des bénévoles puissent tout bien documenter et ingérer. Si une institution a une volonté stratégique, en phase avec ses missions, de diffuser et documenter les ressources qu'elle produit au sein des projets Wikimédia, elle a tout intérêt à s'en donner les moyens et à le faire elle-même en collaboration avec les communautés des projets Wikimédia.
Pour Palladia et Dwynwen, la grande qualité éditoriale des contributions documentaires a favorisé la création d'interfaces spécifiques. La documentation fine des expositions, des inscriptions, les versements de modèles 3D du musée Saint-Raymond, l'indexation iconographique des œuvres de la bibliothèque nationale du Pays de Galles, les regroupements par publication... Tout le matériau était déjà présent et ces deux sites spécifiques, Palladia et Dwywen, ne sont qu'un aboutissement possible de ces ressources disponibles dans un bien commun informationnel accessible à tous.
Compléments
[edit]- Benoît Deshayes Wikimedia, Wikidata et Institutions patrimoniales (GLAM). Présentation aux journées GLAMWiki CH en 2019
- Benoît Deshayes Arts Visuels sur Wikimedia Commons et Wikidata. Présentation au colloque Images/usages le 25/10/2018 à l'INHA
- Benoît Deshayes Wikidata, une nouvelle ressource pour l’Histoire de l’art. Présentation au colloque Digital Art History le 14/06/2016 à l'INHA
- Benoît Deshayes La documentation d'expositions sur Wikidata
- Christelle Molinié Collaboration entre musées et projets Wikimédia pour le partage du patrimoine culturel
- Christelle Molinié Objectif LOD : comment et pourquoi ouvrir et lier les données des musées p.139-156
- Christelle Molinié Médiation documentaire et documentation participative à travers les projets Wikimédia : retour d'expérience au musée des Augustins de Toulouse
- Alyx Taounza-Jeminet Normer et transporter un corpus muséal, des réserves du Musée Saint-Raymond à Wikidata 29 mars 2019
- Alyx Taounza-Jeminet Les céramiques grecques antiques
- Jason Evans Leveraging open data at the national library of wales
- Jason Evans, Alex Stinson Becoming a National Wikimedian: Jason Evans and the National Library of Wales
- Marie D. Martel Le modèle d’une pratique professionnelle alternative à bâtir avec les GLAMs. Blog de Bibliomancienne