Jump to content

Mots-dièse

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Hashtags and the translation is 100% complete.
Capture d'écran de la page d'accueil de l'outil.

Mots-dièse est un outil pour la surveillance et recherche de mots-dièse ou mots-clic dans des résumés de modifications de Wikimedia. L'outil surveille des modifications envers toutes les projets Wikimedia (sauf Wikidata, voir ci-dessous) et permet aux utilisateurs de les rechercher. Elle a été initialement créé en 2016, mais a été réusiné en 2018.

Utilisation

Exemple de résultats de recherche de l'outil (https://hashtags.wmflabs.org/?query=1lib1ref).

L'outil est hébergé sur un serveur privé virtuel basé sur le Nuage à l'instance https://hashtags.wmflabs.org/. La section « Trending Tags » à droite classe les mots-dièses les plus couramment utilisés au cours des 30 dernières journées.

Pour rechercher un mot-dièse en particulier, faites tout simplement saisir dans le champ Hashtag et cliquez « Submit ». Les résultats peuvent être filtrés davantage par Project (par exemple : `fr.wikisource.org`) et dans une plage de dates avec la date de début et/ou la date de fin. Pour la recherche de multiples mots-dièse dans la même recherche, il suffit tout simplement de les séparer avec des virgules (par exemple : 1lib1ref, 1bib1ref). Des modifications utilisant plusieurs des mots-dièse recherchés dans le même résumé des modifications vont seulement apparaître une fois.

Les URL prennent la forme https://hashtags.wmflabs.org/?query=<hashtag>&project=<project>&startdate=<YYYY-MM-DD>&enddate=<YYYY-MM-DD>. Chaque paramètre à l'exception de la requête peut être omis.

Pour obtenir plus de détails pour une recherche particulière, cliquez sur le bouton Show statistics. Actuellement, trois graphiques seront affichés: Top projects, Top users et Modifications au fil du temps. Les graphiques Top Projects et Top Users montrent les 10 meilleurs projets Wikimédia et les 10 meilleur(e)s utilisateurs respectivement, tous deux triés par diminution du nombre de modifications. Pour voir la liste complète des projets et des utilisateurs, cliquez sur le bouton View full stats. Le graphique Modifications au fil du temps affiche les modifications au fil des jours si la plage des résultats de recherche est inférieure à 90 jours, les modifications sur des mois si la plage est supérieure à 90 journées mais inférieure à 3 ans, et les modifications par an les autres fois. Vous pouvez également télécharger chacune de ces statistiques en tant que fichier CSV en cliquant sur le bouton Download CSV.

Jusqu'en 2018, l'outil était hébergé à https://tools.wmflabs.org/hashtags. En raison de l'utilisation élevée des ressources et d'une base de données très grande, l'outil a été réécrit et déplacé vers une instance VPS Cloud dédiée. La plupart des URLs de l'ancien outil redirigent maintenant vers le nouveau, y compris les requêtes de recherche.

Mots-dièse

L'outil Mots-dièse surveille l'utilisation de mots-dièse de tous les projets Wikimedia à l'exception de Wikidata via les recentchanges EventStream. Les mots-dièses sont appariés utilisant l'l'expression rationnelle (?:^|\s)[##]{1}(\w+) qui appareillent tous les mots-dièse qui ne sont pas tous des chiffres.

Wikidata est actuellement exclue de la colllection des données à cause de l'énorme volume de données que cela génèrerait. Par exemple, presque 7 millions de modifications par moi ont le tag #quickstatements là-bas. Voir T207029 pour les détails.

Les modifications des bot sont également exclues de la collecte de données en raison de fréquences de modification élevés. Les modifications individuelles des robots peuvent être facilement suivies en regardant l'historique des contributions des comptes individuels des robots.

De 2016 à 2018, des données ont été recueillis de divers langues de projets Wikipédia, comme demandé par les éditeurs. Donc, des données plus antérieures qu'en août 2018 n'incluent pas d'autres projets Wikimédia ou plusieurs langues de Wikipédia. Il y a une lacune dans les données du 8 août au début de septembre 2018 issus de la période de temps entre l'ancien outil étant éteint et le nouveau s'initialisant.

À causes de problèmes techniques, il y a aussi une lacune du 30 septembre au 13 novembre 2021.

Contribuer

Des contributions à l'outil de mots-dièse sont les bienvenus. Le code source est disponible sur Github et des tâches ouvertes sont listés sur Phabricator. L'outil s'exécute sur Django via des conteneurs Docker. Des instructions à propos des réglages locaux peuvent se trouver sur le README à Github.

Voir aussi