Recherche :Prix Wikimédia France de la recherche/articles nominés/Création, destruction et restauration dans Wikipédia

From Meta, a Wikimedia project coordination wiki

Créer, détruire et restaurer de la valeur sur Wikipédia

Créer, détruire et restaurer de la valeur sur Wikipédia est un article classique et novateur publié à la conférence ACM sur le Supporting Group Work (GROUP) en 2007.

Voir le texte entier ici.

Résumé

L’article annonce une approche quantitative pour mesurer l’impact d’une contribution. Les six auteurs (Reid Priedhorsky, Jilin Chen, Shyong (Tony) K. Lam, Katherine Panciera, Loren Terveen, and John Riedl) ont travaillé au laboratoire de recherche GroupLens à l’Université du Minnesota.

Ils suggèrent de quantifier l'impact d'une édition donnée par le nombre de fois que la version modifiée est consultée. Le concept de vue persistante d'un mot (Persistent Word View = PWV) est construit sur ​​la notion d'une vue d'article: chaque fois qu'un article est vu, chacun de ses mots est également vu. Quand un mot écrit par l'éditeur X est vu, il est crédité d'un PWV.

Ils utilisent une série de jeux de données sur quatre années, l'analyse de 4,2 millions de rédacteurs et 58 millions de modifications, avec des résultats qui soulignent l'importance des éditeurs fréquents, qui dominent ce que les gens voient quand ils visitent Wikipedia, et montrent que cette domination est en augmentation. Par exemple, les 10% des plus grands éditeurs par nombre de modifications ont contribué à 86% du PWV, et les 0,1% plus grands ont contribué 44%.

Ils mettent en œuvre une mesure de détection de vandalisme en utilisant uniquement les commentaires associés aux modifications bloquées. La mesure est mise en œuvre à travers un protocole de recherche sophistiqué automatisé/humain, avec des résultats montrant la rapidité de la réparation des dommages (42% des incidents sont réparés immédiatement, avec 0,75% persistant au-delà de 1000 vues). Fait intéressant, ils prennent en compte non seulement combien de temps les articles sont restés dans un état endommagé, mais aussi combien de fois ils ont été consultés dans cet état. Bien que l'impact global des dommages dans Wikipedia est faible, ils montrent qu'il est en hausse: l'apparition de robots de réparation de vandalisme au début de 2006 semblant avoir maîtrisé la croissance exponentielle.

Basé sur des travaux antérieurs, comme en 2004 "Etude de coopération et de conflit entre les auteurs avec des visualisations de flux de l'histoire" (également en nomination pour ce prix) ils utilisent ses catégories de dommages aux articles (absurde, offensive, faux contenu...), mais aussi ils corrigent et ajoutent quelques-unes de leurs propres catégories (désinformation, suppression partielle, Spam). Employant le jugement humain, ils démontrent que la plupart des dommages appartient à la catégorie de « non-sens. »

Commentaires du jury

idées séminales, approche quantitative, beaucoup de contenu

Vote for this paper

Vote

  1. Very useful measure of edit impact. Avenue (talk) 00:12, 25 February 2013 (UTC)
  2. Interesting work --PierreSelim (talk) 13:29, 26 February 2013 (UTC)
  3. Ypnypn (talk) 13:55, 6 March 2013 (UTC)
  4. Most definitely; the D_LOOSE and D_STRICT regular expressions alone would win this a prize. Ironholds (talk) 21:22, 9 March 2013 (UTC)
  5. Introduces several broadly relevant new metrics for assessing edit impact & article quality; shows the importance of Wikipedia's core editor base in creating and maintaining the value of the encyclopedia, refuting the commonsense notion that Wikipedia is somehow a product of a nameless, faceless "crowd". And exposes both the ways in which Wikipedia and open wikis in general are vulnerable to quality degradation, and the robust mechanisms that exist to combat it. Best of the five! Disclosure: I have co-authored a research paper with the last author. Jtmorgan (talk) 21:27, 10 March 2013 (UTC)
  6. Tbayer (WMF) (talk) 22:31, 10 March 2013 (UTC)
  7. "Persistent word view" is a interesting idea. Finn Årup Nielsen (fnielsen) (talk) 13:57, 11 March 2013 (UTC)