Research:Wikimedia France Research Award/nominated papers/Creating, destroying, and restoring in Wikipedia/nl

From Meta, a Wikimedia project coordination wiki

Creëren, vernietigen en herstellen van waarde in Wikipedia

Creëren, vernietigen en herstellen van waarde in Wikipedia is een baanbrekend, klassiek artikel dat in 2007 werd gepubliceerd op de ACM Conference op Supporting Group Work (GROUP).

De volledige tekst.

Samenvatting

Dit artikel brengt een kwantitatieve aanpak voor het meten van de impact van een bewerking. De auteurs (Reid Priedhorsky, Jilin Chen, Shyong (Tony) K. Lam, Katherine Panciera, Loren Terveen en John Riedl) werkten in het GroupLens onderzoekslaboratorium aan de Universiteit van Minnesota.

Zij suggereren de impact van een bepaalde bewerking te kwantificeren door het aantal keren dat de bewerkte versie wordt bekeken. Het concept van een persistent wordview (PWV) is gebaseerd op het idee van een artikelview: elke keer dat een artikel wordt bekeken, wordt ook elk van zijn woorden bekeken. Wanneer een woord dat door redacteur X is geschreven wordt bekeken, wordt hij of zij een PWV toegekend.

Ze gebruiken een reeks gegevens die vier jaar duurt en 4,2 miljoen redacteurs en 58 miljoen bewerkingen analyseren. De resultaten tonen het belang van frequente redacteurs aan, die domineren wat mensen zien wanneer ze Wikipedia bezoeken, en laten zien dat deze dominering toeneemt. Zo heeft de top 10% van de redacteuren per aantal bewerkingen 86% van de PWV bijgedragen en de top 0,1% heeft 44%.

Ze implementeren een methode voor het detecteren van vandalisme met alleen de opmerkingen die verband houden met het terugdraaien. De methode wordt geïmplementeerd door middel van een geavanceerd geautomatiseerd / menselijk onderzoeksprotocol, met resultaten die de snelheid van reparatie van schade tonen (42% van de schade-incidenten worden onmiddellijk gerepareerd, met 0,75% van de incidenten die langer dan 1000 views blijven). Het is interessant dat zij niet alleen rekening houden met hoe lang de artikelen in een beschadigde toestand bleven, maar ook met hoeveel keer ze in deze toestand werden bekeken. Hoewel de totale impact van schade in Wikipedia laag is, blijkt dat het stijgt. Het verschijnen van 'bots' voor het repareren van vandalisme in het begin van 2006 lijkt de exponentiële groei te hebben gestopt.

Op basis van eerdere artikelen, zoals de 2004 "Studying cooperation and conflict between autors with history flow visualizations" (ook genomineerd voor deze prijs) gebruiken ze zijn categorieën schade aan artikelen (onzin, beledigend, valse inhoud...), maar corrigeren en voegen ook een aantal van hun eigen toe (misinformatie, gedeeltelijke verwijdering, spam). Met menselijk oordeel bewijzen ze dat de schade het meest tot de "onzin" categorie behoort.

Opmerkingen jury

Rudimentaire ideeën, kwantitatieve aanpak, veel inhoud

Vote for this paper

Vote

  1. Very useful measure of edit impact. Avenue (talk) 00:12, 25 February 2013 (UTC)
  2. Interesting work --PierreSelim (talk) 13:29, 26 February 2013 (UTC)
  3. Ypnypn (talk) 13:55, 6 March 2013 (UTC)
  4. Most definitely; the D_LOOSE and D_STRICT regular expressions alone would win this a prize. Ironholds (talk) 21:22, 9 March 2013 (UTC)
  5. Introduces several broadly relevant new metrics for assessing edit impact & article quality; shows the importance of Wikipedia's core editor base in creating and maintaining the value of the encyclopedia, refuting the commonsense notion that Wikipedia is somehow a product of a nameless, faceless "crowd". And exposes both the ways in which Wikipedia and open wikis in general are vulnerable to quality degradation, and the robust mechanisms that exist to combat it. Best of the five! Disclosure: I have co-authored a research paper with the last author. Jtmorgan (talk) 21:27, 10 March 2013 (UTC)
  6. Tbayer (WMF) (talk) 22:31, 10 March 2013 (UTC)
  7. "Persistent word view" is a interesting idea. Finn Årup Nielsen (fnielsen) (talk) 13:57, 11 March 2013 (UTC)