GDJ 2009/Ocena jakości

From Meta, a Wikimedia project coordination wiki

Ocena jakości[edit]

Temat oceny jakości artykułów przewija się już od dłuższego czasu, ale jakoś końca nie widać. Na stronie pl:Wikipedia:Ocena jakości jest sześć propozycji, o których nikt nic nie mówi. Jest jeszcze moja propozycja (pl:Wikipedysta:Leafnode/Ocena jakości), aczkolwiek pokrywa się ona z propozycją szóstą z listy - zaproponowałem system znany z en.wiki, jako sprawdzony i funkcjonujący. Próbowałem zagaić temat w kawiarence, ale odpowiedzi brak. Przygotowałem ogólny opis stopni (pl:Szablon:Stopnie oceny jakości), szablony pomocnicze dla projektów (pl:Szablon:Wikiprojekt Astronautyka), podobnie dla oceny istotności (tutaj się zdublowaliśmy z Novą, ale o tym później), i nawet jest wykorzystywane w kilku projektach. Chciałbym jednak, żeby jakieś decyzje w tej kwestii zostały podjęte - albo w jedną, albo w drugą, bo tak jak wspomniałem, strona 'ocena jakości' straszy propozycjami od 2006 roku.

Co chciałbym osiągnąć:

  • przyjęcie konkretnego schematu oceny artykułów
  • ustalenie standardów wizualnych (np. szablonów oceny wstawianych do dyskusji - już teraz wygląda to różnie)
  • wystosowanie prośby do wikiprojektów o stosowanie (wiadomo, że narzucić się nic nie da), czy przygotowanie jakiejkolwiek informacji
  • zaplanowanie prac nad elementami technicznymi - np. javascript ułatwiający ocenę (dwa kliknięcia do oceny)
  • przygotowanie tekstu wyjaśniającego po co to w ogóle (a jeśli ktoś czytając ten tekst też nie wie, to chętnym wytłumaczę na GDJ :) )

--Leafnode 09:00, 18 May 2009 (UTC)[reply]

Porównanie PL i EN[edit]

Podobnie jak dwa lata temu [1] - porównałem wynik losowania 100 artykułów z Wikipedii pl i en. Tym razem jako kryterium oceny przyjąłem system zaproponowany przez Leafnoda, pl:Wikipedysta:Leafnode/Ocena jakości - dodając jeszcze do niego dodatkową kategorię - artów bezwartościowych (mniej niż stub lub "niesformatowany bohomaz"). Skala ocen była taka: 1 - bezwartościowy, 2 - stub, 3 - start (coś więcej niż stub, ale jeszcze nie kompletny art), 4 - 4 w skali Leafnoda (czyli prawie DA - art kompletny ale bez znaczka), 5 (DA), 6 (więcej niż DA, ale jeszcze nie medal, czyli 5 w skali Leafnoda), 7 (medal). Oprócz tego liczyłem też liczbę linków, źródeł, długość tekstu (samego bez upiększeń), liczbę ilustracji i szablonów. Dane źródłowe w formie arkusza google: [2]

Wyniki sumaryczne:

Wartość PL EN
Średnia ocena 2.64 2.5
Średnia długość (znaki) 1800 3800
Liczba linków (na art) 21 21
Ilustracje 0.88 0.7
Bez ilustracji 59% 68%
Szablony 0.9 0.8
Źródła 1.5 3
Bez źródeł 55% 23%
Listy 3 2
Disambigi[1] 5 4
Botowe[2] 26 19
Biografie 12 30
POP[3] 18 24
GEO[4] 20 20
Czwórki 11 15
Jedynki 6 15

  1. Gdy natrafiłem na disambig, losowałem jeden z artykułów z niego
  2. Utworzone przez bota i nie tknięte "ludzką ręką"
  3. Artykuły dotyczące tzw. kultury popularnej - od gwiazdek porno - po gry komputerowe
  4. Artykuły geograficzne

Jak widać jakość Wikipedii pl w porównaniu z poprzednim badaniem zbliżyła się nieco do jakości en. Z negatywów rzuca się wciąż mniejsza niemal o połowę średnia długość artykułów i znacznie gorsze uźródłowienie - w pl ponad 50% artów wciąż nie ma źródeł, podczas gdy w en tylko 23%. Jest tu jednak spory postęp, bo w 2007 tylko 15% artów miało jakiekolwiek źródła. Podobnie bardzo wzrósł stopień zilustrowania artykułów - w obu Wikipediach - w 2007 tylko 23% artów w en i 17% w PL miało choć jedną grafikę, obecnie te liczby to 68% i 59% - wciąż nieco lepiej w en. - ale w niewielkim już stopniu. Zrównoważeniu uległa proporcja w dziedzinach - nawet z lekką korzyścią dla PL - gdzie liczba artykułów z dziedziny "kultury popularnej" nie jest już tak nienaturalnie duża jak wciąż w en. Procent ubotowienia, czyli liczby artykułów stworzonych przez boty w stosunku do artykułów edytowanych "ręcznie" jest wciąż większy niż w en, ale już nie tak drastycznie - w poprzednim badania w pl było 36% artykułów czysto-botowych, teraz już tylko 26% Ciekawostką jest, że w en jest dużo więcej biografii niż u nas. Czy gorzej to czy lepiej - trudno ocenić. Ciekawe też, że średnia sumaryczna ocena obu Wikipedii wypada niemal identycznie - w okolicach 2.5 - czyli większość artykułów jest w obu przypadkach jakości między "stub" i "start" - a inne to raczej niezbyt często spotykane "rodzynki". Anglojęzyczna Wikipedia ma więcej artykułów na 4, ale też ma więcej na 1, co obniża jej średni wynik. W Pl art. typu "1" są chyba szybciej sprzątane.

Nt samego systemu Leafnoda: W losowanej próbce nie natrafiłem na żaden artykuł powyżej oceny "4" - w obu Wikipediach odsetek DA i medalowych jest po prostu tak znikomy, że prawdopodobieństwo wylosowania jednego w próbce 100 jest pomijalnie małe :-) Bardzo trudno jest czasem zdecydować, czy art jest już 3 czy jest może wciąż tylko 2. Podobne kłopoty są też przy ustaleniu granicy 3 i 4, które są mocno uznaniowe. Podobny problem będzie też pewnie z "5" - które DA uznać, za "5" a które nie? Kto by miał o tym decydować?

Polimerek 11:52, 26 August 2009 (UTC)[reply]

Zobacz też[edit]

To jeszcze dodam na wszelki wypadek :) Przykuta 12:36, 18 May 2009 (UTC)[reply]

Głosy w dyskusji (wybór)[edit]

Tilia: O (brakach w) poprawności językowej Wikipedii i o jej roli edukacyjnej w tym zakresie - konieczność stosowania standardowej literackiej polszczyzny i stanowienia wzorca językowego dla użytkowników. Może jakaś burza mózgów - jak skutecznie działać w tej dziedzinie. Co autorzy i użytkownicy widzieliby jako sensowne działania w tym zakresie. Inicjatywy edukacyjno-prewencyjne itp.
Julo: Przerost formy nad treścią: Inny przejaw tego przerostu, przejawiający się czasem w absurdalnym szpikowaniu haseł szablonami {{s:źródła}} i {{s:fakt}}. To jest kwestia generalnej strategii Wikipedii: czy chcemy udawać, że treści w Wikipedii - jeśli nie oznaczone takim szablonem - mają zawsze podparcie w wiarygodnych źródłach, czy nie, i czy poprawia naszą ogólną wiarygodność fakt, iż przybywa oznaczonych takimi szablonami haseł?
Krzysiumed: Sięganie, zamiast do źródeł, do książek (lub stron internetowych, jakiegokolwiek innego źródła informacji), które napisano na podstawie innej książki, napisanej korzystając z innej książki, ..., i dopiero po kilku takich ogniwach mamy książkę napisaną na podstawie źródeł. To sprzyja powielaniu stereotypów, fałszowania historii - wystarczy, że chociaż w jednej książce z przedstawionego łańcuszka pojawiła się jakaś fałszywa informacja. Często też korzysta się ze stron internetowych, w których nie ma żadnego podpisu - to są w praktyce anonimowe źródła. Często też są to strony darmowych portali/gazet (onet, Metro). Moim zdaniem encyklopedia powinna korzystać z "prawdziwych" źródeł.