Jump to content

Statistics script

From Meta, a Wikimedia project coordination wiki

It's recommended not to generate live at the server but to use SQL dumps or a local database and to put the statistic into wikipedia afterwards.

Erik Zachte wrote a perl script for this purpose (see http://infodisiac.com/Wikipedia/WikiStats/ ). Thanks a lot!

Please contact him or post at Wikitech mailing list (archive). You can also edit this article but I don't know if anybody reads it :-) --Nichtich 19:50 24 Jul 2003 (UTC)



Localisation strings are in sub GetDate and sub SetLiterals (maybe there will be a configuration/locaisation file in a future version?)

You do not have to be a Perl programmer nor download the SQL dump to provide a translation :-)



Some Language names

$language_names[de] = {
 "eo" => "Esperanto",
 "nl" => "Niederländisch",
 "en" => "Englisch",
 "fr" => "Französisch",
 "pl" => "Polnisch",
 "es" => "Spanisch"

Some strings should be generated out of a dynamic config value (I marked this with #config value).

  if($language eq "de") {
    $out_wikipedia    = "Wikipedia in " . $language . ": " ;
    $out_title        = $out_wikipedia . ", Statistics" ;
    $out_html_title   = "Statistik für die Wikipedia in " . $language;
    $out_page_title   = "Statistik für die <a href='$out_web_address'>Wikipedia in " . $language . "</a>" ;
    $out_generated    = "Erzeugt am " ;
    $out_version      = "Version des Skripts:" ;
    $out_author1      = "Autor:" ;
    $out_author2      = "Mail:" ;
    $out_author3      = "Webseite" ;

    $out_megabytes    = "Mb" ;
    $out_kilobytes    = "Kb" ;
    $out_million      = "M" ;
    $out_thousand     = "K" ;

    $out_sqlfiles     = "Diese Statistik wurde erzeugt aus dem SQL-dump vom " ;

    $out_conversions1 = "Es wurden " ;
    $out_conversions2 = " (semi-)automatische Umwandlungen durchgeführt." ;

    $out_tbl1_intro  = "Die [[2]] derzeit aktivsten Wikipedianer, " .
                       "geordnet nach der Anzahl ihrer Beiträge:" ;
    $out_tbl1_hdr1    = "Benutzer" ;
    $out_tbl1_hdr2    = "Edits" ;
    $out_tbl1_hdr3    = "Erster Beitrag" ;
    $out_tbl1_hdr4    = "Letzter Beitrag" ;
    $out_tbl1_hdr5    = "Datum" ;
    $out_tbl1_hdr6    = "Tage" ;

    $out_tbl2_intro  = "[[3]] derzeit abwesende Wikipedianer, " .
                       "geordnet nach der Anzahl ihrer Beiträge:" ;

    $out_tbl3_intro   = "Wachstum der registrierten Benutzer und Beiträge" ;
    $out_tbl3_hdr1a   = "Datum" ;
    $out_tbl3_hdr1b   = "<-- Wikipedianer ->" ;
    $out_tbl3_hdr1f   = "<------------------ Artikel ------------------->" ;
    $out_tbl3_hdr1l   = "<---- Datenbank ---->" ;
    $out_tbl3_hdr2b   = "gesamt" ;
    $out_tbl3_hdr2c   = "neu" ;
    $out_tbl3_hdr2d   = "<- mit Beiträgen ->" ;
    $out_tbl3_hdr2f   = "Anzahl" ;
    $out_tbl3_hdr2g   = "tägl." ;
    $out_tbl3_hdr2h   = "<-- Durchschnitt --->" ;
    $out_tbl3_hdr2j   = "<- größer als ->" ;
    $out_tbl3_hdr2l   = "Edits" ;
    $out_tbl3_hdr2m   = "Größe" ;
    $out_tbl3_hdr2n   = "Links" ;
    $out_tbl3_hdr3d   = "> 5" ; # config value!
    $out_tbl3_hdr3e   = "> 100"; # config value!
    $out_tbl3_hdr3g   = "Zunahme" ;
    $out_tbl3_hdr3h   = "Edits" ;
    $out_tbl3_hdr3i   = "Bytes" ;
    $out_tbl3_hdr3j   = "0.5 Kb" ; # config value!
    $out_tbl3_hdr3k   = "1.5 Kb" ; # config value!

    $out_tbl3_legendA = "Wikipedianer mit insgesamt mehr als 10 Beiträgen" ;
 # config value ("10")?

    $out_tbl3_legendB = "Zunahme von (1) im letzten Monat" ; # config value ("past XX days")?
    $out_tbl3_legendC = "Benutzer mit mindestens 5 Beiträgen innerhalb des letzten Monats" ; # config value 5
    $out_tbl3_legendD = "Benutzer mit mindestens 100 Beiträgen innerhalb des letzten Monats" ; # config value 100
    $out_tbl3_legendE = "Artikel, die mindestens einen Link enthalten (ohne Redirects)" ;
    $out_tbl3_legendF = "Neue Artikel innerhalb des letzten Monats (ohne Redirects)" ;
    $out_tbl3_legendG = "Durchschnittliche Anzahl von Bearbeitungen pro Artikel (mit Redirects)" ;
    $out_tbl3_legendH = "Durchschnittlische Artikelgröße in Bytes (ohne Redirects)" ;
    $out_tbl3_legendI = "Anteil von Artikeln mit mehr als 500 Bytes (ohne  Redirects)" ; # config value 500
    $out_tbl3_legendJ = "Anteil von Artikeln mit mehr als 1500 Bytes (ohne Redirects)" ; # config value 1500
    $out_tbl3_legendK = "Bearbeitungen im letzten Monat (mit Redirects und Beiträgen von unregistrierten Benutzern)" ;
    $out_tbl3_legendL = "Gesamtgröße aller Artikel (ohne Redirects)" ;
    $out_tbl3_legendM = "Gesamtanzahl aller Links (ohne Redirects)" ;


  • output in WikiSyntax to copy on Wikipedias
    • better generate a statistics file with all the numbers and afterwards HTML/WikiSyntax/cvs... out of it. You can also choose what to show and what to hide in this step
  • number of redirects
  • number of Discussion/Wikipedia/Image articles (included?)
  • some information on article history (database size with or without it??)