WissensWert/73 - Syntax Checker für die Verbesserung der Datenqualität zur Nachnutzung von Wikimediacontent als Linked Open Data.

From Meta, a Wikimedia project coordination wiki

73 - Syntax Checker für die Verbesserung der Datenqualität zur Nachnutzung von Wikimediacontent als Linked Open Data.

Zur Idee[edit]

Kurzbeschreibung deiner Idee und deren Beitrag zur Förderung Freien Wissens[edit]

Zur Erschließung und Nachnutzung von strukturierten Daten aus Wikimedia ist Parsing notwendig. Bei Syntaxfehlern ergeben sich Datenqualitätsprobleme bei den geparsten Inhalten. Aus diesem Grund schlage ich die Implementation eines Syntax Checkers in Wikimedia vor. Dieser sorgt dafür, dass ein Nutzer vor dem Speichern eines Artikels auf eventuelle Syntaxfehler hingewiesen wird und die Möglichkeit zur Korrektur hat.

Welches Ziel soll mit deiner Idee erreicht werden?[edit]

Die Verbesserung der Datenqualität von z.B. Wikipedia und Wiktionary-Inhalten, zur einfacheren Erschließung und Nachnutzung z.B. als Linked Open Data.

Wie lässt sich messen, ob dieses Ziel erreicht wird?[edit]

Anhand von Datenqualitätsmetriken lässt sich bestimmen, ob die Anzahl der Parsingfehler durch den Einsatz des Syntax Checkers signifikant sinkt.

Was ist die Zielgruppe deiner Idee?[edit]

Akteure, die an der Nutzung von Wikipedia und Wiktionary-Inhalten als Linked Open Data interessiert sind.

Wie erreichst du diese Zielgruppe?[edit]

Auf Konferenzen, durch Ansprache über soziale Netzwerke, Blogbeiträge und über Publikationen zum genannten Thema.

Beschreibe, welche Tools, Technologien oder Hilfsmittel du für die Umsetzung benötigst[edit]

Entwicklungswerkzeuge wie Eclipse,Talend; Technologien wie Java, MySQL, PHP, Javascript, AJAX etc. (alle kostenfrei verfügbar)

Wird deine Idee weiterleben, nachdem die Förderphase beendet ist? Wie nachhaltig ist dein Projekt?[edit]

Ja, durch die zunehmende Bereitstellung von Wikipedia und Wiktionary-Daten als Linked Open Data wird die Verbreitung von offenen Wissensinhalten befördert. Die angestrebte höhere Datenqualität wird zu einer einfacheren Verknüpfbarkeit der Wikipedia und Wiktionary-Daten in Mashups in der Linked Open Data Cloud führen.

Lässt sich deine Idee auch von anderen Zielgruppen, Orten, Projekten nutzen? Wenn ja, wie und von wem?[edit]

Ja, der Syntax Checker ist relevant für alle Mediawiki-Inhalte, also auch außerhalb der Wikimedia-Projekte.

Zur Person[edit]

Name[edit]

Sandro Heyer

Website des Einreichers oder Projektes[edit]

http://www.heyer.it

Profil des Einreichers[edit]

Ich bin leidenschaftlicher Entwickler mit Fokus auf Open Source
Technologien.
Ich arbeite bei Avantgarde Labs in Dresden, eine IT-Beratung für
Datenlogistik sowie Data- und Text-Mining mit Open Source Software.