GALILEO Masters 2004/Zusammenfassung

From Meta, a Wikimedia project coordination wiki

Zusammenfassung Talk:GALILEO Masters 2004

Grundidee[edit]

Die Wikipedia, eine freie Enzyklopädie, enthält eine Fülle von ortsbezogenen Informationen. Das Galileo-System soll verwendet werden, um diese Informationen einem Galileo-Nutzer ortsbezogen verfügbar zu machen.

Szenario[edit]

Ein Galileo-Benutzer befindet sich an einem Ort x, dessen Koordinaten er mittels Galileo ermittelt. Das Galileo-System sendet die Koordinaten an ein Modul der Wikipedia-Software. Die Wikipedia sendet daraufhin an das Galileo-System sämtliche Informationen mit Ortsbezug x, ggf. selektiert nach bestimmten, vom Nutzer vorzugebenden Kriterien.

Fragen[edit]

Daraus ergeben sich unmittelbar folgende Fragen:

  1. Datenerfassung
    Die Wikipedia-Artikel müssen um die Geoinformationen ergänzt werden.
    1. in welchem Format?
    2. welche Geoinformationen?
  2. Suchanfragen
    Es muß möglich sein, durch Eingabe der Ortskoordinaten x die in der Wikipedia enthaltenen Informationen zum Ort x, die das Kriterium y erfüllen, auszulesen.
    1. wie erfolgt die Selektion?
    2. welche Kriterien sind erlaubt / sinnvoll?
    3. wie erfolgt die Übertragung dieser Daten?
  3. Implementierung
    Welche Systeme sind zur Implementierung von 1. und 2. notwendig:
    1. Hardware am Galileo-Client
    2. Software am Galileo-Client
    3. Software auf der Wikipedia-Server-Seite

Diese Fragen wurden in den letzten Tagen intensiv diskutiert. Das Ergebnis dieser Diskussion ist im folgenden zusammengefasst.


Technische Präliminarien[edit]

Koordinatensystem[edit]

Verschiedene Koordinatensysteme wurden besprochen:

  • UTM
  • Gauss-Krüger
  • WGS 84
  • Grad/Minuten/Sekunden (Polarkoordinaten)
  • Dezimal
  • derzeit ca. 1.200 geläufige Systeme weltweit

Probleme / Anforderungen[edit]

  • moderne Koordinatensysteme sind nicht intuitiv verständlich
  • es gibt lokale / globale Koordinatensysteme
  • verfügbares Kartenmaterial verwendet unterschiedliche Systeme, teilweise mit unterschiedlichem Kartendatum (fester Offset-Wert)
  • Daten sollten international einsetzbar sein
  • Eingabe in verschiedenen Systemen, Umrechnung und Speicherung in internem System
  • User-Interface dazu

Geotypen[edit]

Es wurde diskutiert, welche Ortsinformationen gespeichert werden sollen.

  • einfacher Punkt auf der Erdoberfläche (Länge / Breite)
  • einfacher Punkt auf der Erdoberfläche mit Höhenkoordinate
  • Objekte mit mehreren Punkten:
    • Linien (z.B. Verkehrswege, Grenzen, Flussläufe)
    • Flächen (z.B. Bundesländer, Staaten, Städte, Ortschaften)
    • Frage der Darstellung: Polygon, Mittelpunkt-Radius
    • Frage der Darstellung von „unbestimmten“ bzw. „ungenauen“ Objektangaben
    • Welche Algorithmen sollen eingesetzt werden?
  • Welche Anforderung an Manpower wird zur Implementierung benötigt?

Speicherung der Geokoordinaten in der Mediawiki-Software[edit]

Es stellte sich heraus, dass die meisten Artikel mehrere Ortsbezüge haben. Daher ist eine neue Datenstruktur in der Wikipedia-Software notwendig. Mögliche Lösungen:

  • Eigene Tabelle „Geokoordinaten“
  • Namensraum „Geo:“

Außerdem scheint es sinnvoll zu sein, eine zentrale Koordinatendatenbank für alle Wikipedia-Projekte aufzubauen. Koordinaten sind sprachunabhängig! In diesem Zusammenhang wurde auch diskutiert, dass das System in der Lage sein sollte, verschiedene Datenquellen anzuzapfen:

  • Wikipedias in verschiedenen Sprachen
  • Wikitravel
  • evtl. weitere

Es tritt das Problem auf, wie eine Informationsüberschwemmung beim Endnutzer vermieden werden kann.

Genauigkeit[edit]

Es wurde diskutiert, mit welcher Genauigkeit die Geokoordinaten in der Wikipedia erfasst werden müssen. Eine Genauigkeit von 1m scheint in jedem Fall ausreichend, für größere Objekte reicht ggf. auch eine geringere Genauigkeit. Problem ist in jedem Fall die Datenbasis (wie ermittelt man die Geokoordinaten der Frauenkirche in München?) Es scheint sinnvoll zu sein, mit den Geokoordinaten weitere Metadaten abzuspeichern:

  • Erfassungsdatum
  • Benutzer, der die Koordinate erfasst hat
  • evtl. weitere


Umsetzung in der Wikipedia-Software[edit]

Datenerfassung[edit]

Ziel muß sein, möglichst viele Artikel der Wikipedia mit Geokoordinaten zu versehen. Dies ist bereits für viele Artikel der Fall. Wie das genau geschieht, muß noch im Detail geklärt werden (siehe: Artikel mit mehreren Ortsbezügen). Da sehr viele Benutzer an der Erfassung der Ortskoordinaten mitwirken müssen, muß das Format einfach sein. Evtl. ist es sinnvoll, mit Verweisen zu arbeiten ([[1]]). Das bisherige Wachstum hat gezeigt, dass es durchaus möglich ist, allein mit der Arbeit von Freiwilligen diese Informationen zusammenzutragen. Außerdem können verschiedene freie Quellen von Geokoordinaten verwendet werden. Das Format der Datenspeicherung und die dazu notwendigen Änderungen der mediawiki-Software müssen abschließend geklärt werden. Die Implementierung muß von der tech-Fraktion durchgeführt werden.

Suchanfragen[edit]

Das Suchportal muß definiert werden: welche Kriterien sind möglich / erlaubt?

  • Ortskoordinate genau
  • Alles im Umkreis von … km
  • Sprache (welche Wikipedias sollen abgefragt werden? Interwiki-Links!)
  • Informationen, die zu bestimmten Kategorien gehören oder nicht gehören:
    • Personen
    • Gebäuden
    • Sehenswürdigkeiten / POI = Points of Interest
    • Geschichte
  • Und/Oder-Verknüpfungen?
  • Auswahl der Datenquellen:
    • Wikipedia
    • Wikitravel
    • evtl. weitere?

Das Format der Ausgabeliste muß definiert werden:

  • ganze Artikel?
  • Bilder?
  • Limit Übertragungsvolumen?
  • verlinkte Artikel bis zur .. Ebene?
  • Auslieferung in welchem Datenformat (HTML, RSS, XML, GML, RDF…)
  • Karten (SVG, PNG)?

Architektur[edit]

Vorgeschlagene Architektur

Zur Einbindung der verschiedenen Datenquellen wurde ein dreigeteiltes Modell vorgeschlagen:

  • Data Provider - liefern die Rohdaten
  • Service Provider - haben die Geodaten, verbinden sie mit Rohdaten und liefern sie an die Clients
  • Client - senden Suchanfragen mit Geokoordinaten an den Serviceprovider und empfangen dessen Output (Artikel, Informationen zur Geokoordinate)

Notwendige Hardware[edit]

  • GPS/Galileo-Empfänger
  • Laptop / Subnotebook
  • eigene Hardware?
  • welche Übertragungskanäle uplink / downlink?

Vorschlag für eine idealtypische Hardware[edit]

  • Möglichst alles in einem Gerät integriert: Galileo/GPS-Empfänger, leistungsstarke, kleine Harddisk, UMTS, GPRS-Empfänger, Schnittstelle für professionelles Mikrofon (besser integriert) und Ohrhörer, Fotocamera, ein lichtunempfindliches Display in optimale Größe (14,5 x 10 cm z.B.);
  • Software: Linux, mp3-Player und vor allem -Recorder, Notiz-, Adress-, Mail-Programm, schnelles Suchfeature, Browser;
  • Protokolle: alle offen, HTML usw.
  • Energie: Aufklappbares Gehäuse aus Solarzellen.
  • Wünschenswert wäre ein Gerät, dass auf Flashkarten, Adaptern, Akkus und sonstigen Zusatz-Klimmbimm verzichtet.
  • Positionsbestimmung ausschliesslich über Galileo? Alternative (zusätzliche) Positionsbestimmung via UMTS hätte den Vorteil auch in Gebäuden zu funktionieren.
  • Evtl. mit lokaler Kopie der Wikipedia, um auch offline arbeiten zu können, nur mit GPS/Galileo-System

Zum Testen und für die stationäre Benutzung ohne GALILEO/GPS ist eine Reader-Software notwendig, auf der Koordinaten direkt angewählt werden können. Dies kann zum Beispiel in einem Wikimedia-Atlas auf Karten geschehen. Für die effiziente Speicherung von und Suche in geographischen Koordinaten existieren einfache Algorithmen u.A. aus der Geoinformatik.

Als mögliche Erweiterung wurde auch ein Rückkanal diskutiert (Erfassung von Ortskoordinaten durch einen speziellen Client mit Datenlieferung an Wikipedia)

Konkrete Anwendungen[edit]

Es wurden eine Reihe von möglichen Anwendungen des geplanten Projektes besprochen, teilweise mit sehr detaillierten Vorschlägen zur Umsetzung:

  • Tourismus / digitaler Reiseführer („Per Anhalter durch die Galaxis“)
  • Pädagogik / Weiterbildung
  • Dienstleistungen
  • Verkehrsregelung
  • Suchdienste
  • Unterhaltung