Community Wishlist Survey 2019/Maps/Geographic coordinates check

From Meta, a Wikimedia project coordination wiki

Geographic coordinates check

  • Problem: Aus Prinzip auf Deutsch: Wir haben wikimediaweit, so weit mir bekannt ist, kein Werkzeug, um falsch gesetzte Geokoordinaten zu finden, bzw. sind es nur augenscheinliche statistische Ausreißer, die eventuell jemandem auffallen. Mein Eindruck ist auch, dass es viele falsche Koordinaten gibt, die von irgendwo aus per Bot zuerst in alle möglichen Sprachversionen, dann von dort nach Wikidata, und von dort wieder in alle möglichen Sprachversionen transferiert werden, ohne dass sich je jemand mit der Frage auseinandergesetzt hätte, ob die Koordinate denn überhaupt stimmt. Es sollte ein Werkzeug ermittelt werden, das Koordinaten mithilfe vorhandener Geotools überprüft, und in plausible, unklare und unplausible sortiert und Wartungslisten erstellt.
    • Translation: AFAIK we have no tool to find incorrect geo coordinates; there are only some obvious statistical outliers which eventually someone will recognize. Furthermore my impression is that there are many wrong coordinates which get taken from somewhere via a bot into some language versions, then transferred into Wikidata, then back to some language versions, without anyone who would have worked on the question whether the coorindates are correct at all. There should be a tool that checks coordinates via existing geotools and puts them into plausible, unclear, and non-plausible maintenance lists.
  • Who would benefit: Leser von Artikeln mit Geokoordinaten (kriegen verlässlichere Informationen), Autoren im Geo-Bereich (erhalten u.U. ein Werkzeug um den Artikelbestand in ihrem Bereich besser im Blick zu behalten), Wikidata (weniger Fehler, besserer Ruf)
  • Proposed solution: Bin kein Programmierer, kenne wohl nicht alle Möglichkeiten, wo man ansetzen könnte, aber vorstellen tu ich mir das Ganze ungefähr so:
  • Nehmen wir d:Q16572965 als Beispiel.
  • Wir haben dort die Properties P625 (geographische Koordinaten) und P131 (liegt in der Verwaltungseinheit). Hier soll angesetzt werden.
  • Rufen wir mal die Koordinate in Openstreetmap auf ([1]). Hier gehen wir zur "Objektabfrage" (Cursor-mit-Fragezeichen-Symbol ganz rechts), klicken auf diesen Button und dann auf den Punkt mit unserer Koordinate. Links öffnet sich was, wo diverse in der Nähe gelegene und verschiedene umschließende Objekte aufgelistet sind.
  • Uns interessieren mal die umschließenden: In der Liste taucht "Gemeinde-/Stadtgrenze San Antonio" auf. Diese so genannte Relation öffnen wir mal und gelangen zu dieser Seite.
  • Wir erkennen, dass diese Seite mit d:Q56135 verknüpft ist. Dies ist auch das Item, das bei P131 unseres Versuchsobjekts eingetragen ist. Geprüft wurde die tiefste vorhandene administrative Ebene (admin_level 8 auf Wikidata im Vergleich zu beispielsweise admin_level 4 auf Regionsebene). Ergebnis der Prüfung: Koordinate ist plausibel (das heißt nicht, dass sie richtig ist, aber plausibel ist sie).
  • Anm: Das zu schreibende Tool sollte natürlich nicht eine Prüfung auf gut Glück machen, sondern alle Einträge bei den umschließenden Objekten durchtesten.
Es gibt auch sehr viele OSM-Relationen, die nicht mit einem Wikidata-Item verknüpft sind. Die Prüfung ließe sich durch die Verschachtelung der P131-Beziehungen auf höheren Ebenen fortsetzen, was aber nur bis zu einem gewissen Punkt Sinn macht. Jedenfalls ist eine Koordinate, bei der die Prüfung nach dem Wikidata-Item bei P131 im zu prüfenden Fall erfolglos ist, nicht zwangsläufig falsch.
Als unplausible Koordinaten ließen sich solche erkennen und in Wartungslisten eintragen, bei denen die Relation auf der tiefsten auf Openstreetmap vorhandenen Ebene in keinem (verschachtelten) eindimensionalen P131-Bezug zum zu prüfenden Wikidata-Item steht. Beispielsweise stimmt irgendwas nicht, wenn ein Item gemäß P131-Angabe in der Gemeinde A in Kreis B liegt, die tiefste umschließende Relation mit Wikidata-Verknüpfung auf OSM aber entweder Gemeinde C oder Kreis D entspricht.
Ich sag gleich dazu, dass ich nicht weiß, wie leicht das für einen Bot zu prüfen ist (Stichwort API), und ob es nicht noch viel bessere Kartendienste gibt, mit denen man solche Prüfungen machen könnte.
Translation: I'm not a programmer, do not know all the possibilities, where to start, but imagine I do the whole thing something like this:
  • Take d: Q16572965 as an example.
  • There we have the properties P625 (geographical coordinates) and P131 (located in the administrative unit). Here should be set.
  • Let's call the coordinate in Openstreetmap ([1]). Here we go to the "object query" (cursor with question mark icon on the right), click on this button and then on the point with our coordinate. On the left, something opens where various nearby and various surrounding objects are listed.
  • We are interested in the enclosing: In the list appears "municipality / city boundary San Antonio". We open this so-called relation and go to this page.
  • We recognize that this page is linked to d: Q56135. This is also the item entered at P131 of our test object. The lowest available administrative level was checked (admin_level 8 on wikidata compared to eg admin_level 4 at region level). Result of the check: Coordinate is plausible (that does not mean that it is correct, but it is plausible).
  • Note: The tool to be written of course should not make a test to good luck, but to test all entries in the enclosing objects.
There are also many OSM relations that are not linked to a Wikidata item. The examination could be continued by nesting the P131 relationships at higher levels, but this makes sense only to a certain extent. In any case, a coordinate in which the check for the Wikidata item at P131 in the case under test is unsuccessful is not necessarily wrong.
As implausible coordinates could be identified and entered into maintenance lists, in which the relation at the deepest on Openstreetmap existing level in any (nested) one-dimensional P131 relation to the examined Wikidata item stands. For example, something is wrong if an item in P131's community A is in circle B, but the lowest enclosing relation with Wikidata's link to OSM is either community C or circle D.
I'll say straight away that I do not know how easy it is to check for a bot (keyword API), and whether there are not much better map services available to do such tests.

Discussion

Voting