Jump to content

Mix'n'match/Anleitung

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Mix'n'match/Manual and the translation is 100% complete.

Mix'n'match ist ein Werkzeug von Magnus Manske, das verschiedene Themenlisten aus externen Quellen enthält. Es lässt dich diese mit Wikidata-Einträgen abgleichen und ermöglicht, festzustellen, welche bereits in Wikidata existieren und welche noch keine Datenobjekte haben - "denke an eine Liste von Rotlinks auf Steroide".

Es enthält derzeit über 2.500 Kataloge, wie das Oxford Dictionary of National Biography (vollständig), das Australian Dictionary of Biography (vollständig) oder den Katalog der National Portrait Gallery (52.5% Übereinstimmung).

Auf diesem Weg lässt sich einfach erkennen, welche Themen in einer bestimmten Wikipedia fehlen oder welche Sprache ein bestimmtes Thema am besten abdeckt.

Wie funktioniert es?

Mix'n'match teilt Objekte in fünf Kategorien ein:

Ein Beispiel der Statistik für einen der Kataloge.
  1. Manuell abgeglichen (früher Manually matched): ein Benutzer hat diesen Katalog-Eintrag mit einem Wikidata-Datenobjekt zusammengeführt (dies umfasst Einträge, die nach Wikidata importiert wurden);
  2. Automatisch abgeglichen (früher Automatically matched): das System hat hat einen oder mehrere mögliche Treffer für den Eintrag in Wikidata gefunden, eine Person muss dies jedoch noch verifizieren oder ablehnen;
  3. Kein Wikidata (deprecated): Dieser Katalog-Eintrag hat keinen entsprechenden Eintrag in Wikidata;
  4. Nicht relevant für Wikidata: der Eintrag wurde als nicht relevant für Wikidata markiert (beispielsweise handelt es sich um ein Duplikat, einen Platzhalter, eine Weiterleitung oder ein unangemessenes Thema);
  5. Nicht abgeglichen: dieser Eintrag wurde noch nicht zusammengeführt und es ist kein automatischer Vorschlag verfügbar.

Das Ziel ist natürlich, so viele Einträge wie möglich als manuell abgeglichen zu kennzeichnen (oder zu bestätigen, dass es keine Übereinstimmung mit einem Wikidata-Datenobjekt gibt). Um das Tool nutzen zu können, benötigst du ein Benutzerkonto für ein beliebiges Wikimedia-Projekt und musst das WiDaR-Tool autorisieren.

Wenn du Mix'n'match öffnest, wird eine Liste von Katalogen angezeigt (du kannst auch einen bestimmten Katalog auswählen). Du kannst dann:

  • In dem Suchfeld in der Kopfzeile nach einem bestimmten Namen suchen. Dies bringt dich auf eine Seite für Suchergebnisse.
    • Siehe auch Listenmodus unten für eine Anleitung, wie man die Ergebnisliste nutzt.
    • Auf der Seite für Suchergebnisse kannst du die Ergebnisse auch auf einen bestimmten Katalog begrenzen.
    • Du kannst auch eine QID suchen; dies wird alle Einträge anzeigen, zu denen das Datenobjekt passt. Die Suche nach externen IDs wird nicht unterstützt.
    • Es gibt keine Garantie dafür, dass die Suchergebnis-Seite alle Einträge enthält, die mit einem bestimmten Namen übereinstimmen; insbesondere kann die Liste gekürzt werden, wenn es zu viele Ergebnisse gibt.
  • Einen bestimmten Katalog auswählen und auf die Katalogseite gehen.

Auf einer Katalogseite siehst du die Anzahl der Einträge in jeder Kategorie und die Historie der Anzahl von Zusammenführungen. Der Klick auf eine bestimmte Kategorie bringt dich in den Listenmodus. Du wirst auch ein "Action"-Menü sehen, das folgendes enthält:

  • Manuell abgeglichen, Automatisch abgeglichen, Kein Wikidata, Nicht relevant für Wikidata, Nicht abgeglichen - verlinkt für alle Einträge in dieser Kategorie auf den Listenmodus.
  • Mehrere Treffer - verlinkt für alle automatisch abgeglichenen Einträge mit mehreren passenden Einträgen auf den Listenmodus.
  • Seitenstatistiken
  • Herunterladen
  • Abgleichs-Modus
  • Letzte Änderungen im Katalog
  • Aliasse
  • Aufgaben
  • Suche nur in diesem Katalog
  • Namen in anderen Katalogen
  • Katalog manuell synchronisieren
  • Katalog-Editor
  • Mobiles Abgleichen
  • Visueller Abgleich
  • Suche Bilder
  • Änderungen der letzten Woche
  • Katalog Meldungen

Abgleichs-Modus

Ein Beispiel des Abgleichs-Modus.

Wenn du den Abgleichs-Modus auswählst (früher semi-automatic mode oder game mode), siehst du oben auf der Seite die ID des Kataloges (Katalog-ID), den Titel des Kataloges (Katalog-Name) und möglicherweise eine kurze Beschreibung aus dem Katalog (Katalog-Beschreibung). Dies sollte dir dabei helfen, herauszufinden, wer oder was gemeint ist.

Wenn der Eintrag nicht abgeglichen ist, gibt es drei Möglichkeiten:

  • Q setzen (blauer Knopf): Wenn du das Wikidata-Datenobjekt gefunden hast, das dem Katalog-Eintrag entspricht, kannst du die Q-Nummer in diese Box kopieren.[1]
  • Neues Item (grüner Knopf): Wenn du dir sicher bist, dass es kein passendes Wikidata-Datenobjekt gibt. Dies erzeugt ein neues Wikidata-Datenobjekt für diesen Eintrag -
  • N/A (roter Knopf): für Fälle, in denen es für den Eintrag nie ein entsprechendes Wikidata-Datenobjekt geben wird. Die Beschreibung neuer Datenobjekte kann für Wikidata unangemessen sein und sollte manuell verbessert werden

In Zweifelsfällen oder bei Unsicherheiten oder wenn es kein passendes Wikidata-Datenobjekt gibt, du jedoch nicht gleich ein neues erstellen möchtest, kannst du den Eintrag überspringen und durch klicken auf "Nächster Eintrag" zum nächsten Eintrag gehen.

Wenn der Eintrag automatisch abgeglichen wurde, gibt es zwei Möglichkeiten:

  • Bestätigen (grüner Knopf): Bestätigt, dass der vorgeschlagene Eintrag korrekt ist.
  • Entfernen (roter Knopf): Bestätigt, dass der vorgeschlagene Eintrag falsch ist. Der Eintrag wird dann entfernt und kann zu einem anderen (möglicherweise neuen) Datenobjekt hinzugefügt werden.

Wenn es mehrere vorgeschlagene Treffer gibt, wird der erste angezeigt und als "bestätigt" markiert, wenn du es bestätigst. Du kannst dir andere Vorschläge ansehen oder auswählen, indem du auf den Link rechts neben dem Eintrag klickst.

Weiter unten werden Links aus en.wikipedia samt ihren Links auf das Datenobjekt in Wikidata vorgeschlagen. Sofern sich dort das richtige Datenobjekt befindet, kannst du einfach auf den Link rechts daneben klicken (z. B. "Q384941") und die Übereinstimmung wird registriert. Wenn sich das korrekte Datenobjekt nicht unter den Vorschlägen befindet, kannst du immer noch alle Versionen von Wikipedia, Wikisource oder Wikidata über Google durchsuchen.

Immer wenn du eine Verbindung zwischen einem Katalog-Eintrag und einem Wikidata-Datenobjekt herstellst, aktualisiert das System automatisch Wikidata. Dies erscheint als eine Bearbeitung in deinen Beiträgen.

(Bitte beachte, dass manche Einträge bei Mix'n'match noch keine Eigenschaft haben - wenn du einen davon bearbeitest, wird der Treffer gespeichert und später aktualisiert, wenn dies möglich ist)

Listen-Modus

Ein Beispiel des Listen-Modus.

Es wird eine Liste der Einträge angezeigt, wenn:

  • Du eine bestimmte Kategorie (z.B. "Nicht abgeglichen") auf einer Katalogseite aufrufst - alle Einträge dieser Kategorie werden mit je 50 Einträgen pro Seite angezeigt.
  • Du dir eine Suchergebnisseite ansiehst.

Früher war er als manual mode bekannt und konnte fünfzig Einträge aus allen Kategorien anzeigen; diese Option wurde entfernt.

In der ersten Zeile der Liste siehst du den Namen und (sofern verfügbar) die Beschreibung des Eintrags. Jede Kachel zeigt auch den Status der Einträge an.

Nicht abgeglichen

Bei Datenobjekten ohne vorgeschlagene Treffer werden in der zweiten Zeile unterschiedliche Links angezeigt, die es dir erlauben, eine automatische Suche auf Wikipedia, Wikidata oder Google (begrenzt auf Ergebnisse aus Wikipedia oder Wikidata) auszuführen oder ein neues Datenobjekt zu erstellen. In der rechten Spalte gibt es drei Optionen:

  1. Q setzen (grüner Link): Durch Anklicken wird ein Dialogfeld angezeigt, in das du die Nummer eines Wikidata-Datenobjektes (ohne oder mit dem Q vor der Nummer) eingeben kannst.
  2. Neues Item (roter Link): Durch Anklicken wird ein neues Datenobjekt auf Wikidata für den Eintrag erstellt, das automatisch den Namen, die Beschreibung (sofern vorhanden) und die ID aus dem Katalog erhält.
  3. N/A (gelber Link): Durch Anklicken wird bestätigt, dass der Eintrag auf Wikidata nicht existieren sollte und entfernt werden kann.

Wenn du die Nummer eines Wikidata-Datenobjektes angegeben hast, aktualisiert das System wie im Abgleichs-Modus automatisch den entsprechenden Wikidata-Eintrag über WiDaR.

Automatisch abgeglichen

Für Objekten mit einem automatisch vorgeschlagenen Treffer wird in der zweiten Zeile ein Link auf Wikidata zusammen mit einer automatisch generierten Zusammenfassung für den Wikidata-Eintrag angezeigt. In der rechten Spalte gibt es drei Optionen:

  1. Bestätigen (grüner Link): Durch Anklicken wird bestätigt, dass der vorgeschlagene Eintrag korrekt ist.
  2. Entfernen (roter Link): Durch Anklicken wird bestätigt, dass der vorgeschlagene Eintrag falsch ist. Der Eintrag wird dann entfernt und kann mit einem anderen (potenziell neuen) Datenobjekt abgeglichen werden.

Manchmal ist eine Liste alternativer Treffer verfügbar.

Auch hier wird das System über WiDaR die entsprechende Bearbeitung auf Wikidata durchführen, wenn du einen Treffer bestätigt hast.

Manuell abgeglichen

Für Objekte, die bereits abgeglichen wurden, wird in der zweiten Zeile ein Link auf Wikidata zusammen mit einer automatisch generierten Zusammenfassung für den Wikidata-Eintrag oder "Not applicable to Wikidata" angezeigt.

In der rechten Spalte wird der Name des Benutzers, der die Verlinkung erstellt hat und ein rotes "Entfernen" angezeigt. Dieser Link sollte nur genutzt werden, wenn du glaubst, dass die von jemand anderem hergestellte Kombination falsch ist. Lass alles so wie es ist, wenn die Kombination passend ist.

Beachte, dass das Herstellen von Treffern zur Aktualisierung des Wikidata-Datenobjektes führt, die Entfernung eines Treffers hingegen (derzeit) nicht. Wenn du den Treffer mit einem Datenobjekt entfernen möchtest, möchtest du vielleicht auch das Wikidata-Datenobjekt in einem neuen Tab öffnen und die Eigenschaft dort ebenfalls entfernen - sonst findet sie in der Zukunft möglicherweise ihren Weg zurück nach mix'n'match.

Erstellungskandidaten

Viele Katalogeinträge haben (noch!) keinen in Wikidata. Einige erfüllen möglicherweise nicht die Kriterien für ein Wikidata-Datenobjekt, andere sind jedoch in mehreren Katalogen aufgeführt und haben mehrere externe Fundstellen, was ihre "Relevanz" stark hervorhebt. Einträge, die in mehreren (>=3) Katalogen den gleichen Namen haben, jedoch kein entsprechendes Wikidata-Datenobjekt, finden sich bei den Erstellungskandidaten.

Ein Beispiel für Erstellungskandidaten.

Die aufgeführten Einträge haben die normalen Suchoptionen, um sicherzustellen, dass noch kein Datenobjekt in Wikidata existiert. Man kann ein neues Wikidata-Datenobjekt mit der vorausgefüllten (englischen) Bezeichnung erstellen. Das neue Datenobjekt kann dann über Q setzen mit den entsprechenden Einträgen zusammengeführt werden. Man kann auch auf Commons nach der Bezeichnung suchen; manchmal existiert dort bereits ein Bild der Person!

Vorsicht: Nur weil Einträge den gleichen Namen haben, bedeutet dies nicht, dass sie zusammengehören. Bitte prüfe die einzelnen Kataloge gründlich!

Abgleichs-Tipps

Bitte behalte die folgenden Tipps in Erinnerung, wenn du Einträge mit Wikidata-Datenobjekten abgleichst:

  • Rate nicht: Raten wird zu Fehlern in den Daten führen. Folge im Zweifelsfall dem Link auf den Katalogeintrag, überprüfe andere Kataloge unterhalb des Eintrags oder andere Informationen (z.B. Geokoordinaten).Du kannst immer Einträge überspringen und sie jemand anderen abgleichen lassen, du kannst sogar zu einem anderen Katalog gehen, mit dem du dich besser auskennst.
  • Hab keine Angst davor, neue Datenobjekte zu erstellen: Bitte erstelle ein neues Datenobjekt, wenn es sich nicht um genau dasselbe Konzept handelt. Es ist wesentlich einfacher, nach dem Abgleichen zwei Datenobjekte zusammenzuführen, als ein Datenobjekt in zwei getrennte Datenobjekte aufzuteilen. Z. B. entspricht die Welterbestätte einer Stadt häufig nicht dem gleichen Bereich wie die Stadt selbst, sodass ein neues Datenobjekt erstellt werden sollte.
  • Gleiche nicht mit Begriffsklärungs-Datenobjekten ab: Es existieren Wikidata-Datenobjekte für Wikipedia-Begriffsklärungsseiten. Diese Datenobjekte dienen eher als Linklisten, als als Konzept, mit dem abgeglichen werden kann. Z. B. sollte nicht mit Bambaia (Q4853316) abgeglichen werden, sondern mit Agostino Busti (Q395600).
  • Gleiche nicht von Begriffsklärungs-Datenobjekten ab: Einige Datenbanken von Behörden haben Begriffsklärungen oder Alias-Seiten.
    • Z. B. hatte RKD Artists einen Eintrag für "Bambaia", der fälschlicherweise in Wikidata abgebildet wurde. (Jetzt leitet RKD Bambaia korrekterweise weiter nach RKD Augustino Busti)
    • Gleiche nie mit "nicht-individualisierten Namen" der GND ab
  • Überprüfe automatisch abgeglichene Treffer: Obwohl das automatische Abgleichen häufig korrekt ist, kann es trotzdem durch Datenobjekte mit ähnlichen Namen durcheinanderkommen.
  • N/A-Status ist reserviert für Einträge, die niemals ein Wikidata-Datenobjekt sein können oder für bekannte Duplikate im gleichen Katalog.
  • Nutze die Jobs-Funktion: Das 'Action'-Menü in jedem Katalog hat eine 'Jobs'-Funktion. Dies zeigt dir eine Liste von Aufgaben, die beim Abgleichen helfen. Beispielsweise prüft 'auxiliary matcher' die Datensätze nach weiteren Identifikatoren, wie VIAF-IDs und überprüft diese mit den existierenden Angaben in Wikidata. Wenn das automatische Abgleichen viele Treffer schlechter Qualität ausgibt, gibt es auch die Option 'purge automatches'.

Sortieren der Katalogliste

Standardmäßig ist die Katalogliste alphabetisch sortiert. Der Parameter sort_mode kann einen oder mehrere der Schlüssel erhalten, um dies zu ändern:

  • sort_mode=groups sortiert Kataloge nach Typ/Themengebiet, zuerst die größten Gruppen, innerhalb der Gruppen alphabetisch. Erledigte Kataloge befinden sich am Ende
  • sort_mode=groups,by_easiest wie oben, jedoch "am einfachsten" zu erledigende als erstes (#auto-matched+2*#unmatched)
  • sort_mode=by_easiest,no_complete nicht gruppierte Sortierung, jedoch "am einfachsten" zu erledigende als erstes, erledigte Kataloge werden ausgeblendet (da sie standardmäßig "am einfachsten" zu erledigen wären)
  • sort_mode=groups,complete_inline gruppiert, jedoch mit erledigten Katalogen in dem jeweiligen Themengebiet.

Wenn dein Lieblingskatalog "unbekannt" ist oder sich in der falschen Gruppe befindet, informiere bitte Magnus Manske (Diskussionsseite).

Neue Kataloge erstellen

Du kannst einen neuen Katalog erstellen und entweder eine Liste der Kandidaten zum Abgleichen angeben (am besten aus einer Tabelle kopiert) oder ein Werkzeug erstellen, das die Kandidaten automatisch auflistet. Frage ansonsten Magnus Manske (Diskussionseite), damit er einen Katalog für dich importiert.

Tipps

  • Das Feld Wikidata property kann genutzt werden, wenn es für den externen Identifikator eine Eigenschaft gibt. Du kannst eine Eigenschaft für einen externen Identifikator auf Wikidata:Property proposal vorschlagen.
  • Erstelle für das Feld Beschreibung soweit möglich detaillierte Beschreibungen. Dies erleichtert es den Leuten, den Katalog abzugleichen und führt zu weniger falschen Treffern und einer höheren Datenqualität.
  • Du kannst für Datenobjekte Aliasse angeben, um das Abgleichen zu vereinfachen. Gehe in den Katalog und nutze das Menü 'Action', um Aliasse zu importieren. Die Option 'Aliasse' führt dich auf eine Seite, auf der du alternative Bezeichnungen für Einträge in die mix'n'match-Datenbank importieren kannst. Diese müssen durch Tabs getrennt sein und nutzen die externen IDs zur Zuordnung.

Kataloge verwalten

Es gibt einen Katalog-Editor, der vom Katalog-Ersteller und einigen anderen Benutzern (“catalog editors”) über mix-n-match/#/catalog_editor/<id> aufgerufen werden kann. Dort ist es möglich, Eigenschaften des Kataloges zu ändern (Name, Beschreibung, URL, Typ, Sprache und Wikidata-Eigenschaft) und den Katalog zu deaktivieren.

Mit dem Werkzeug erstellte Kataloge können über den Prozess zum Erstellen eines neuen Kataloges aktualisiert werden, indem eine existierende ”Katalognummer” angegeben wird.

Anmerkungen

  1. Du kannst die Q-Nummer entweder als "Q123" oder "123" kopieren. Die Software akzeptiert auch andere Zeichen, wie Anführungszeichen oder Kommas, solange die Q-Nummer gültig ist.