Mix'n'match/Руководство

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Mix'n'match/Manual and the translation is 34% complete.
Outdated translations are marked like this.

Mix'n'match — это созданный Магнусом Манске инструмент, содержащий списки тем из различных внешних источников. Он позволяет сопоставлять их с элементами Викиданных и отмечать те, для которых элементов пока не существует — «вроде красных ссылок на стероидах».

В настоящий момент создано более 2500 каталогов, в том числе Оксфордский национальный биографический словарь (полностью обработан), Австралийский биографический словарь (полностью обработан), каталог Национальной портретной галереи (сопоставлено 52,5% элементов).

Этим способом удобно посмотреть, каких элементов не хватает в конкретном разделе Википедии, или на каком языке определённая тема освещена лучше всего.

Как это работает?

Mix'n'match делит элементы на 5 категорий:

Пример статистики для одного из каталогов.
  1. Сопоставленные вручную: участник связал элемент каталога с элементом Викиданных (сюда же входят элементы, импортированные из Викиданных);
  2. Сопоставленные автоматически: система предложила для элемента каталога возможное соответствие в Викиданных, но это требуется подтвердить или отвергнуть вручную;
  1. Нет в Викиданных: для этих элементов каталога нет соответствующих элементов Викиданных;
  2. Не подходит для Викиданных (N/A): элемент отмечен как неподходящий для Викиданных (например, он повторный, перенаправляет на другой элемент или просто посвящён неподходящей теме);
  3. Несопоставленные: эти элементы каталога ещё не были связаны с Викиданными, и системой не предложено для них вариантов сопоставления.

The aim is, of course, to mark as many possible entries as manually matched (or confirm that there is no possible Wikidata match). To use the tool, you need to register an account on any Wikimedia project, and authorise the WiDaR tool.

Теперь, будучи авторизованным в Widar, вы можете выбрать один из двух режимов работы: полуавтоматический или ручной.

  • Search for a specific name using the search box in the header bar. This will bring you to a search result page.
    • See also List mode below for how to use the list of results.
    • In the search result page, you can also limit the search to a specific catalog.
    • You may also search a Qid; this will return all entries that the item is matched to. Searching external ID is not supported.
    • It is not a guarantee that the search result page contain all entries matching a specific name; in particular the list may be truncated if there are too many results.
  • Select a specific catalog and then go to a catalog page.

In a catalog page, you will see the number of entries in each category, and the history of number of matches. Clicking a specific category brings you to the List mode. You will also see an "Action" menu, including the following:

  • Fully matched, Preliminarily matched, Unmatched, No Wikidata, Not applicable to Wikidata – links to List mode for all entries in this specific category.
  • Multiple matches – links to List mode for all preliminarily matched entries with multiple automatically-suggested matches.
  • Site stats
  • Download
  • Match mode - see below.
  • Recent Changes in this catalog
  • Aliases
  • Jobs
  • Search only in this catalog
  • Names in other catalogs
  • Manually sync catalog
  • Catalog editor
  • Mobile matching
  • Visual tool
  • Find images
  • Changes last week
  • Catalog report

Полуавтоматический (игровой) режим

Пример работы в игровом режиме.

If you choose the match mode (formerly known as semi-automatic mode or game mode), the top of the page you have the ID of the catalog (Catalog ID), the title of the catalog (Catalog Name) and possibly a minimal description supplied from the catalog (Catalog description). This should help you figure out who or what it is.

If the entry is unmatched, you have three choices:

  • Set Q (blue button): If you have identified which Wikidata item matches the catalogue entry, you can paste the Q-number in this box.[1]
  • New item (green button): if you are confident there is no matching Wikidata item. This will create a new Wikidata item for this entry -
  • N/A (красная кнопка): для случая, когда для элемента каталога не может быть элемента Викиданных.
  • Пропустить (серая кнопка): если вы не уверены, просто перейдите к следующему элементу.

In case of doubt or uncertainty, or there is no matching Wikidata item but you do not want to create an item immediately, you may skip this go to the next element by clicking "Next entry".

If the entry is preliminarily matched, you have two choices:

  • Confirmed (green button): Confirms that the proposed entry is correct.
  • Remove (red button): Confirm that the proposed entry is incorrect. The entry will then become unmatched and may be matched to another (potentially new) item.

If there are multiple automatically-suggested matches, only the first of them is shown, and will be used if "Confirmed" is clicked. You may browse or select other matches using the link to the right of the entry name.

Further down are some suggested links from en.wikipedia, with its link to the item on Wikidata. In the event that the correct item is present there, you can just click on the link to the right (eg. "Q384941") and this will register a match. If the correct item is not among the suggestions, you still have the chance to search through Google on all versions of Wikipedia or Wikisource or on Wikidata.

Всегда когда вы создаёте связь между элементом каталога и элементом Викиданных, система автоматически вносит изменения в Викиданные. Это выглядит как правка в вашем вкладе.

(Please note that a few entries on Mix'n'match may not have a property already set up - if you're working on one of these, the match will be saved and updated later, if appropriate)

Режим списка

Пример работы в ручном режиме.

При выборе ручного режима вы увидите список из 50 элементов выбранного каталога. В первых строчках будет указано название и (если доступно) описание элемента. Каждая карточка помечена цветом, обозначающим её статус:

  • You click a specific category (e.g. "Unmatched") in a catalog page - all entries in this category will be shown with fifty entries per page.
  • You browse a search result page.

Formerly it is known as manual mode and it may show fifty entries among all categories; this option was removed.

On the first line of the list, you will see the name and (where available) the description of the entry. Each card will also show the status of the entities.

Элементы, которым требуется ручная проверка (красные)

For items with no suggested match, the second line will present various links that will allow you to make an automatic search on Wikipedia, on Wikidata or Google (limiting the results only to Wikipedia or Wikidata), or even create the item. In the right column, you will have three choices:

  1. Set Q (green link): clicking here brings up a dialog box where you can enter the number of the Wikidata item (with or without the Q in front of the number).
  1. New item (red link): clicking here will create a new item on Wikidata for that entry, that will automatically get name, description (if present) and ID from the catalogue.
  1. N/A (жёлтая ссылка): нажатием сюда вы указываете, что такого элемента не должно быть на Викиданных.

Во всех трёх случаях как только вы сделали выбор, цвет изменится с красного на зелёный. Если вы задали код элемента Викиданных, система автоматически внесёт изменения в этот элемент через WiDaR, как и в игровом режиме.

Элементы, связанные автоматически (сиреневые)

У элементов с автоматически подобранным соответствием второй строчкой идёт ссылка на элемент Викиданных и сгенерированное на его основе краткое описание. В правой колонке вы увидите 3 варианта действий:

  1. Подтвердить (зелёная ссылка): нажатием сюда вы подтверждаете, что предложенный вариант соответствия верен.
  1. Убрать (красная ссылка): нажатием сюда вы указываете, что на Викиданных не существует соответствующего элемента (но он потенциально может появиться)

Sometimes, a list of alternative matches is available.

При подтверждении сопоставления система, опять же, сделает через WiDaR соответствующую правку в Викиданных.

Элементы, проверенные вручную (зелёные)

For items which have already been matched, the second line will have a link to Wikidata along with an auto-generated summary of the Wikidata entry, or have "Not applicable to Wikidata" shown.

On the right column will be the name of the user who made the link, along with a red "Remove" This link should be used only if you believe that the combination made by someone else is wrong. When combined properly, leave everything as it is and move on.

Note that while making a match causes the Wikidata item to be updated, removing a match (currently) does not. If you remove a match on an item, you may want to open that Wikidata item in a new tab and remove the property there as well - otherwise, it may find its way back into mix'n'match in the future.

Кандидаты на создание

У многих элементов из каталогов нет (на конкретный момент!) соответствий на Викиданных. Некоторые могут не удовлетворять критериям значимости для элементов, но другие входят сразу в несколько каталогов и, таким образом, имеют несколько внешних источников, что существенно подкрепляет их «примечательность». Одноимённые элементы, встречающиеся в нескольких (не менее чем в 3) каталогах, но не имеющие соответствующих элементов в Викиданных, можно увидеть на странице Кандидаты к созданию.

Пример кандидатов к созданию.

The listed entries have the usual search options, to ensure that no item already exists on Wikidata. One can then create a new Wikidata item, with the (English) label pre-filled. Then, the new item can be matched to the applicable entries via Set Q. One can also search Commons for that label; sometimes, an image of that person already exists there!

Caution: Just because these entries have the same name, does not mean they all refer to the same entity. Please check carefully with the individual catalogs!

Советы по сопоставлению

При сопоставлении элементов каталогов с Викиданными держите в голове эти рекомендации:

  • Не пытайтесь угадать: угадывание ведёт к ошибкам в данных. При сомнениях перейдите по ссылке каталога, проверьте другие каталоги внизу страницы элемента и иную информацию (например, координаты). Вы всегда можете пропустить элементы, оставив их другим для сопоставления. Или же вы можете перейти к другому каталогу, о содержании которого знаете больше.
  • Не бойтесь создавать новые элементы: Если в Викиданных нет элемента, точно отражающего тему, пожалуйста, создайте новый. По завершении работы с каталогом гораздо проще будет при необходимости объединить два элемента, чем разделять один на несколько. Например, территория, отнесённая к объектам Всемирного наследия в качестве города, может не совпадать с территорией города как такового, и поэтому для такого объекта нужен отдельный элемент в Викиданных.
  • Не сопоставляйте с элементами неоднозначностей: у страниц значений в Википедии есть свои элементы в Викиданных. Они выполняют роль списка ссылок, а не концепции, с которой можно что-то сопоставить. Так, Bambaia (Q4853316) не подлежит сопоставлению, а Бусти, Агостино (Q395600) подлежит.
  • Не сопоставляйте неоднозначные элементы каталогов: в некоторых авторитетных базах данных тоже существуют страницы неоднозначностей или же синонимов.
    • Например, элемент «Bambaia» из базы RKD Artists ранее был ошибочно связан с Викиданными (сейчас RKD Bambaia корректно перенаправляет на RKD Augustino Busti)
    • Никогда не проводите сопоставление с «неопределёнными именами» из базы GND
  • Проверяйте автоматические сопоставления: Хотя автоматическое сопоставление часто происходит корректно, но иногда всё ещё ошибается при схоже названных элементах.
  • Статус N/A (Не подходит для Викиданных) предназначен только для элементов, у которых никогда не будет корректного соответствия в Викиданных, и для известных повторов в рамках одного и того же каталога.
  • Use the 'jobs' option: The 'action' drop-down menu on any catalogue has a 'jobs' option. This gives you a list of tasks that will help with matching. For example, 'auxiliary matcher' will check the dataset for additional identifiers such as VIAF IDs and check them against existing records in Wikidata. If the automatching process has thrown up a lot of low-quality matches, there is the option to 'purge automatches'.

Сортировка списка каталогов

По умолчанию список каталогов отсортирован по алфавиту. Существует несколько ключевых слов, передаваемых в параметр sort_mode, которые могут изменить это поведение:

  • sort_mode=groups groups catalogs by type/subject area, largest groups first, sorted alphabetically within the respective group. Completed catalogs have their own group at the end
  • sort_mode=groups,by_easiest same as above, but "easiest" (#auto-matched+2*#unmatched) to complete first
  • sort_mode=by_easiest,no_complete ungrouped sorting, but "easiest" to complete first, hiding completed catalogs (as they would be "easiest" by default)
  • sort_mode=groups,complete_inline grouped, but with completed catalogs in their respective subject area.

If your favourite catalog is "unknown" or in the wrong group, please let Magnus Manske (talk) know.

Создание нового каталога

You can create a new catalog and either provide a list of mapping candidates (best to paste them from a spreadsheet) or create a scraper to automatically harvest mapping candidates. Otherwise, ask Magnus Manske (talk) to import a catalog for you.

Tips

  • The field Wikidata property is for when a property exists for external identifiers. You can propose an external identifier property at Wikidata:Property proposal.
  • Create detailed descriptions for the Entry description field where possible, it will often make it much easier for people to match the catalogue, leading to less incorrect matches and higher data quality.
  • You can add aliases to items to help with the matching process. To import aliases, go to the catalogue and use the drop down 'action' menu in the top right. The 'aliases' option takes you to a page where you can import alternative labels for entries in the mix'n'match dataset. It will need to be in a tab separated format, and will use the dataset's external IDs for matching.

Managing catalogs

There is a catalog editor, accessible at mix-n-match/#/catalog_editor/<id> for the catalog creator and a subset of users (“catalog editors”). There it is possible to change some of the catalog properties (name, description, URL, type, language and Wikidata property) and to disable a catalog.

Scraper-based catalogs can be updated by following the catalog creation process, and entering an existing ”Catalog ID”.

Примечания

  1. You may paste the Q-number as "Q123" or as "123". The software accepts also other characters, such as parenthesis or commas, as long as the Q-number you provide is valid.

Ссылки