Community Wishlist Survey 2022/Wikidata/Creation of new objects resp. connecting to existing objects while avoiding duplicates/Proposal/ko
- Problem: 새로 생성된 문서를 기존 객체에 연결하는 문제 각각 다른 언어 버전으로 하루에 수백 개의 새로 생성된 문서에 대해 연결되지 않은 페이지(언제, 어떻게, 누구에 의해, ...)에 대한 새 객체를 생성하고 현재 간의 중복을 방지하는 방법 9,600만 개의 개체 d:Special:Statistics, 실제 솔루션 없이 몇 년 동안 계속해서 논의되었습니다(예: d:Wikidata:Requests for permissions/Bot/RegularBot 2).
- Proposed solution: d:Wikidata:Contact_the_development_team/Archive/2020/09#Connecting newly created articles to existing objects resp. creating new object - additional step when creating articles, categories, etc.에서 가능한 솔루션이 논의되었습니다:
새로 생성된 문서 등을 저장한 후의 추가 단계는 일치하는 위키데이터 객체 목록(예: 같은 이름을 가진 사람 목록, 펫스캔의 중복 확인/제안 목록과 유사한 알고리즘일 수 있음, 이중성 예) 또는 일치하는 사람이 없는 경우 새 객체를 만드는 옵션(객체 유형에 따라 일부 값이 이미 미리 채워져 있고 예를 들어 분류 또는 정보 상자에서 문서에서 가져올 수 있음). 제 관점에서 현재 문제 중 하나는 많은 문서, 분류, 탐색 항목, 틀, 명확성, 목록, 커먼스캣 등의 작성자가 위키데이터의 존재를 인식하지 못하거나 새로 작성된 문서 등을 연결하는 것을 잊었다는 것입니다. 이미 존재하는 객체에 연결하거나, 아직 존재하지 않는 경우 새 객체를 생성하려면 이 생성 개별 연결이 수동으로 수행되지 않고 대신 봇에 의해 나중에 수동으로 병합되어야 하는 경우 (더 많은) 중복이 발생할 수 있습니다.
또한 중복 생성을 방지하고 새 항목을 생성하거나 ID를 기반으로 일치하는 항목을 연결하기 위해 다양한 ID(예: GND, VIAF, LCCN, IMDb, ...)를 확인할 수 있는 특수(객체 유형에 따라, 예를 들어 인간용 봇, 영화용 봇, 건물용 봇 등) 봇이 있을 수 있습니다. .
또한 누군가가 "번역 기능"을 사용하여 다른 언어 버전의 번역된 문서를 생성하면 새로운 번역된 문서가 자동으로 원본 문서의 객체에 연결될 수 있습니다. 그리고 버전 가져오기(번역 후) 후, 순간에 종종 위키데이터 개체에 대한 링크가 손실되고 문서를 수동으로 두 번째 다시 연결해야 합니다.
- Who would benefit: 데이터 품질 향상, 즉 중복 감소
- More comments: 같이 보기:
- Community Wishlist Survey 2021/Wikidata/Creation of new objects resp. connecting to existing objects while avoiding duplicates
- de:Wikipedia:Technische_Wünsche/Wunschparkplatz#Verbinden/Anlegen_von_bestehenden/neuen_Wikidata-Objekten_mit_neu_angelegten_Artikeln/Kategorien_unter_Vermeidung_von_Dubletten
- Phabricator tickets:
- Proposer: --M2k~dewiki (talk) 18:17, 10 January 2022 (UTC)