위키데이터로 데이터를 가져올 수 있는 Harvest Templates 도구 개발을 계속합니다. (Community Wishlist/W373/ko)
현재 영어 위키백과에는 위키데이터보다 더 많은 데이터가 있는 경우가 많습니다.


위키데이터가 유용하려면 최소한 영어 위키백과만큼의 데이터가 있어야 합니다. 예를 들어, 위키데이터보다 API를 통해 영어 위키백과에서 데이터를 쿼리하는 것이 더 합리적이며, 위키데이터의 핵심이 데이터인 항목에서 많은 데이터가 누락되는 경우가 있습니다.
사람들이 위키백과에서 템플릿을 사용하면 종종 템플릿에서 데이터를 가져올 수 있습니다.
이것이 바로 Harvest Template 도구를 사용하면 가능한 일입니다.
예를 들어, IMDb 템플릿에서 영화의 IMDb ID를 가져오거나, 말하는 위키백과 템플릿에서 음성 텍스트 오디오를 가져올 수 있습니다. 템플릿은 {{IMDb title|ID|description=xyz}}처럼 보일 수 있으며, 템플릿에서 ID를 읽을 수 있습니다.
그러나 더 이상 개발되지 않았지만 수정하기 매우 복잡하지는 않지만 이 도구를 매우 유용하게 만들 수 있는 몇 가지 문제가 있습니다. 적어도 예를 들어 수동으로 위키데이터를 편집하는 것과 비교하면 그렇습니다.
- 쿼리의 음성 텍스트 오디오 가져오기에 대해 언어 한정자를 영어로 설정하는 것과 같이 한정자를 설정할 수 없습니다(문제 #210)
- 가져오기를 시작하면 약 30초 후에 실패하고, 항목 수가 약 17개 정도 되면 결과 창이 비어 버립니다. (문제 #209) (나중에 알고 보니 여러 파일이 아직 위키미디어 커먼즈에 내보내지지 않았기 때문이었습니다.)
가져올 수 있는 항목의 아주 불완전한 목록(다른 언어에도 사용할 수 있음)은 pltools.toolforge.org/harvesttemplates/share.php입니다.
MisterSynergy는 이 도구가 더 이상 활발하게 개발되지 않는다고 썼습니다. 기술적으로 보면, Pasleim이 2022년 말 위키데이터 참여를 중단하기 직전에 자신의 도구와 봇을 저에게 넘겨준 후, 저는 사실상의 소유자가 되었습니다. 봇 개발에 많은 노력을 기울이고 더욱 강력하게 만들었지만, 웹 사용자 인터페이스를 갖춘 몇 안 되는 도구는 제 기술 범위에 속하지 않습니다. 따라서 저는 이 도구들에는 손대지 않을 것입니다. 작동하는 한, 작동하는 것이고, 없어지면 아무것도 하지 않을 것입니다. 하지만 Pasleim의 코드 대부분은 CC0 라이선스를 따르므로, 다른 관리자가 저장소를 포크하여 개선된 도구를 만들 수 있습니다. 명확하고 안정적인 후속 도구가 있다면, 포크 간의 불필요한 경쟁을 피하기 위해 현재 도구 URL을 후속 도구로 리디렉션하는 것도 고려할 것입니다. Pasleim의 코드 중 일부는 Github에서, 나머지는 Toolforge의 "pltools"와 "plnode" 도구에서 확인할 수 있습니다. GitHub 저장소
위키데이터가 위키백과보다 더 많은 데이터를 가지고 있다면, 이를 위키백과의 정보상자 등에 대규모로 데이터를 추가하는 데 사용할 수도 있습니다.
이건 그렇게 중요한 문제는 아닐지 몰라도, 위키데이터에서는 중요한 문제라고 생각합니다. 애초에 IMDb ID를 위키백과 템플릿에서 가져오는 건 안 되지만, 영화 데이터를 대량으로 가져오는 방식을 통해서만 다른 데이터를 가져올 수 있습니다.
Unassigned
위키데이터 사용자, 위키데이터 기여자
- Created: 22:48, 14 April 2025
- Last updated: 21:32, 18 March 2026
- Author: Prototyperspective (talk)
This wish currently has 3 supporters. Voting for this wish is open until it is completed.