Jump to content

언어 변환기는 단어 대 단어 변환 및 접미사 대 접미사 변환을 지원해야 합니다. (Community Wishlist/W199/ko)

Long-term opportunity
From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Community Wishlist/W199 and the translation is 100% complete.

View all wishes.

Description

현재 언어변환기는 문자 대 문자 변환만 지원합니다. 예를 들어, 중국어 언어 변환기는 "历史"(zh-cn, 간체 사용)를 "歷史"(zh-tw, 번체 사용)로 변환하고, 우즈벡어 언어 변환기는 "Tarix"(uz-Latn, 라틴 스크립트 사용)를 "Тарих"(uz-Cyrl, 키릴 문자 사용)로 변환합니다. 이러한 경우 첫 번째 스크립트의 각 문자는 두 번째 스크립트의 각 문자와 일대일 방식으로 대응합니다.

그러나 언어변환기는 문자 대 문자 기준으로 균일하게 변환할 수 없는 스크립트를 사용하는 언어를 지원하지 않습니다. 예를 들어, 말레이어에서 "wabak"(ms-Latn, 라틴문자 사용)은 "وابق"(ms-Arab, 자위 문자 사용)에 해당하고, "bahasa"(ms-Latn, 라틴문자 사용)는 "بهاس"(ms-Arab, 자위 문자 사용)에 해당합니다. 이 문제를 해결하려면 이러한 언어는 단어 대 단어 기준으로 작동하는 변환기를 사용해야 합니다.

또 다른 중요한 기능은 언어변환기가 접미사-접미사 변환도 지원해야 한다는 것입니다. 예를 들어, 말레이어에서 "memberikan"(ms-Latn)은 접두사 "mem"(ms-Latn), 핵심 단어 "beri"(ms-Latn), 접미사 "kan"(ms-Latn)로 구성됩니다. 연어변환기는 이러한 각 요소를 각각 해당 접두사 "مم"(ms-Arab), 핵심 단어 "بري"(ms-Arab), 접미사 "کن"(ms-Arab)로 변환할 수 있어야 합니다. 마지막으로 이러한 요소를 결합하여 단어 "ممبريکن"(ms-Arab)을 형성해야 합니다.

단어 대 단어 변환과 접사 대 접사 변환을 위한 프로토타입 코딩은 T261507에 설명되어 있습니다.

결론적으로 언어변환기는 문자 대 문자 변환(현재처럼)을 지원할 뿐만 아니라 단어 대 단어 변환(두 개의 다른 문자 사이의 문자가 일대일로 일치하지 않을 수 있음)과 접사 변환도 지원해야 합니다. 동시에 언어변환기는 메타위키 또는 위키기술에 자세한 문서가 있는 다세대 기여자가 지속 가능한 방식으로 유지 관리할 수 있어야 합니다. T370584T21044에서 언급했듯이 언어변환기의 현재 상태는 아직 자세히 문서화되지 않아 장기적인 유지 관리에 대한 우려가 제기되고 있습니다.

Assigned focus area

Unassigned

Type of wish
Feature request
Tags
Affected users

변형 변환이 있는 언어를 사용하는 사용자

Phabricator tasks
Other details
  • Created: 2024년 8월 3일 (토) 11:04
  • Last updated: 2025년 10월 10일 (금) 23:33
  • Author: Hakimi97 (talk)
Voting

This wish currently has 1 supporter. Voting for this wish is open until it is completed.

Supporters of this wish
Support Pppery (talk) 2025년 10월 10일 (금) 16:28