언어 변환기는 단어 대 단어 변환 및 접미사 대 접미사 변환을 지원해야 합니다. (Community Wishlist/W199/ko)
현재 언어변환기는 문자 대 문자 변환만 지원합니다. 예를 들어, 중국어 언어 변환기는 "历史"(zh-cn, 간체 사용)를 "歷史"(zh-tw, 번체 사용)로 변환하고, 우즈벡어 언어 변환기는 "Tarix"(uz-Latn, 라틴 스크립트 사용)를 "Тарих"(uz-Cyrl, 키릴 문자 사용)로 변환합니다. 이러한 경우 첫 번째 스크립트의 각 문자는 두 번째 스크립트의 각 문자와 일대일 방식으로 대응합니다.
그러나 언어변환기는 문자 대 문자 기준으로 균일하게 변환할 수 없는 스크립트를 사용하는 언어를 지원하지 않습니다. 예를 들어, 말레이어에서 "wabak"(ms-Latn, 라틴문자 사용)은 "وابق"(ms-Arab, 자위 문자 사용)에 해당하고, "bahasa"(ms-Latn, 라틴문자 사용)는 "بهاس"(ms-Arab, 자위 문자 사용)에 해당합니다. 이 문제를 해결하려면 이러한 언어는 단어 대 단어 기준으로 작동하는 변환기를 사용해야 합니다.
또 다른 중요한 기능은 언어변환기가 접미사-접미사 변환도 지원해야 한다는 것입니다. 예를 들어, 말레이어에서 "memberikan"(ms-Latn)은 접두사 "mem"(ms-Latn), 핵심 단어 "beri"(ms-Latn), 접미사 "kan"(ms-Latn)로 구성됩니다. 연어변환기는 이러한 각 요소를 각각 해당 접두사 "مم"(ms-Arab), 핵심 단어 "بري"(ms-Arab), 접미사 "کن"(ms-Arab)로 변환할 수 있어야 합니다. 마지막으로 이러한 요소를 결합하여 단어 "ممبريکن"(ms-Arab)을 형성해야 합니다.
단어 대 단어 변환과 접사 대 접사 변환을 위한 프로토타입 코딩은 T261507에 설명되어 있습니다.
결론적으로 언어변환기는 문자 대 문자 변환(현재처럼)을 지원할 뿐만 아니라 단어 대 단어 변환(두 개의 다른 문자 사이의 문자가 일대일로 일치하지 않을 수 있음)과 접사 변환도 지원해야 합니다. 동시에 언어변환기는 메타위키 또는 위키기술에 자세한 문서가 있는 다세대 기여자가 지속 가능한 방식으로 유지 관리할 수 있어야 합니다. T370584과 T21044에서 언급했듯이 언어변환기의 현재 상태는 아직 자세히 문서화되지 않아 장기적인 유지 관리에 대한 우려가 제기되고 있습니다.
Unassigned
변형 변환이 있는 언어를 사용하는 사용자