Jump to content

다중 표기법의 위키백과

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Wikipedias in multiple writing systems and the translation is 100% complete.

이 문서는 다중 표기법을 사용하는 각 위키백과에 대해 설명합니다.[1] 자동 스크립트가 필요한 아래 나열된 언어 중 하나를 모국어로 사용하는 경우 문자 체계 간의 변환에 대해 알아보려면 문자와 음역 규칙이 포함된 비교표를 작성하는 데 도움을 주시면 감사하겠습니다. 그런 다음 그러한 변환기를 만드는 데 도움을 드릴 수 있습니다.

음역 노력과 환영 도움말을 통합하는 데 도움이 되는 일부 제3자 사이트가 있습니다. (원본 메시지는 Kprwiki가 작성했습니다)

온라인에서 사용 가능한 기존 음역 도구를 볼 수도 있습니다.

자동 변환 시스템이 있는 언어

이러한 언어로 된 위키는 미디어위키 소프트웨어 내에서(자세한 기술 정보는 MediaWiki.org 문서 참조) 또는 로컬 스크립트 또는 가젯을 통해 구현된 언어 변환 시스템입니다.

전체 지원

앵글로색슨어에는 라틴어와 룬 문자의 두 가지 쓰기 체계가 있습니다. 앵글로색슨어 위키백과의 모든 페이지에서 자동 음역 시스템이 이미 활성화되어 있습니다.

발리어에는 라틴어와 발리 문자라는 두 가지 쓰기 체계가 있습니다.

자동 음역 시스템이 발리 프로젝트에서 개발되어 라틴 문자를 발리 문자로 변환하는데 역변환 시스템이 지원되는지 여부는 불분명합니다.

라틴어 문자에는 세 가지 변형이 있습니다:[2]

  1. DHARMA 음역(ban-x-dharma)
    DHARMA 프로젝트 "엄격한 음역"을 따르는 음역 규칙입니다.
    대부분 ISO 15919를 따르며 엄밀성과 더 넓은 적용 범위를 수정했습니다.
  2. Palmleaf.org 음역(ban-x-palmleaf)
    Palmleaf.org용으로 개발된 음역 규칙.
  3. 푸리 카우한 우붓 음역(ban-x-pku)
    음역 규칙은 푸리 카우한 우붓에서 개발되어 발리에서 널리 사용됩니다.
    또한 기본 발리어에서 라틴어로의 음역 변형입니다.

백화문(일명 표준 중국어(cmn), 위키미디어 사이트에서 중국어 매크로 언어 코드 zh 사용) 언어에는 두 가지 주요 쓰기 시스템이 있습니다: 간체 중국어 간체(zh-Hans)와 중국어 번체(zh-Hant)는 현지화된 어휘와 다른 시노폰 영역의 구문.

중국어 위키백과(zhwiki)는 일부 다른 zh.wiki* 프로젝트[note 1]와 함께 6가지 변형을 지원합니다:

  1. Simplified Chinese (중국 본토) (zh-Hans-CN)
  2. Traditional Chinese (홍콩) (zh-Hant-HK)
  3. Traditional Chinese (마카오) (zh-Hant-MO)
  4. Simplified Chinese (말레이시아) (zh-Hans-MY)
  5. Simplified Chinese (싱가포르) (zh-Hans-SG)
  6. Traditional Chinese (타이완) (zh-Hant-TW)

URL, 위키데이터 레이블 및 아마도 데이터베이스 체계 내에서 변형 태그는 zh-cn, zh-hk, zh-mo, zh-my, zh-sg 및 zh-tw로 단순화됩니다. 그러나 위키데이터의 경우 현재 (zh-hans, zh-hant 및 원래 "zh"와 함께) 어떤 변종을 사용해야 하고 어떤 것을 사용하지 않아야 하는지 명확하지 않습니다.

변형은 특수:번역 기반 /zh 번역 페이지에서도 지원됩니다.

버그 보고서 및 기능 요청은 zh 위키백과에(언어 장벽이 있는 사용자를 위해 토론 페이지 사용) 제출할 수 있습니다.

고트어에는 라틴어와 고트어의 두 가지 표기법이 있습니다. 자동 음역 시스템은 고트어 위키백과의 모든 페이지에 이미 활성화되어 있습니다.

업데이트 2024년: 이 자동 음역 시스템은 벡터 2022 버전에서는 작동하지 않습니다. 변환을 위해 다른 스킨으로 전환하는 것을 고려해보세요.

캐나다에서 사용되는 이누이트어에는 두 가지 표기법이 있습니다. 이누이트어 음절문자누나부트 영토의 일부에서 사용되는 반면 다른 지역에서는 라틴 알파벳을 사용합니다. 둘 사이에 자동 변환 시스템(영어 페이지)이 생성되었습니다. 그러나 음절문자에는 대문자가 없기 때문에 음절에서 라틴어로 변환하면 소문자 라틴 문자만 표시됩니다.

자동 변환은 이누어트어 위키백과에서 활성화되어 있습니다. 변형 코드는 위키백과의 "iu"(ISO 639-1 매크로 언어)를 사용하지 않지만 음절에는 ike-Can을, 라틴어에는 ike-Latn을 사용하고 있습니다.

Tracked in Phabricator:
Task T199895

쿠르드어는 지역에 따라 세 가지 표기법을 사용합니다:

  • 로마자는 터키와 시리아에서 사용되며,
  • 이라크와 이란의 아랍어 문자,
  • exUSSR의 키릴 문자이지만 더 이상 사용되지 않기 때문에 이 문자 표기법은 여기에서 가져오지 않습니다.

쿠르드어 위키백과는 라틴어/아랍어 두 가지 표기법에 대한 자동 변환 시스템을 지원합니다.

쿠르드어 라틴어-아랍어 변환기.

타셸히트어에는 티피나그 문자와 로마자의 두 가지 표기법이 있습니다. 일부 자료에서도 아랍어 문자가 설명에 사용되었다고 언급했지만 이 주제에서 사용하기에는 너무 오래되었습니다.

티피나그 문자에서 라틴어로의 자동 음역 시스템이 테스트 위키에서 지원되었으며, 역변환은 최근 미디어위키 소프트웨어에 배포되었습니다.

Tracked in Phabricator:
Task T59138

우어에는 간체 중국어와 번체 중국어의 두 가지 주요 문자 체계가 있습니다.

두 쓰기 시스템 간의 자동 변환은 중국어 위키백과와 마찬가지로 바람직합니다. 최근 미디어위키 1.41부터 지원됩니다.

부분 지원

광둥어 번체에서 광둥어 간체 한자로

광둥어는 번체 또는 간체로 작성할 수 있습니다.

광둥어 위키백과에는 자바스크립트 가젯으로 작성된 번체에서 간체 문자로의 단방향 변환 시스템이 있습니다. (이 파브리케이터 작업은 시스템 제공 변환기로 변경하는 프로세스를 자세히 설명합니다.) 모든 문서는 번체 문자로 작성 및 편집됩니다. 번체에서 간체로 변환하는 것이 간체에서 번체로 변환하는 것보다 더 안정적이기 때문입니다. 간체 문자는 일부 구분을 지웁니다. 전통적인 문자에 보존되어 있습니다.

광둥어 번체 문자를 광둥어 로마자로 표기하기

광둥어는 로마자로 표기할 수도 있습니다. 기존의 세 가지 주요 광둥어 로마자 표기 변형이 있습니다. 광둥어의 Penkyamp 로마자 표기, 월어병음방안(줄여서, 월병 또는 Jyutping) 및 광둥어의 예일식 로마자 표기입니다. 광둥어 위키백과는 결국 세 가지 로마자 표기 버전을 모두 음역 기능으로 통합하여 광둥어 및 비원어민 광둥어 독자가 세 가지 철자법 모두에서 광둥어 문서를 읽을 수 있도록 하는 것을 목표로 할 수 있습니다.

Penkyamp 음역 도구는 여기에서 찾을 수 있습니다. 중국어에서 Penkyamp로의 전체 목록은 여기에서 찾을 수 있습니다.

Tracked in Phabricator:
Task T23582 resolved
Tracked in Phabricator:
Task T326864 invalid

크림 타타르어에는 세 가지 주요 문자 체계가 있습니다. 그들은 라틴어, 키릴 자모 및 아랍어입니다.

크림 타타르어 위키백과는 주로 라틴어 문자를 사용하지만, 러시아에 의해 이 지역이 병합된 이후로 크림반도에서는 키릴 문자가 "사실상" 공식 문자로 사용되었습니다.

미디어위키 핵심 코드 기반에 대한 주요 작업과 함께 라틴어와 키릴 자모 간의 변환은 크림 타타르어 위키백과 및 크림 타타르어 테스트 위키낱말사전 프로젝트로 개발되었습니다.

우리는 여전히 크림 타타르 아랍어 스크립트에 대한 의견에 대한 자원 봉사자를 기다리고 있습니다. 크림 타타르어-아랍 변환 의견도 있어야합니까? 토론 페이지에서 의견을 알려주세요.

2023년 1월부터는 루마니아 크리미안 타타르어 방언인 도브루잔 타타르어(crh-RO)에 대한 지원을 추가하는 논의도 진행 중입니다.

간어에는 세 가지 주요 문자 체계가 있습니다. 간체 간체와 번체 간체와 로마자화된 간체입니다.

간어 위키백과에는 현재 두 가지 표기법(간체 간체 및 번체 간체)에 대한 자동 변환 시스템이 있지만 로마자 간체로 변환되지 않습니다. 간어 사용자가 아닌 사람들이 간어를 더 쉽게 배우고 이해하려면 로자자화된 간어로 자동 변환하는 것이 바람직합니다.

세르비아어에는 키릴 자모(sr-Cyrl)와 라틴어(sr-Latn)의 두 가지 표기법이 있으며 두 가지 주요 방언이 있습니다. 따라서 이론적으로 언어에는 네 가지 변형이 있습니다.

  1. 키릴 문자 에카비안(sr-Cyrl-ekavsk)
  2. 라틴 문자 에카비안(sr-Latn-ekavsk)
  3. 키릴 문자 이예카비안(sr-Cyrl-ijekavsk)
  4. 라틴 문자 이예카비안(sr-Latn-ijekavsk)

세르비아어 위키백과는 두 가지 표기법에 대한 자동 변환 시스템을 지원하지만 둘 사이에 차이가 거의 없기 때문에 방언은 지원하지 않습니다.

현재 변형 코드는 "sr-ec" 및 "sr-el"이 잘못되었습니다. 패치가 수정되기를 기다리고 있습니다.

Tracked in Phabricator:
Task T268033 resolved

세르보크로아트어는 4개의 표준화된 변종(보스니아어, 크로아티아어, 몬테네그로어 및 세르비아어), 2개의 주요 발음(Ijekavian 및 Ekavian) 및 2개의 쓰기 시스템/문자를 포함하는 다원적 언어입니다: 라틴어(sh-Latn) 및 키릴 자모(sh-Cyrl). 편집자들 간의 합의에 따라 2022년 12월 1일에 세르보크로아티아어 프로젝트에 단방향 라틴-키릴 자모 음역이 구현되었습니다(hbs를 사용하고 현재 hbs에는 변환 지원이 없는 세르비아-크로아티아어 위키여행 테스트 프로젝트 제외).

두 문자에 대한 변환기를 구현하기 위한 제안이 여기에서 제안되었습니다.

타지크어는 지역별로 세 가지 표기법을 사용하며,

  • 타지키스탄의 키릴 문자.
  • 아프가니스탄의 아랍 문자.
  • 라틴 문자.

타지크어 위키백과에는 현재 두 가지 표기법(키릴 자모 - 라틴어)에 대한 자동 변환 시스템이 있지만 페르시아-아랍어로는 자동 변환되지 않습니다.

tajpers.narod.ru에서 키릴 자모 - 페르시아-아랍어 변환 시스템 개발에 대한 참조를 참조하세요.

Tracked in Phabricator:
Task T258975 resolved

탈리시어에는 라틴어, 키릴 자모 및 페르시아 아랍어의 세 가지 표기법이 있습니다.

라틴어에서 키릴 자모로의 단방향 자동 음역 시스템이 개발되었습니다. 아직 반대 방향을 지원하지 않으며 탈리시어 아랍 문자에 대한 지원도 없습니다.

우즈베크어에는 세 가지 표기법이 있습니다.

  • 라틴어,
  • 키릴 문자 및
  • 아랍 문자.

우즈베크어 위키백과에는 현재 두 가지 표기법(라틴어 - 키릴 자모)에 대한 자동 변환 시스템이 있지만 페르시아-아랍어로는 자동 변환되지 않습니다.

아프가니스탄에서는 페르시아-아랍 문자가 사용되기 때문에 세 가지 표기법 간의 자동 변환이 바람직합니다. 아랍어로의 변환기가 개발될 수 있고 언젠가 배포된다면 남부 우즈베크어 위키백과 테스트는 불필요할 것입니다.

기존 자동 변환 시스템이 있는 언어 구현

이러한 언어의 위키는 자동 언어 변환을 지원하지 않지만 독자가 다른 스크립트로 위키를 읽을 수 있도록 도와주는 유용한 외부 도구가 있습니다. 가까운 장래에 이러한 도구가 위키 또는 미디어위키 소프트웨어에 도입될 수 있기를 바랍니다.

해당 위키에서 사용되는 언어 스크립트에 관하여:

  1. 가장 많이 사용되는 스크립트를 선택했습니다.
  2. 또는 탐색을 위한 틀이 있을 수도 있고 없을 수도 있는 두 개 이상의 스크립트로 된 페이지가 있습니다.

Tracked in Phabricator:
Task T31218 declined

아제르바이잔어에는 라틴어, 키릴 자모 및 페르시아-아랍 문자의 세 가지 표기법이 있습니다.

아제르바이잔어 위키백과는 라틴어 문자로 작성되었습니다.

그러나 라틴어와 페르시아-아랍 문자의 비호환성으로 인해 2015년 7월에 남아제르바이잔어 위키백과가 만들어졌습니다.

다게스탄에 거주하는 아제르바이잔인이 위키를 읽을 수 있도록 하려면 라틴어와 키릴 문자 간의 자동 변환이 바람직합니다.

바탁어는 라틴 문자와 바탁 문자(Surat Batak)를 사용하여 작성할 수 있습니다. 이미 라틴어 - Surat Batak 변환기가 있습니다 [2].

벨로루시어(고전공식 철자법)

벨로루시어에는 키릴 문자와 라틴 문자의 두 가지 표기법이 있습니다.

또한 이 언어는 고전 벨라루시어(1933년까지 사용)과 1933년에 도입된 러시아어화공식 벨라루시어의 두 가지 철자로 작성되었습니다. 이 상황에서는 두 개의 별도 벨로루시어 위키백과를 만들어야 했습니다. 둘 다 키릴 문자로 작성되었습니다.

따라서 라틴어 변환기의의 도입은 특히 벨로루시 이주민벨로루시 민주 야당 모두에게 시급한 요구입니다.

키릴 자모와 라틴어 간, 고전어와 공식 벨로루시어 간을 변환하는 다용도 변환기도 있습니다:

또한, 이 변환기는 키릴 문자 또는 라틴 문자로 작성된 루테니아어 외에 다른 것이 없는 고대, 즉 고대 벨로루시어로의 변환도 제공합니다.

NB1: 다음 변환기는 피해야 합니다:

벨로루시 키릴 자모에서 벨로루시 라틴 알파벳으로 변환하지 '않기하지만, en:Instruction on transl라틴 문자로 된 벨로루시 지명의 공식 문서 이터레이션에 따라 러시아 로마자 표기 모델에 따라 벨로루시 키릴 자모를 음역하기 때문에, 벨로루시어 라틴 알파벳에 대한 공식적인 역할을 거부합니다.

마지막으로 중요한 것은 20세기 중반까지 벨로루시어가 이슬람교도들에 의해 제3의 국가 알파벳, 즉 벨로루시 아랍 문자로 알려진 아랍 문자로 작성되었다는 것입니다. 키릴/라틴어 - 아랍어 변환기는 아직 개발되지 않았지만 일부 학자들은 이를 위해 노력하고 있습니다. 바시키르어, 벨로루시어, 크림 타타르어 및 타타르어에 사용되는 아랍어 문자를 인코딩하기 위한 개정 제안도 참조하세요.

NB2: 2021년 후반에 라틴 알파벳 기반 벨로루시어 위키백과, 즉 벨로루시어 위키백과 라틴어 프로젝트가 시작되었습니다.

부기어는 라틴어 스크립트와 론타라 문자를 사용하여 작성할 수 있습니다. 라틴어 - 론타라 변환기가 이미 있으며 약간만 수정하면 이상적입니다.

체첸어에는 키릴 문자와 라틴 알파벳의 2가지 표기법이 있습니다.

러시아 연방 외부에 거주하는 많은 체첸족은 키릴 문자를 읽을 수 없기 때문에 키릴 문자에서 라틴어 표기법으로 자동 변환하는 것이 바람직합니다.

콘칸어에는 데바나가리 문자, 라틴 문자, 칸나다 문자, 아랍 문자 및 말라얄람 문자의 5가지 표기법이 있습니다. 콘칸어 위키백과에는 데바나가리 문자, 라틴 문자, 칸나다 문자에 대한 문서가 있습니다. 문자 변환기에 대한 프로젝트가 있지만 아직 개발되지 않았습니다.

위키 시스템이 없는 외부 도구인 콘칸어변환기는 수동으로 텍스트를 음역하는 데 사용됩니다.

미디어위키의 언어변환기 시스템이 스크립트 변환을 구현하는 데 사용될 수 있는지 조사할 필요가 있습니다.

세 스크립트 간의 음역 도구인 기르깃(Girgit)이 GPL에 따라 출시되었습니다. 콘칸어 위키백과에 통합될 수 있는지 조사할 가치가 있습니다.[3][4]

카라칼파크어에는 라틴어와 키릴 문자의 두 가지 쓰기 체계가 있습니다.

현재 카라칼파크어 위키백과는 라틴어 문자를 사용하고 있으며 변환 시스템이 없습니다.

Transliteration.kpr.eu에 카라칼파크어 변환기가 있으며 키릴 자모에서 라틴어로의 변환을 지원하지만 역변환은 현재 작동하지 않습니다.

키르기스어에는 세 가지 주요 문자 체계가 있습니다. 이들은 키릴 키르기스어, 라틴화 키르기스어, 페르시아어-아랍 키르기스어(중국 신장에서 사용)입니다.

중국의 키르기즈는 키릴 문자를 사용하지 않기 때문에 세 가지 문자 시스템 간의 자동 변환이 바람직합니다.

중국에 거주하는 키르기스족도 키릴 문자에 대한 지식이 없어도 위키백과에 기여할 수 있도록 아랍어에서 키릴 문자로 변환기(임시 소스 코드)가 개발 중입니다.

라즈어에는 조지아어 문자와 라틴 문자의 두 가지 표기법이 있습니다. 조지아어로의 자동 변환은 조지아에서 더 많은 라즈어 사용자가 사용할 수 있도록 하는 것이 좋습니다.

알파벳은 조지아어와 라틴어로 위키백과에 있습니다.

폴란드어는 일반적으로 라틴 문자로 작성됩니다. 그러나 서부 벨로루시에서 가톨릭 신자들은 대부분 폴란드인으로 신분을 밝히고 폴란드어로 정의되는 현지 슬라브어를 사용합니다. 그러나 그들은 라틴 문자에 대한 지식이 없습니다. 따라서 (대부분 경건한) 폴란드어 책이 키릴 문자로 출판됩니다.[5]

폴란드어 위키백과에 이러한 폴란드어 키릴 문자로의 변환기를 제공하면 300,000명의 폴란드 소수 민족이 세계에서 가장 큰 위키백과 중 하나인 폴란드 위키백과에 접근할 수 있습니다.

이러한 종류의 쉽게 사용할 수 있는 변환기가 있습니다.

신드어는 수정된 페르시아 문자데바나가리 문자를 사용하여 작성할 수 있습니다. 인도에 있는 대부분의 신디족 젊은이들은 페르시아 문자를 모르고 데바나가리 문자를 사용하므로 현재 위키백과는 파키스탄에 있는 사람들만 사용할 수 있습니다.

신드어 아랍어에서 데바나가리 문자로의 변환 도구를 만들고(이 표이 표를 기반으로) 테스트한 다음 신드어 위키백과에 설치하여 탭을 클릭하면 데바나가리 문자에서 신드어 문서를 읽을 수 있습니다. 또한 신드어 데바나가리 문자로 작성된 별도의 위키가 필요하지 않습니다.

순다어는 라틴 문자와 순다 문자(Aksara Sunda)를 사용하여 작성할 수 있습니다. 이미 라틴어 - 악사라 순다어 변환기 [3]가 있습니다.

타타르어에는 세 가지 주요 문자 체계가 있습니다. 이들은 키릴 타타르어, 라틴화 타타르어 및 페르시아-아랍어 타타르어입니다.

타타르어 문자 충돌을 피하기 위해 세 가지 표기법 간의 자동 변환이 매우 바람직했습니다.

2021년 9월 현재 baltoslav.eu에서 사용할 수 있는 타타르 키릴 문자에서 라틴어로의 변환 도구가 있지만 역변환은 아직 지원되지 않습니다.

투르크멘어에는 라틴어(투르크메니스탄에서 사용), 페르시아 아랍어 문자(이란과 아프가니스탄에서 사용) 및 키릴 문자(역사적으로 투르크메니스탄에서 사용)의 세 가지 표기법이 있습니다.

공식적으로는 투르크멘어가 라틴 알파벳으로 표시되지만 오래된 키릴 문자가 여전히 널리 사용되며 니야조프 대통령의 권위주의적 통치에 반대하는 많은 정당들이 계속 키릴 문자를 사용하기 때문에 세 가지 문자 체계 사이의 자동 변환이 바람직합니다. 웹사이트와 출판물에서 니야조프가 만든 문자와 거리를 둘 가능성이 가장 높습니다.

위구르어에는 아랍어, 라틴어 및 키릴 문자의 세 가지 문자 체계가 있습니다.

라틴 알파벳은 터키, 서부 국가 및 신장 일부 지역의 위구르인이 사용하고, 키릴 문자는 CIS 국가에서 사용되는 반면, 페르시아-아랍 문자는 공식적으로 신장에서 사용됩니다.

선호도가 다른 사용자 간의 충돌을 방지하려면 세 가지 표기법 간의 자동 변환이 바람직합니다. 실제로 존재합니다: 율훈.

이전에 자동 변환 시스템을 사용했던 언어, 이제 제거됨

Tracked in Phabricator:
Task T268143 resolved
Tracked in Phabricator:
Task T350684 resolved

카자흐어에는 키릴 자모(kk-Cyrl), 라틴어(kk-Latn), 페르소아랍어(kk-Arab)의 세 가지 표기법이 있습니다.

2023년 말에 카자흐어에 대한 미디어위키 언어 번역이 삭제되었습니다.

T351896에 따라 적절한 새로운 변환 시스템을 다시 도입하자는 제안이 있습니다. 그 전에 라틴 문자 사용자의 경우 [4]를 사용하고, 아랍 문자 사용자의 경우 [5]를 사용해 보세요.


자동 변환 시스템이 없는 언어

불행히도 이러한 언어는 위키 내부 또는 외부에서 언어 변환을 지원하지 않습니다. 해당 내용에서 사용하는 스크립트에 대한 문제는 위의 섹션과 동일합니다. 필요한 변환 시스템의 유사성에 따라 정렬됩니다.

가까운 장래에 언어 변환 도구가 개발되고 배포될 수 있기를 바랍니다.

아랍어, 키릴 문자 및 라틴어

슈그니어에는 라틴어, 키릴 자모 및 페프시아-아랍어 문자의 세 가지 표기법이 있습니다.

The 슈그니어 위키백과 테스트는 키릴 문자, 라틴 문자 및 아랍 문자로 작성되었습니다.

위키미디어 인큐베이터에서 라틴어와 키릴 문자 사이의 자동 변환은 타지키스탄의 40,000명 슈그니어 사용자들과 아프가니스탄의 20,000명 슈그니어 사용자들이 위키를 읽을 수 있도록 하는 것이 바람직합니다. 슈그니어 아랍 문자로 음역은 나중에 만들 수 있습니다.

키릴 및 라틴어

보스니아어는 라틴어와 키릴 문자의 두 가지 표기법을 사용합니다. 현재 보스니아어 위키백과는 라틴어 문자를 사용하지만 키릴 문자는 지원하지 않습니다. 일부 자료에서는 보스니아어가 1900년대 이전에 아랍 문자를 사용했지만 현대 개발에는 유용하지 않다고 언급했습니다.

보스니아어를 위한 키릴-라틴 문자 변환기는 완벽할 것입니다.

로지반은 라틴어와 키릴 자모 모두로 작성될 수 있습니다. 로지반 문법 위키백과 문서를 참조하세요.

노가이어는 키릴 문자와 라틴어 스크립트 모두로 작성할 수 있으며 인큐베이터의 노가이어 테스트 위키백과는 대부분 키릴 문자로 작성되었지만 커뮤니티에서는 콘텐츠를 라틴어로도 표시할 수 있도록 요청했습니다.

Tracked in Phabricator:
Task T169453 declined

루마니아어는 라틴 문자나 키릴 문자를 사용하여 작성할 수 있습니다. 현재 루마니아어 위키백과는 라틴어 문자만 사용합니다. 일부 사용자는 키릴 루마니아어를 "몰도바어"로 표시해야 한다고 생각하기 때문입니다.

프로젝트 종료 제안/몰도바 위키백과 2 삭제에 따라 두 쓰기 시스템 간의 자동 변환이 고려되었습니다. 그러나 여러 대규모 커뮤니티 분쟁으로 인해 오늘날 고려 사항은 금지 영역에 빠지고 다시 건드릴 가능성은 없습니다.

전 인큐베이터 관리자가 팬덤에서 키릴 루마니아어(또는 원하는 경우 몰도바어) 프로젝트를 사용할 수 있다고 설명했습니다.

블라흐 롬어는 크게 두 가지 주요 표기법을 가지고 있습니다. 이들은 라틴화 롬어와 키릴 롬어입니다.

아랍어 및 라틴어

브라후이어에는 아랍어 문자와 라틴 문자의 두 가지 주요 문자 체계가 있습니다. 이 때문입니다:

  1. 현재 온라인 아랍어 키보드에는 브라후이어에 필요한 모음 수가 없습니다.
  2. 단어의 위치에 따라 모음이 자음으로 사용되기도 합니다. 이것은 브라후이어로 문해력 교육을 받고 있는 사람들에게 매우 혼란스럽습니다.

두 문자 사이를 변환할 수 있는 시스템은 언어의 성장을 방해하는 문자 문제를 해결하는 데 도움이 됩니다.

코메링어에는 라틴어(공식적으로 사용됨), 아랍어(현지 무슬림이 사용함), 코메링(그러나 현재 유니코드에는 등록되어 있지 않아 레장 문자로 취급함)의 세 가지 주요 문자 체계가 있습니다. 전환 시스템 개발을 고려하는 아이디어는 incubator:Talk:Wp/kge/Halaman Utamo에서 논의됩니다.

말레이어는 일반적으로 루미(Rumi)라는 라틴 알파벳을 사용하여 작성되지만 자위 문자라는 수정된 아랍 문자도 존재합니다. 루미와 자위 문자는 브루나이에서 공동 관리입니다. 현재 자위 문자를 보존하고 말레이시아의 말레이인들 사이에서 다시 사용하기 위한 노력이 진행 중이며 말레이시아에서 말레이어 시험을 치르는 학생들은 자위 문자를 사용하여 질문에 답할 수 있습니다. 그러나 라틴 알파벳은 공식 및 비공식 목적으로 말레이시아에서 여전히 가장 일반적으로 사용되는 문자입니다.

라틴어에서 자위 문자로의 자동 변환을 설정해야 합니다.

참조:

아랍 문자 및 브라만 문자

하리아나어에는 두 가지 문자 체계가 있습니다. 인도에서 사용되는 데바나가리 문자와 파키스탄에서 사용되는 샤무키 문자(수정된 아랍어 문자)입니다.

현재 인큐베이터에 대한 하리아나어 위키백과 테스트에는 샤무키 문자로 작성된 훨씬 더 많은 문서(2023년 후반부터 채워짐)가 있으며, 데바나가리 문자로 작성된 일부 문서는 최소 5년 전에 작성되었습니다.

Tracked in Phabricator:
Task T12034 declined

카슈미르어에는 세 가지 문자 체계가 있습니다. 이들은 데바나가리 카슈미르, 페르시아-아랍 카슈미르 및 로마화된 카슈미르입니다.

카슈미르어 문자 충돌을 피하기 위해 세 가지 표기법 간의 자동 변환이 매우 바람직합니다. 그러나 정확한 변환 스크립트는 개발하기가 매우 어렵습니다([6]도 참조).

펀자브어

펀자브어를 작성하는 데 사용되는 여러 문자가 있습니다. 파키스탄의 펀자브 지방에서 사용된 문자는 샤무키이며 본질적으로 우르두 문자와 동일합니다. 인도의 펀자브 주에서는 시크교도와 다른 사람들이 구르무키 문자를 사용합니다. 힌두교도와 하리아나 및 히마찰프라데시와 같은 인접 인도 주에 사는 사람들은 때때로 데바나가리 문자를 사용합니다. 샤무키 및 구르무키 문자는 펀자브어를 쓰는 데 가장 일반적으로 사용되는 문자이며 언어의 공식 문자로 간주됩니다.

예를 들어 카자흐어 위키백과와 같이 이 소스[dead link]를 기반으로 한 자동 구르무키 - 샤무키 음역 설정은 어떻습니까?

따라서 모든 사람은 이 두 위키를 구르무키나 샤무키 문자로 읽을 수 있습니다.

타밀어는 아르위(타밀어 아랍 문자)로도 작성할 수 있습니다. 타밀어에서 아르위로 변환 도구를 만들고 테스트한 다음 타밀어 위키백과에 설치하면 탭을 클릭하여 타밀어 문서를 아랍 문자로 읽을 수 있습니다. 또한 아르위로 작성된 별도의 위키가 필요하지 않습니다.

브라만 문자 및 라틴어

마니푸르어는 마니푸르 문자(또는 Meetei Mayek), 벵골 문자라틴 문자를 사용하여 작성할 수 있으며 여러 방언이 있습니다. 인큐베이터에 자동 변환 시스템이 제안되었습니다. incubator:User talk:Artoria2e5#A query 참조.

팔리어데바나가리 문자, 브라흐미 문자라틴 문자를 사용하여 작성할 수 있습니다. 여기에 자동 변환 시스템이 제안되었습니다.

실헤티어실헤티 나가리벵골 아삼 문자를 사용하여 작성할 수 있습니다. 인큐베이터의 실헤티어 테스트 프로젝트는 실헤티 나가리를 독점적으로 사용하고 있으며 일부 토론 페이지에서는 벵골 문자만 사용합니다.

변환 시스템을 만드는 제안은 langcom 메일링 리스트에서 논의되지만 인큐베이터의 설문조사에 따르면 일부 기여자들은 이러한 변환 시스템 구현에 반대하는 의견을 제시한 것으로 나타났습니다.

CJKV 및 라틴어

한자에서 라틴어로의 자동 변환은 어려울 수 있지만 합리적인 정확도로 가능할 수 있습니다. 완전히 자동으로 라틴어를 한자로 변환하는 것은 불가능하거나 극도로 어려우며 지식이 풍부한 사람의 개입 없이는 거의 틀림없이 부정확할 것입니다(실제로 이것은 한 문자의 입력 방법과 유사한 문제입니다). 후자가 없으면 한자의 기여만 가능합니다. 그러면 라틴어 철자법만 아는 기여자들에게 불리할 수 있습니다.

민둥어에는 두 가지 주요 문자 체계가 있습니다. 이들은 중국어 번체 문자와 로마자 복주어(쓰기 시스템은 "Bàng-uâ-cê"로 알려짐)입니다.

현재 민동어 위키백과에는 두 가지 쓰기 시스템에 대한 자동 변환 시스템이 없습니다. 다른 선호도를 가진 사용자 간의 충돌을 피하고 사용자가 모든 단어의 의미를 보다 쉽게 이해할 수 있도록 중국어 번체 문자를 로마자 복주어로 자동 변환하는 것이 바람직할 것입니다.

로마자화된 복주어 목록에 가장 많이 사용되는 6,104개의 한 문자를 여기에서 찾을 수 있습니다.

민둥어 음역 도구는 여기에서 찾을 수 있습니다.

하카어에는 두 가지 주요 문자 체계가 있습니다. 이들은 번체자 및 로마자 하카어입니다(기존 한자 --> 하카어 사전 참조).

하카어 위키백과에는 현재 두 쓰기 시스템에 대한 자동 변환 시스템이 없습니다. 다른 선호도를 가진 사용자 간의 충돌을 피하고 사용자가 모든 단어의 의미를 더 쉽게 이해할 수 있도록 번체 문자에서 로마자 하카어로 자동 변환하는 것이 바람직할 것입니다.

가장 많이 사용되는 4000개의 한자를 로마자로 표기한 하카어 목록은 여기에서 찾을 수 있습니다.

민난어에는 두 가지 주요 문자 체계가 있습니다. 이들은 로마자화된 민난어와 한자로 표기된 민난어입니다.

서로 다른 스크립트 기본 설정을 가진 사용자 간의 기존 충돌을 피하기 위해 로마자화된 민난어 --> 번체 민난어 한자 및 번체 민난어 한자 --> 로마자화된 미난어에서 두 쓰기 시스템 간의 자동 변환이 모두 바람직합니다.

이전 인큐베이터 쯔놈의 위키백과 테스트 프로젝트와 한자를 사용하는 베트남어 위키백과를 결합하는 제안이 있었는데, 이는 매우 어려웠습니다.

Wp/vi-nom은 더 이상 인큐베이터에 존재하지 않습니다. 실질적으로 동등한 프로젝트가 [7]에 있습니다.

다른 라틴어 스크립트/철자법

노르웨이어 (보크몰뉘노르스크)

노르웨이어는 현재 라틴어 문자만 사용하고 있지만 세부적인 숫자를 셀 수 없을 정도로 많은 주요 철자가 있습니다.

현재 잘 알려진 맞춤법은 다음과 같습니다:

  1. 현재 노르웨이어 위키백과에서 사용하는 보크몰, 대법원에서 정의한 공식 철자법, 그리고 아마도 구글 번역이 지원하는 것(하나의 "노르웨이어"만 지원하기 때문에)이거나 또는 다른 기계 번역 도구일 수 있습니다;
  2. 릭스몰, 아마도 노르웨이 위키백과에서도 사용되었을 것입니다. 증거는 아직 제공되지 않았지만 2021년 9월 현재 IETF 언어 태그가 없습니다.
  3. 뉘노르스크, 뉘노르스크 노르웨이어 위키백과가 현재 사용하고 있습니다.
  4. 회위노르스크, 뉘노르스크 위키백과에서도 사용되지만 손가락으로 셀 수 있는 일부 페이지에서만 사용되는 IETF 언어 태그 회위노르스크 (nn:Special:Prefixindex/Nn/ 참조)

그들의 위키가 하나의 노르웨이어 위키백과일 뿐이라는 역사적 기록이 노르웨이어 위키백과에 있었습니다. 그러나 나중에 뉘노르스크 노르웨이 화자들은 문서를 분할하고 뉘노르스크 위키백과를 설립하기로 합의를 통과했으며 노르웨이어 위키백과는 사실상 보크몰 노르웨이어 위키백과입니다. 그러나 다른 사용자가 기록에 동의하지 않고 스크립트를 사용하여 변환하여 둘 다를 하나의 노르웨이어 위키백과로 다시 병합하려고 합니다.

민난어

누군가 여기에서 두 개의 주요 라틴어 철자법 사이의 자동 변환 가능성을 높이기 위해 사용자 페이지에 댓글을 달았습니다. 그들은 Pe̍h-ōe-jīTâi-uân Bân-lâm-gí Lô-má-jī Phing-im Hong-àn(Tâi-lô)입니다. 각각은 엄격하게 다른 것의 함수(수학적 의미에서)입니다. 변환 테이블을 사용할 수 있습니다. ang:의 스크립트 변환 도구 수준에서 매우 간단한 것이 작동할 수 있습니다. 덧붙여서, 제대로 구현된다면 기본적인 맞춤법 검사기 역할을 할 수도 있습니다. 이 논문이 블로그 게시물도 참조하세요.

나이지리아 요루바어와 베냉어 요루바어 철자는 다릅니다. 요루바어 위키백과는 나이지리아 요루바어 철자를 사용합니다.

나이지리아 요루바어 철자는 새뮤얼 크라우더(Samuel Crowther)의 1852년 철자법을 기반으로 하며, 이는 교회선교협회 쓰기 시스템의 영향을 받았습니다. 나이지리아 요루바 맞춤법 규칙은 1875년 요루바 맞춤법 회의에서 표준화되었습니다. 1966년 서부 나이지리아 교육부는 철자법을 검토하기 위해 위원회를 구성했고 1969년에는 "요루바어 철자법 위원회 보고서"가 출판되었고 이에 대한 반응으로 더 큰 위원회는 1972년 "요루바어 철자법 확대 위원회 보고서"를 발표했습니다.

1971년에는 여러 나이지리아 언어로 실질적인 개혁을 달성하기 위해 합동 작업반이 구성되었고, 요루바 작업반은 맞춤법 위원회의 대부분의 권고를 받아들였습니다. 1974년 연방 교육부가 설립한 교육에 관한 합동 자문 위원회는 합동 작업반의 권고가 나이지리아의 모든 교육부와 서아프리카 시험 위원회에서 사용되는 것을 승인했습니다.

베냉 요루바어 맞춤법은 1975년 국가 언어 위원회에서 만들고 같은 해에 법률로 채택한 베냉 국가 알파벳을 기반으로 합니다. 베냉 국가 알파벳은 요루바어를 포함하여 여러 베냉어 철자를 정의합니다. 국가 알파벳은 1990년과 2006년을 포함하여 몇 차례 업데이트되었습니다.

나이지리아 요루바어와 베냉어 요루바어 철자법의 주요 차이점은 다음과 같습니다. 나이지리아의 ẹ ọ p ṣ은 베냉의 철자가 ɛ ɔ kp sh입니다.

키릴 문자, 라틴 문자 및 몽골 문자

칼미크어는 키릴 문자와 토도 문자를 사용하여 작성할 수 있습니다.

'칼미크'(중국에서는 오이라트로 알려짐)는 토도 문자만 사용하기 때문에 두 개의 표기법 간의 자동 변환이 필요합니다.

만주어에는 만주 문자, 여진 문자 및 라틴 문자의 세 가지 표기법이 있습니다.

  1. 만주어는 원어민의 관점에서 거의 멸종 위기에 처해 있지만 많은 열성팬과 학자들이 이를 제2외국어로 배우고 있습니다. 그들이 그것을 배울 때 중국에서는 주로 만주 문자를 사용하고 서부에서는 라틴어와 만주 문자 둘 다로 언어를 배운다고 믿습니다.
  2. 우리가 마주할 수 있는 약간의 문제는 만주 문자가 일반적으로 위에서 아래로 세로로 작성된다는 사실입니다. 그러나 필요한 경우 그 규칙을 구부릴 수 있으며 수평으로 할 수 있으며 사람들이 만주 문자로 읽으려면 화면을 수동으로 회전할 수 있습니다.
    이제 세로쓰기가 지원됩니다.
  3. 여진 문자는 여진어인 만주 초기 단계를 작성하는 데 사용됩니다. 유니코드에서 제대로 작동한다면 현대 영어 위키백과와 구 영어 위키백과를 분리하는 것처럼 별도의 여진어 위키백과를 만들 수 있습니다.
  4. 올인원으로 언어위원회에서는 만주용 변환 시스템이 가능한 한 빨리 배포되어야 한다고 너무 많이 요구했습니다.

몽골어는 키릴 문자, 고전 몽골 문자파스파 문자유니코드를 참조하여 작성할 수 있습니다(주로 예술용).[8].

3개의 표기법 사이의 자동 변환은 고전 몽골어 문자라틴화된 몽골 문자로 작성된 몽골어 위키백과의 생성을 방지하는 것이 바람직합니다.

시버어는 라틴어 스크립트 또는 시버 문자를 사용하여 작성할 수 있습니다. 현재 시버어 테스트 위키백과에는 시버 문자로 된 많은 콘텐츠가 있으며 이전에는 많은 콘텐츠가 라틴어를 사용했지만 2023년 후반에 수동으로 시버어로 변환되었습니다.

두 쓰기 시스템 간의 자동 변환은 독자에게 바람직합니다.

기타 변환기

풀라어에는 두 가지 주요 표기법이 있습니다. 라틴어 스크립트, 아들람 문자. 아랍 아자미아는 카메룬과 주변 국가에서도 사용됩니다.

수동으로 변환된 일부 페이지가 이미 있습니다. 예를 들면 다음과 같습니다: 진/아들람

자와어자와섬에서 주로 사용되는 언어이며 인도네시아수리남의 자와인 디아스포라도 사용합니다.

(1) 두 가지 표기법이 있습니다: 전통적 하나차라카 (카라칸이라고도 불리는, 아부기다 문자) 및 라틴 문자. 라틴어는 자와어로 된 거의 모든 출판물(소수에 불과함)이 모두 라틴어로 되어 있을 정도로 널리 퍼져 있습니다. 라틴어에서 하나차라카로 일대일 변환이 가능합니다. 하나차라카는 최근(2009년)에 고유한 유니코드를 얻었고 하나차라카 유니코드 글꼴과 몇 가지 비유니코드 글꼴이 있습니다. 유니코드는 트루타입에서 지원하지 않기 때문에 SIL의 그래파이트(Graphite)를 사용합니다.

현재 자와어 위키백과는 이미 웹폰트 구현을 요청하고 있습니다. 미래에는 중국어나 키릴 자모 프로젝트와 같은 자동 변환을 보는 것이 바람직합니다.

(2) 고려해야 할 또 다른 사항: 자바어에는 사회적 지위에 따라 (최소한) 두 개의 레지스터(어휘 집합)가 있습니다. 둘 다 중부 자와섬에서 사용되며 전자는 출판에서 더 일반적으로 사용되는 반면 후자는 대화에서 더 일반적으로 사용됩니다. 어떤 곳에서는 후자의 용법이 주로 수리남의 출판물에서도 발견됩니다(예를 들어, 응고코어는 수리남-자와어 성경에서 사용되며, 자와인의 눈과 귀에는 저속할 것입니다). 여기서 전자는 역사적, 지리적 이유로 더 이상 사용되지 않습니다.

귀족정치와의 연관성 때문에 전자의 사용에 대해 격렬하게 반대했던 동자와족 사람들과 인도네시아 전역의 다른 민족 사람들에게도 마찬가지입니다. 따라서 자와어에는 네 가지 조합/변형이 있습니다.

  • 하나차라카 크라마
  • 라틴어 크라마
  • 하나차라카 응고코
  • 라틴어 응고코

크라마에서 응고코로 변환하는 것은 때때로 어휘의 일대일 매핑만 필요하지만 다른 경우에는 일대다 또는 다대일 또는 문법 변경이 필요합니다.

(3) 역사적으로 자와어를 쓰는 데 사용된 세 번째(또는 네 번째) 문자가 있습니다. 즉, 아랍 문자(페곤 문자 및 아랍 건둘 문자라고 함)와 훨씬 이전에 산스크리트/팔라바 문자(고대 자와어/카위 문자)입니다. http://www.omniglot.com/writing/javanese.htm

위키미디어 프로젝트에서 이러한 오래된 문자를 사용하는 것은 여전히 존재하지 않지만 아마도 미래에는 위키문헌 및 자와어 위키낱말사전에 도움이 될 것입니다.

(4) 자와어 하나차라카는 여전히 순다어발리어와 관련이 있으며, 현재 위키미디어 프로젝트에는 순다어 위키백과와 그 자매 프로젝트, 발리어 위키백과가 있습니다.

한국어 위키백과 다지모에서 자동 변환을 사용하는 한자 시스템 도입에 대해 논의하고 있습니다.

또한 스크립트 변환의 필요성에 대한 분석이 아직 진행 중이지만 남한과 북한 사이의 한국어 문법 차이에 대해 약간의 논의가 있습니다.

라디노어에는 크게 두 가지 주요 표기법이 있습니다. 이들은 라틴화 된 라디노어 및 라쉬 문자 (히브리어 문자의 변형)입니다.

문서의 중복을 방지하기 위해 두 표기법 간의 자동 변환이 바람직합니다. 그러나 이것은 매우 해결하기 어려운 기술적 문제를 해결할 수 있습니다. 자세한 내용은 토론 페이지를 참조하세요.

타갈로그어는 라틴어 또는 바이바이인 문자로 작성할 수 있습니다. 그러나 바이바이인 문자는 지방 자치 단체에 의해 보류되어 잠재적인 변환 시스템에 대한 지원이 부족한 것으로 보입니다.

참고

  1. 2021년 9월부터 중국어 위키낱말사전 및 위키문헌은 간체-번체 변환 시스템만 활성화합니다. 중국 위키책, 위키뉴스 및 위키인용집에서 zh-Hant-MO는 zh-Hant-HK에 병합되고 zh-Hans-MY는 zh-Hans-SG에 병합됩니다

같이 보기

More lists of Wikipedias by various criteria :  [ 편집 ]