Spezielle Sprachcodes

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Special language codes and the translation is 82% complete.
Outdated translations are marked like this.

Die Sprache eines Wikimedia-Wikis finden Sie in den Attributen lang="..." und xml:lang="..." des <html>-Elements jeder Seite (oder anderer Elemente für bestimmte Unterinhalte in mehrsprachigen Seiten); Sie werden auch für das Styling in CSS-Sprachauswahlelementen verwendet. Diese Sprachcodes sollten im Allgemeinen kanonische Sprachkennungen sein, wie in BCP 47 definiert.

In den meisten Fällen entsprechen die Unterdomänennamen, die wir für Projekte verwenden, Sprachcodes, es gibt jedoch einige Ausnahmen. Dies ist in der Regel aus historischen Gründen der Fall, da zum Zeitpunkt der Erstellung des Projekts noch kein gültiger ISO 639-Code (oder ein registrierter und nicht veralteter BCP 47-Variantencode) verfügbar war, sondern auch, weil einige frühere ISO 639-Codes nicht mehr verwendet werden da sie eine Gruppe von Sprachen umfassten, die jetzt als verschieden angesehen werden.

Veraltete oder entfernte ISO 639-Codes werden in BCP 47 immer noch als gültig betrachtet (wobei vorhandene Codes normalerweise nicht entfernt werden), und zwar meist als mögliche Rückschläge für fehlende Übersetzungen oder für Aufwärtskompatibilität, auch wenn sie nicht mehr für die moderne Verwendung und neu erstellte Inhalte empfohlen werden (Die Verwendung dieser Codes kann in Wikimedia möglicherweise zu unlösbaren Streitigkeiten führen, sofern sie nicht durch eindeutige Übersetzungen mit neueren Codes unterschieden werden). In einigen Fällen wurden einige frühe Unterscheidungen in ISO 639 auch entfernt, weil sie vorübergehend künstlich eingeführt wurden (manchmal aus nicht-neutralen politischen Gründen), jedoch von den Benutzern nicht gut unterstützt wurden, und wenn sie die Aufgabe von Übersetzern unnötig kompliziert machten wenn sie zu häufig den Einsatz von Sprachrücksetzern oder automatischen Transliteratoren erforderten (wenn zwischen den meisten Benutzern der verschiedenen Skriptvarianten verlässliche Standard- und orthografische Konventionen angenommen wurden) oder wegen der Entwicklung von Schulungen zum besseren gegenseitigen Verständnis und zur Akzeptanz mehrerer Varianten in der einheimischen Verwendung.

Subdomains, die nicht mit ihrem lang-Attribut übereinstimmen

Subdomain Sprache Projekt(e) Anmerkungen
als Lokaler Name: Alemannisch
Englischer Name: Alemannic
Sprachfamilie: Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote Verwendet gsw, das dem ISO 639-3-Code der Sprache entspricht.
bh Lokaler Name: भोजपुरी
Englischer Name: Bihari
Sprachfamilie: Indo-Aryan
Wikipedia
Tracked in Phabricator:
Task T41968 stalled

Mehrdeutiger veralteter Code. Verwendet bho, der dem ISO 639-3-Sprachcode für eine Sprache der Familie entspricht.

roa-rup Lokaler Name: armãneashti
Englischer Name: Aromanian
Sprachfamilie: Italic
Wikipedia, Wiktionary Verwendet rup, das dem ISO 639-3-Code der Sprache entspricht.
simple Lokaler Name: Simple English
Englischer Name: Simple English
Sprachfamilie: Germanic
Wikipedia, Wiktionary Verwendet den en-Code für normales Englisch.
zh-classical Lokaler Name: 文言
Englischer Name: Classical Chinese
Sprachfamilie: Sinitic
Wikipedia Klassisches Chinesisch besitzt den ISO 639-3-Code lzh.
zh-min-nan Lokaler Name: Bân-lâm-gú
Englischer Name: Minnan
Sprachfamilie: Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource Min Nan besitzt den ISO 639-3-Code nan.
zh-yue Lokaler Name: 粵語
Englischer Name: Cantonese
Sprachfamilie: Sinitic
Wikipedia Kantonesisch besitzt den ISO 639-3-Code yue.

Allgemeines:

  • Alle Subdomains von wikimedia.org

Subdomains, die nicht einem gültigen Sprachcode nach ISO 639 entsprechen

Subdomain Sprache Projekt(e) Anmerkungen
als Lokaler Name: Alemannisch
Englischer Name: Alemannic
Sprachfamilie: Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote
Tracked in Phabricator:
Task T6793 stalled

Alemannisch hat den ISO 639-3-Code gsw. Der ISO 639-3-Code als wird stattdessen Tosk Albanisch zugewiesen.

bat-smg Lokaler Name: žemaitėška
Englischer Name: Samogitian
Sprachfamilie: Baltic
Wikipedia
Tracked in Phabricator:
Task T27522 stalled

Samogitian hat den ISO 639-3-Code sgs.

cbk-zam Lokaler Name: Chavacano de Zamboanga
Englischer Name: Chavacano de Zamboanga
Sprachfamilie: Pidgin and Creole
Wikipedia
Tracked in Phabricator:
Task T124657 stalled

Chavacano de Zamboanga besitzt keinen ISO 639-Code als individuelle Sprache. Der ISO 639-3-Code cbk ist Chavacano, einer Obermenge von Chavacano de Zamboanga zugewiesen.

eml Lokaler Name: emiliàn e rumagnòl
Englischer Name: Emilian-Romagnol
Sprachfamilie: Italic
Wikipedia
Tracked in Phabricator:
Task T36217 stalled

Der ISO 639-3-Code eml für Emilian-Romagnol ist jetzt im Ruhestand und in egl (Emilian) und rgn (Romagnol) aufgeteilt.

fiu-vro Lokaler Name: võro
Englischer Name: Võro
Sprachfamilie: Finno-Permic
Wikipedia
Tracked in Phabricator:
Task T31186 stalled

Võro hat den ISO 639-3-Code vro.

iu Lokaler Name: ᐃᓄᒃᑎᑐᑦ / inuktitut
Englischer Name: Inuktitut
Sprachfamilie: Eskimo-Aleut
Wikipedia ISO 639 betrachtet iu/iku nicht für eine einzige Sprache, sondern für eine Makrosprache aus ike und ikt. MediaWiki stimmt zu (siehe phabricator), gilt jedoch: ike, genannt ike-cans; fügt ike-latn hinzu; hat keine ikt Unterstützung. CLDR betrachtet Cans als angestrebtes Skript.
ksh Lokaler Name: Ripoarisch
Englischer Name: Ripuarian
Sprachfamilie: Germanic
Wikipedia Der ISO 639-3-Code ksh ist Kölsch, einer Untergruppe von Ripuarian, zugeordnet.
map-bms Lokaler Name: Basa Banyumasan
Englischer Name: Banyumasan
Sprachfamilie: Sunda-Sulawesi
Wikipedia Banyumasan hat keinen ISO 639-Code als individuelle Sprache. Der ISO 639-1-Code jv/jav ist Javanesisch, einer Obermenge von Banyumasan, zugewiesen.
nds-nl Lokaler Name: Nedersaksies
Englischer Name: Dutch Low Saxon
Sprachfamilie: Germanic
Wikipedia Dupliziert mit dem nds-Code für Niederdeutsch.
nrm Lokaler Name: Nouormand
Englischer Name: Norman
Sprachfamilie: Italic
Wikipedia
Tracked in Phabricator:
Task T25216 stalled

Norman hat keinen ISO 639-Code als individuelle Sprache (Die beiden Guernésiais und Jèrriais Dialekte von Norman teilen sich jedoch den ISO 639-3-Code nrf). Der ISO 639-3-Code nrm wird stattdessen Narom-Sprache zugewiesen. ISO 639-3 bringt Norman mit Französisch zusammen, wie bei den meisten Sorten Nordfrankreichs.

roa-rup Lokaler Name: armãneashti
Englischer Name: Aromanian
Sprachfamilie: Italic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T17988 stalled

Aromanian hat den ISO 639-3-Code rup.

roa-tara Lokaler Name: tarandíne
Englischer Name: Tarantino
Sprachfamilie: Italic
Wikipedia Tarantino hat keinen ISO 639-Code als individuelle Sprache. Wie in den meisten norditalienischen Sorten wird nach ISO 639-3 mit Italien gespritzt.
sh Lokaler Name: srpskohrvatski / српскохрватски
Englischer Name: Serbo-Croatian
Sprachfamilie: Slavic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T127680 stalled

sh war ursprünglich ISO 639-1-Code für Serbokroatisch, ist aber nicht mehr aktiv. Es bleibt jedoch ein gültiges Sprachkennzeichen für BCP 47. Es gibt den ISO 639-3-Code hbs für Serbokroatisch. In CLDR-Aliase wird sh sr-Latn zugeordnet.

simple Lokaler Name: Simple English
Englischer Name: Simple English
Sprachfamilie: Germanic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T110190 stalled

Einfaches Englisch hat keinen ISO 639-Code, aber ein IETF-Subtag simple.
However, even if the simple code is valid as a standard subtag for BCP 47, because it is only registered as a generic subtag for language variants for various base languages like en-simple or fr-simple (using the now standard variant subtag is preferable to using multiple subtags including an unregistered private extension, like "en-x-simple"). As a plain tag, "simple" means nothing in BCP 47 or ISO 639 (as it is not a plain language).
Note that under ISO 639 rules, Simple English is a variant or dialect or special orthography of English (so it can be registered as a variant subtag of English, like "formal" or informal" used in German or Dutch), defined as a subset for some limited usage. The IANA database for IETF's BCP 47 already indicates this and BCP 47-aware applications should have no problem to identify the language as being part of normal English, as long as it is properly tagged as "en-simple" and not just "simple". Also the content of the Simple English Wikipedia is hard to assess if it is really in "Simple" English or just normal English, as there's NO standard for such "simplication" but only an editorial community decision which is not really enforceable, except for some presentation rules. For example, there does not exist any "Simple English" dictionary, and all "Simple English" users refer to normal English dictionaries. Simple English is only a stylistic decision made by different authors with different preferences or perception of what is "simple" enough for them individually; in fact, even the "Simple English" Wikipedia could be fully integrated within normal English Wikipedia by better classification of its content or by using decicated portals for some public with limited understanding of English, and by making sure the English Wikipedia does not enter into too much complex details without separating them into subpages or detailed sections: it should be possible to describe any topic in simpler terms before using more complex terms that would first be defined, using didactic/pedagogical rules for sorting this content. And there are different view about how to simplify English, depending on the audience (for youth? for non-native speakers? for disabled people? for some specific country? Are simplifications the same in US, Canada, UK, Australia, South Africa or India?).

zh-classical Lokaler Name: 文言
Englischer Name: Classical Chinese
Sprachfamilie: Sinitic
Wikipedia
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30443 stalled

Klassisches Chinesisch hat den ISO 639-3-Code lzh.

zh-min-nan Lokaler Name: Bân-lâm-gú
Englischer Name: Minnan
Sprachfamilie: Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30442 stalled

Min Nan hat den ISO 639-3-Code nan.

zh-yue Lokaler Name: 粵語
Englischer Name: Cantonese
Sprachfamilie: Sinitic
Wikipedia
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30441 stalled

Kantonesisch hat den ISO 639-3-Code yue.

Allgemeines:

  • tokipona – aufgelöste Wikipedia-Subdomain
  • ru-sib – aufgelöste Wikipedia-Subdomain, Scherz in fiktionaler „sibirischer“ Sprache
  • be-x-old – behoben und umgeleitet auf be-tarask Wikipedia-Subdomain (siehe phab:T11823)

Andere Unterscheidungen

Subdomain Sprache Projekt(e) Anmerkungen
ms Lokaler Name: Bahasa Melayu
Englischer Name: Malay
Sprachfamilie: Sunda-Sulawesi
Wikipedia, Wikibooks, Wiktionary Malay language used to be "ms", just like Indonesian language is "id", but since the Malay Wikipedia inception, the code "ms" has become the code for macro language (not individual language).

There are many individual languages under "ms"/"msa", including Indonesian ("id"/"ind"), Banjar ("bjn"), Minang ("min"), three living languages with their own Wikimedia projects, as well as Malay (individual language) ("mly"-Deprecated 2008 or "zlm"-Malay or "zsm"-Standard Malay / Malaysian Malay / Malaysian language)

It should be noted that the creation of Malay Wikipedia, Wikibooks, and Wiktionary all predates the change in the language code in 18 February 2008, with the latest one, Malay Wikibooks, created on 24 August 2004.

See also:

ak Lokaler Name: ak
Englischer Name: Akan
Sprachfamilie: Niger-Congo
Wikipedia;
Geschlossen: Wikibooks, Wiktionary
Sind diese Wikis in derselben Sprache? Siehe Wikipedia-Artikel.
Note that this situation is quite similar to the artificial distinction between Luxembourgish and Moselle Franconian, or between Serbian, Croatian and Bosnian: they are also clusters of dialects of the same mutually intelligible base language with just minor differences (for terminology choice or their preferred orthography, but multiple orthographies exist for all these dialects). It's hard (and in fact impossible) to make a real distinction at linguistic level, this is purely an ethnopolitical distinction and native speakers in one region going to the other region where the other dialect cluster is referred by a different name will be known there to use the other cluster name and will speak/write without more problems than in their origin ethopolitical community. This adaptation also occurs within each cluster, based on social interaction or level of formality (e.g. in religion, or for prestige, or for vernacular speech and jargons in the street or used by younger or less educated people).
tw Lokaler Name: Twi
Englischer Name: Twi
Sprachfamilie: Niger-Congo
Wikipedia;
Geschlossen: Wiktionary
de-formal Lokaler Name: Deutsch
Englischer Name: German
Sprachfamilie: Germanic
Wird nicht als Host-Name verwendet, sondern als pseudo-variante Sub-Tag (unregistriert) für einige Übersetzungen in translatewiki.net (in Meta-Wiki für Seiten wie Richtlinien verwendet, wenn Wiki-Benutzer entsprechend ihren Präferenzen direkt auf sie verweisen): Wir hätten eine Erweiterung für den privaten Gebrauch verwenden sollen.
nl-informal Lokaler Name: Nederlands
Englischer Name: Dutch
Sprachfamilie: Germanic

Technical language code

The special language code qqx can be used to display the ids of all system messages used on a page.

Siehe auch