Codes de langue spéciaux
La langue d’un wiki de Wikimédia peut être déterminée par les attributs lang="..."
et xml:lang="..."
de l’élément <html>
de chaque page (ou d’autres éléments pour des sous-contenus spécifiques dans les pages multilingues) ; ils sont également utilisés pour la mise en forme dans les sélecteurs de langue CSS. Ces codes de langue devraient être normalement des étiquettes de langue approuvées tels que définies par BCP 47.
Dans la plupart des cas, les noms de sous-domaines que nous utilisons pour les projets correspondent à des codes de langue standard, mais il reste certaines exceptions. C’est le plus fréquemment le cas pour des raisons historiques, alors qu’un code ISO 639 standard n’était pas encore disponible lors de la création du projet, mais aussi parce que d'anciens codes ISO 639 ont été rendus désuets ou supprimés quand il incluaient un groupe de langues maintenant considérées comme distinctes.
Les codes ISO 639 désuets ou supprimés sont encore considérés comme valides dans BCP 47 (dont les étiquettes de langues ne sont normalement pas supprimées), le plus souvent en tant que codes de repli pour des traductions manquantes ou pour permettre la compatibilité ascendante, même s’ils ne sont plus recommandés pour l'utilisation moderne (l’utilisation de ces codes peut potentiellement conduire à des disputes insolubles dans Wikimédia, à moins que les langues soient clairement distinguées en utilisant de nouveaux codes). Dans certains cas, certaines anciennes distinctions dans ISO 639 ont été supprimées parce qu’elles avaient été introduites artificiellement pendant un temps limité (parfois pour des raisons politiques non neutres) mais pas activement soutenues par les utilisateurs, et quand elles compliquaient inutilement la tâche des traducteurs ou quand cela nécessitait un recours trop fréquent aux langues de repli et à un translittérateur automatique (lorsqu’une norme fiable et des conventions orthographiques ont été reconnues et adoptées par la plupart des utilisateurs de variantes d'écritures différentes), ou parce que le développement de l’éducation a permis une meilleure intercompréhension et une meilleure acceptation des multiples variantes dans l'usage courant.
Sous-domaines qui ne correspondent pas à l’attribut lang
Sous-domaine | Langue | Projet(s) | Notes |
---|---|---|---|
als |
Autonyme : Alemannisch Nom en anglais : Alemannic Famille linguistique : Germanic |
Wikipedia, Wiktionary, Wikibooks, Wikiquote | Utilise le code de langue ISO 639-3 gsw .
|
bh |
Autonyme : भोजपुरी Nom en anglais : Bihari Famille linguistique : Indo-Aryan |
Wikipedia |
Ancien code de langue ambigu (historique dans ISO 639-2). Utilise |
roa-rup |
Autonyme : armãneashti Nom en anglais : Aromanian Famille linguistique : Italic |
Wikipedia, Wiktionary | Utilise rup qui correspond au code de langue ISO 639-3.
|
simple |
Autonyme : Simple English Nom en anglais : Simple English Famille linguistique : Germanic |
Wikipedia, Wiktionary | Utilise le code en de l’anglais ordinaire.
|
zh-classical |
Autonyme : 文言 Nom en anglais : Classical Chinese Famille linguistique : Sinitic |
Wikipedia | Le chinois classique (littéraire) a pour code ISO 639-3 lzh .
|
zh-min-nan |
Autonyme : 閩南語 / Bân-lâm-gú Nom en anglais : Minnan Famille linguistique : Sinitic |
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource | Le min nan a pour code ISO 639-3 nan .
|
zh-yue |
Autonyme : 粵語 Nom en anglais : Cantonese Famille linguistique : Sinitic |
Wikipedia | Le cantonais a pour code de langue ISO 639-3 yue .
|
Divers :
- Tous les sous-domaines de wikimedia.org
Sous-domaines qui ne se conforment pas à un code de langue ISO 639 valide
Sous-domaine | Langue | Projet(s) | Notes |
---|---|---|---|
als |
Autonyme : Alemannisch Nom en anglais : Alemannic Famille linguistique : Germanic |
Wikipedia, Wiktionary, Wikibooks, Wikiquote |
L’alémanique a pour code de langue ISO 639-3 |
bat-smg |
Autonyme : žemaitėška Nom en anglais : Samogitian Famille linguistique : Baltic |
Wikipedia |
Le samogitien a pour code de langue ISO 639 |
cbk-zam |
Autonyme : Chavacano de Zamboanga Nom en anglais : Chavacano de Zamboanga Famille linguistique : Pidgin and Creole |
Wikipedia |
Le chacovano de Zamboanga n’a pas de code de langue ISO 639 en tant que langue individuelle.
Le code ISO 639-3 |
eml |
Autonyme : emiliàn e rumagnòl Nom en anglais : Emilian-Romagnol Famille linguistique : Italic |
Wikipedia |
Le code ISO 639-3 |
fiu-vro |
Autonyme : võro Nom en anglais : Võro Famille linguistique : Finno-Permic |
Wikipedia |
Le võro a pour code ISO 639-3 |
iu |
Autonyme : ᐃᓄᒃᑎᑐᑦ / inuktitut Nom en anglais : Inuktitut Famille linguistique : Eskimo-Aleut |
Wikipedia | L’ISO 639 considère iu /iku non pas comme une langue simple, mais comme une macrolangue comprenant ike et ikt . MediaWiki est d’accord (voir phabricator), mais : utilise ike comme langue de repli, codée ike-cans ; ajoute ike-latn ; ne supporte pas encore ikt . CLDR considère Cans comme une écriture aspirationnelle (souhaitée mais insuffisamment soutenue et utilisée).
|
ksh |
Autonyme : Ripoarisch Nom en anglais : Ripuarian Famille linguistique : Germanic |
Wikipedia | Le code ISO 639-3 ksh est attribué au colonais, une des branches du ripuaire.
|
map-bms |
Autonyme : Basa Banyumasan Nom en anglais : Banyumasan Famille linguistique : Sunda-Sulawesi |
Wikipedia | Le banyumasan n’a pas de code ISO 639 attribué en tant que langue individuelle. Le code ISO 639-1 jv /jav est assigné au javanais, un sur-ensemble du banyumasan.
|
nds-nl |
Autonyme : Nedersaksies Nom en anglais : Dutch Low Saxon Famille linguistique : Germanic |
Wikipedia | Dupliqué avec le code nds du bas allemand (différences régionales mineures entre les variétés d'Allemagne et des Pays-Bas, conventions orthographiques légèrement différentes mais pas toujours localement pertinentes).
|
nrm |
Autonyme : Nouormand Nom en anglais : Norman Famille linguistique : Italic |
Wikipedia |
Le normand n’a pas de code ISO 639 en tant que langue individuelle ni comme macrolangue (cependant deux dialectes normands, le guernésiais et le jerriais, se partagent l’usage du code ISO 639-3 |
roa-rup |
Autonyme : armãneashti Nom en anglais : Aromanian Famille linguistique : Italic |
Wikipedia, Wiktionary |
L’aroumain a pour code de langue ISO 639-3 |
roa-tara |
Autonyme : tarandíne Nom en anglais : Tarantino Famille linguistique : Italic |
Wikipedia | Le tarantino n’a pas de code ISO 639 en tant que langue individuelle. L’ISO 639 l’inclut dans l'italien, comme la plupart des autres variétés du nord de l’Italie. |
sh |
Autonyme : srpskohrvatski / српскохрватски Nom en anglais : Serbo-Croatian Famille linguistique : Slavic |
Wikipedia, Wiktionary |
|
simple |
Autonyme : Simple English Nom en anglais : Simple English Famille linguistique : Germanic |
Wikipedia, Wiktionary |
L’anglais simple n’a pas de code ISO 639, mais l’IETF a défini une sous-étiquette |
zh-classical |
Autonyme : 文言 Nom en anglais : Classical Chinese Famille linguistique : Sinitic |
Wikipedia |
Le chinois classique (littéraire) a pour code de langue ISO 639-3 |
zh-min-nan |
Autonyme : 閩南語 / Bân-lâm-gú Nom en anglais : Minnan Famille linguistique : Sinitic |
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource |
Le min nan a pour code de langue ISO 639-3 |
zh-yue |
Autonyme : 粵語 Nom en anglais : Cantonese Famille linguistique : Sinitic |
Wikipedia |
Le cantonais a pour code de langue ISO 639-3 |
Divers :
tokipona
– sous-domaine défunt de Wikipédiaru-sib
– sous-domaine défunt de Wikipédia, falsification d'une langue « sibérienne » de fictionbe-x-old
– corrigé et redirigé vers un sous-domainebe-tarask
pour Wikipédia (voir phab:T11823)
Autres distinctions
Sous-domaine | Langue | Projet(s) | Notes |
---|---|---|---|
ms |
Autonyme : Bahasa Melayu Nom en anglais : Malay Famille linguistique : Sunda-Sulawesi |
Wikipedia, Wikibooks, Wiktionary | Malay language used to be "ms", just like Indonesian language is "id", but since the Malay Wikipedia inception, the code "ms" has become the code for macro language (not individual language).
There are many individual languages under "ms"/"msa", including Indonesian ("id"/"ind"), Banjar ("bjn"), Minang ("min"), three living languages with their own Wikimedia projects, as well as Malay (individual language) ("mly"-Deprecated 2008 or "zlm"-Malay or "zsm"-Standard Malay / Malaysian Malay / Malaysian language) It should be noted that the creation of Malay Wikipedia, Wikibooks, and Wiktionary all predates the change in the language code in 18 February 2008, with the latest one, Malay Wikibooks, created on 24 August 2004. See also: |
ak |
Autonyme : ak Nom en anglais : Akan Famille linguistique : Niger-Congo |
Wikipedia; Fermés : Wikibooks, Wiktionary |
Ces deux ensembles de wikis sont-ils dans la même langue ? Consultez l’article Wikipédia. Note that this situation is quite similar to the artificial distinction between Luxembourgish and Moselle Franconian, or between Serbian, Croatian and Bosnian: they are also clusters of dialects of the same mutually intelligible base language with just minor differences (for terminology choice or their preferred orthography, but multiple orthographies exist for all these dialects). It's hard (and in fact impossible) to make a real distinction at linguistic level, this is purely an ethnopolitical distinction and native speakers in one region going to the other region where the other dialect cluster is referred by a different name will be known there to use the other cluster name and will speak/write without more problems than in their origin ethopolitical community. This adaptation also occurs within each cluster, based on social interaction or level of formality (e.g. in religion, or for prestige, or for vernacular speech and jargons in the street or used by younger or less educated people). |
tw |
Autonyme : Twi Nom en anglais : Twi Famille linguistique : Niger-Congo |
Wikipedia; Fermé : Wiktionary | |
de-formal |
Autonyme : Deutsch Nom en anglais : German Famille linguistique : Germanic |
— | Non utilisés comme noms d’hôtes mais inclus comme des pseudo sous-étiquettes (non enregistrées) pour certaines traductions sur translatewiki.net (utilisées dans des pages de Méta-Wiki telles que celles sur les politiques lorsque certains messages s’adressent directement à l'utilisateur du wiki selon ses préférences) : nous aurions dû utiliser une extension d’utilisation privée. |
nl-informal |
Autonyme : Nederlands Nom en anglais : Dutch Famille linguistique : Germanic |
— |
Technical language code
The special language code qqx
can be used to display the ids of all system messages used on a page.
Voir aussi
- Code de langue (sur Mediawiki)
- Codes de langue (ici sur Méta-Wiki)
- Chapitres Wikimédia par langue
- Table des projets Wikimédia
- Tâche Phabricator T21986 : « Wikis en attente de renommage (suivi) »
- Tâche Phabricator T21986 : « Codes de langue dupliqués ou non valides dans Wikidata »
- Alias de codes de langue dans CLDR et codes Wikimédia manquants