Wikipedias in the languages of Russia/Wikidata/ru

From Meta, a Wikimedia project coordination wiki
Хочешь светлого будущего своей нации и её культуре? Возьми его в свои собственные руки! Как? Начинай вносить вклад в Википедию на соответствующем языке и учить этому других!

Коммуникационная ценность современного языка

Слайды к презентации (RU) и проект текста выступления
« Искусственное поддержание жизни отдельного культурного феномена и/или использовавшихся при его возникновении и обслуживании языков и взгляда на жизнь, без доказанной полезности последних для решения практических задач текущей жизни ценно не более, чем поклонение клинописи или любой иной исторической технологии. »

— Фархад Фаткуллин[1]

Представьте себе мир, где все ГосУслуги и прочие сервисы, а также любые цифровые документы сразу и всегда одновременно доступны на всех языках планеты, и также можно вести диалог c любым человеком или иным узлом/объектом глобального Интернета вещей. Технология семантического веба делает этот мир реальностью.
Структура любого языка — совокупность всевозможных видов лексикографических данных.
Сделать любую коммуникацию языконезависимой поможет технология Викифункции.

Данная работа созрела в рамках дискуссий волонтёров вики-сообщества "Языки народов России" в ходе участия в российском и международном проектах по многоязычию Викимедиа, опубликована Фархадом Фаткуллиным (Казань, Россия). Особая благодарность Ренату Шигапову (Германия) за помощь с WikibaseCirrusSearch для сбора данных, и Павлу Каганеру (Санкт-Петербург, Россия) за рекомендации и поддержку в выборе темы, критические замечания в ходе и предложения по дальнейшим уточнениям результатов. Первая публикация и презентация материала запланированы на татарском языке в рамках II Всероссийской научно-практической конференции "Язык, общество и информационные технологии" (17-18.02.2023).

Предлагается метод количественной оценки объёма необходимых работ для поддержания любого из языков народов России на "человеко-стационарной орбите" устойчивой жизнеспособности. В набор показателей для сравнения включены абсолютные и относительные значения доступных на данном языке меток и описаний элементов международной базы знаний Викиданные (глобальный многоязычный аналог ГосУслуг), а также лексикографических данных, которые используются для описания естественным языком всевозможных взаимоотношений и взаимосвязей, описываемых Викифункциями. Прилагаемые ниже аналитические таблицы заполнены статистическими данными и расчётными долями по состоянию на момент обращения, будут периодически обновляться, а состав колонок для сравнения — расширяться.

Тезисы[edit]

Культура — способ передачи информации негенетическим путём,[2] язык — используемый для этого уникальный культурно-коммуникационный протокол,[3] носители-пользователи языка — узлы порождения, оперативного хранения и обмена информацией, а непрерывное взаимодействие пользователей языка — распределённая обработка данных в процессе генерации новых знаний, реорганизации социума или его ценностно-сущностной трансформации (смена способов и подходов взаимодействия с физико-биологическим миром).[4]

Инструментальная функция языка — обеспечение скорости и точности коммуникации. В эру экономики знаний любой элемент и/или информационный продукт одновременно является участником множества параллельных процессов. Жизнеспособность отдельного естественного языка (и связанных культурных знаний) зависит от возможности и эффективности использования этого инструмента во всех взаимодействиях безостановочно меняющейся технологической и социальной среды.[5]

Отдельный индивид или некое сообщество носителей языка будут продолжать инвестировать в сохранение своих связанных компетенций и непрерывное развитие самого коммуникационного протокола лишь до тех пор, пока его возможно эффективно использовать в рамках общемировой экосистемы создания добавленной стоимости (глобальный ВВП).[6] Соответственно сохранение многоязычия в мире зависит от перехода человечества к технологиям, позволяющим равное использование в трудовой кооперации любого естественного языка[7].

Именно такой подход лежит в основе языко-независимой технологии семантической паутины (Web 3.0). Эти возможности уже продемонстрированы:

В отличие от иных проектов Викимедиа, эти публикуются, совершенствуются и распространяются по правовой лицензии с наивысшей степенью свободы (Creative Commons Zero, CC0 - общественное достояние). Всех заинтересованных вносить вклад в обеспечение надёжной долговечности любимого языка приглашаем присоединяться к волонтёрам, развивающим их представленность в данных системах!

Стат. таблицы[edit]

Таблицы включают языки, для которых выполнено хотя бы одно из двух условий:

Внимание: * выделены языки, которые имеют официальный статус в каком-либо из регионов РФ, тогда как большинство их носителей проживает за пределами РФ.

Данные для сравнительного анализа[edit]

Язык
[[Заглавная]]
Код
[[Категория:]]
Метки
кол-во
Метки
%
Описания
кол-во
Описания
%
Лексемы
кол-во
Формы
кол-во
Синтагмы
кол-во
английский en 86534411 85 84304578 82.8 72561 132029 30160
арабский ar 6361419 6.2 51285699 50.4 1384 310 136
испанский es 20974374 20.6 43824405 43 30480 352459 10425
китайский zh 6317996 6.2 34690543 34.1 4322 4458 3995
русский ru 8775094 8.6 39399582 38.7 101554 1238078 12833
французский fr 21394767 21 50751745 49.8 19271 325157 9482
немецкий de 21147425 20.8 65515077 64.3 213398 550155 10269
турецкий tr 1980389 1.9 33405809 32.8 225 188 189
хинди hi 1185205 1.2 8194601 8 1407 2430 1892
фарси fa 2773491 2.7 15532782 15.3 6768 11417 7425

Языки РФ с активными Википедиями (34)[edit]

Группа Язык
[[Заглавная]]
Код
[[Категория:]]
Метки
кол-во
Метки
%
Описания
кол-во
Описания
%
Лексемы
кол-во
Формы
кол-во
Синтагмы
кол-во
Восточнославянские языки (2) русский ru 8775094 8.62 39399582 38.68 101554 1238078 12833
украинский* uk 6093531 5.98 59582944 58.5 16258 507956 283
Тюркские языки (10) алтайский alt 2247 0 10 0 1 0 1
азербайджанский* az 1041742 1.02 1007804 0.99 28 22 22
башкирский ba 594414 0.58 6570985 6.45 16 3 14
крымскотатарский crh 398457 0.39 530708 0.52 13 10 15
чувашский cv 727163 0.71 786208 0.77 11 1 11
казахский* kk 936517 0.92 929021 0.91 20 2 18
карачаево-балкарский krc 456559 0.45 102963 0.1 2 0 2
саха (якутский) sah 475916 0.47 240898 0.24 8 0 8
татарский tt 980788 0.96 6509824 6.39 8 0 8
тувинский tyv 455568 0.45 94971 0.09 5 0 5
Монгольские языки (2) бурятский bxr 457138 0.45 142643 0.14 3 0 3
калмыцкий xal 455456 0.45 144964 0.14 12 2 14
Индоевропейские языки (3) понтийский греческий pnt 453735 0.45 144974 0.14 1 0 1
осетинский os 685107 0.67 808088 0.79 7 1 7
идиш* yi 677620 0.67 2889421 2.84 276 704 330
Нахско-дагестанские языки (5) аварский av 458950 0.45 145011 0.14 6 0 6
чеченский ce 990769 0.97 1186533 1.16 10 1 10
ингушский inh 456006 0.45 6984 0.01 4 0 4
лакский lbe 452758 0.44 2 0 5 0 5
лезгинский lez 458967 0.45 103329 0.1 6 0 6
Абхазо-адыгские языки (2) кабардино-черкесский kbd 455580 0.45 28 0 7 1 7
адыгейский ady 451459 0.44 13 0 7 10 7
Финно-угорские языки (10) финский* fi 7274103 7.14 34355848 33.73 636 8383 569
коми-пермяцкий koi 458804 0.45 145570 0.14 6 0 6
коми-зырянский kv 461827 0.45 344 0 28 36 24
мокшанский mdf 457818 0.45 181892 0.18 3 0 3
луговомарийский mhr 669640 0.66 679351 0.67 3 1 3
горномарийский mrj 464752 0.46 7 0 4 0 4
эрзянский myv 494156 0.49 31494 0.03 10 2 9
ливвиковский olo 469880 0.46 20 0 2 0 2
удмуртский udm 459479 0.45 193 0 7 0 7
вепсский vep 517757 0.51 31895 0.03 15 34 17

Языки РФ с Википедиями в инкубаторе (45)[edit]

Группа Язык
[[Заглавная]]
Код
[[Категория:]]
Метки
кол-во
Метки
%
Описания
кол-во
Описания
%
Лексемы
кол-во
Формы
кол-во
Синтагмы
кол-во
тюркские (10) северноалтайский atv 0 0 0 0
шорский cjs 0 0 0 0
чулымский clw 0 0 0 0
долганский dlg 0 0 0 0
крымчакский jct 0 0 0 0
караимский kdr 0 0 0 0
хакасский kjh 0 0 0 0
кумыкский kum 153455 0.1507 1 0 1 0 1
ногайский nog 0 0 0 0
сибирскотатарский sty 153501 0.1507 14 0 1 0 1
тунгусо-маньчжурские (3) эвенский eve 0 0 0 0
эвенкийский evn 0 0 0 0
нанайский gld 1 0 0 0 3 0 3
индоевропейские (2) горско-еврейский jdt 0 0 0 0
татский ttt 0 0 0 0
нахско-дагестанские (10) агульский agx 0 0 0 0
андийский ani 0 0 0 0
цезский ddo 0 0 0 0
даргинский dar 0 0 0 0
рутульский rut 0 0 0 0
табасаранский tab 0 0 0 0
тиндинский tin 0 0 0 0
цахурский tkr 0 0 0 0
удинский udi 0 0 0 0
абазинский abq 0 0 0 0
финно-угорские (8) ижорский izh 0 0 0 0
хантыйский kca 0 0 0 0
карельский krl 455915 0.4476 0 0 7 0 3
ливский liv 454502 0.4462 0 0 7 0 7
мансийский mns 0 0 0 0
кильдинский саамский sjd 155184 0.1524 9 0 2 0 2
йоканьгско-саамский sjt 0 0 0 0
водский vot 481454 0.4727 0 0 4 0 3
cамодийские (4) энецкий enf 0 0 0 0
нганасанский nio 0 0 0 0
селькупский sel 0 0 0 0
ненецкий yrk 0 0 0 0
палеосибирские (7) алюторский alr 0 0 0 0
чукотский ckt 0 0 0 0
ительменский itl 0 0 0 0
кетский ket 0 0 0 0
корякский kpy 0 0 0 0
нивхский niv 0 0 0 0
южноюкагирский yux 0 0 0 0
эскимосско-алеутские (1) чаплинский ess 0 0 0 0

Примечания[edit]

  1. Фаткуллин Ф.Н. Википедии на языках России сегодня и завтра: зачем и как?, Финно-угорский вики-семинар, Петрозаводск, 6-9 мая 2016 г.
  2. Марков, А. В. в http://amp.gs/j8d9b по Вааль, Франс де, 2007
  3. Шайхиев Г.Ф.. Язык разума. Мы думаем и по-татарски, и по-русски, и по-английски... Казань: 2000 г.
  4. Фаткуллин Ф.Н.: Мифологическое сознание и нематериальная культурная среда. Эмпирический анализ на базе структуры и статистики обращений к материалам разделов Википедии на разных языках. I Всероссийская научно-практической конференция "Язык, общество и информационные технологии" (19-20.02.2022). (Tatar) Положение (Russian) Информационное письмо (Russian) Программа (Russian)
  5. Фаткуллин Ф.Н.: Экосистема цифровой жизнеспособности татарского языка и культуры. Что, зачем и как?. VIII Всероссийский съезд учителей татарского языка и литературы. Секция: Поликультурное образование как фактор формирования национального самосознания и личности ребёнка. 28.06.2022.
  6. Фаткуллин Ф.Н.: Цифровая экосистема жизнеспособности языков и культур народов Татарстана: что, зачем и как?. Межрегиональная научно-практическая конференция «Сохранение и развитие родных языков в условиях многонационального государства: языковая политика, проблемы и перспективы», Секция «Роль современных информационно-коммуникационных технологий в сохранении языков», Казань, Институт истории им. Ш. Марджани Академии наук Республики Татарстан, 21.06.2022.
  7. Фаткуллин Ф.Н.: Вики как катализатор культурной трансформации сообщества носителей языка. Российская Вики-конференция 2022.