Jump to content

Grants:Programs/Wikimedia Community Fund/Rapid Fund/InfoShield:Tech Sprint to Protect Content Neutrality (D&H Module) (ID: 23688822)

From Meta, a Wikimedia project coordination wiki
statusDraft
InfoShield: Tech Sprint to Protect Content Neutrality (D&H Module)
request or grant IDR-RF-2511-21271
proposed start date2026-01-01
proposed end date2026-03-01
requested budget (local currency)5000 USD
requested budget (USD)5000 USD
grant typeNonprofit organization with Wikimedia mission
funding regionunknown region
decision fiscal year2025-26
applicantInfoShield
organization (if applicable)Unity Bridge

Applicant details

[edit]
Main Wikimedia username. (required)

InfoShield

Organization

Unity Bridge

If you are a group or organization leader, board member, president, executive director, or staff member at any Wikimedia group, affiliate, or Wikimedia Foundation, you are required to self-identify and present all roles. (required)

N/A

Describe all relevant roles with the name of the group or organization and description of the role. (required)

Main proposal

[edit]
1. State the title of your proposal. This will also be the Meta-Wiki page title.

InfoShield: Tech Sprint to Protect Content Neutrality (D&H Module)

2. and 3. Proposed start and end dates for the proposal.

2026-01-01 - 2026-03-01

4. What is your tech project about, and how do you plan to build the product?

Include the following points in your answer:

  • Project goal and problem you solve
  • Product strategy or project roadmap
  • Technical approach (infrastructure, tech stack, key tools and services)
  • Integrations or dependencies (if any)

Проект InfoShield НПО Unity Bridge представляет собой технологический противовес сложным цифровым угрозам, напрямую поддерживающий авторитет и безопасность движения Wikimedia.

Цель проекта и решенная проблема
[edit]

Основная проблема заключается в эскалации использования ИИ/НЛП для генерации и координации пропаганды и языка вражды (модуль D&H), что подрывает основополагающие принципы нейтральности и проверяемости контента Википедии. Наша цель — использовать наш проверенный MVP на основе ИИ/НЛП для создания высокоточного и быстродействующего инструмента классификации, сохраняющего целостность информационной экосистемы, жизненно важной для Викимедиа.

Стратегия продукта или дорожная карта проекта (2-месячный спринт)
[edit]

Это двухмесячный интенсивный технический спринт, направленный на адаптацию и проверку:

  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Месяц 1 (адаптация):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> аннотация данных, тонкая настройка и переобучение нашей существующей модели обработки естественного языка с использованием новых, сложных шаблонов пропаганды, в частности, с учетом языка, релевантного пробелам в контенте Wikimedia.</font></font>
  2. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Месяц 2 (валидация и PoC):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Тщательное тестирование для достижения целевых KPI (точность 75%/полнота 70%). Предоставление результатов </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Proof-of-Concept (PoC)</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> API, демонстрирующих способность модели классифицировать угрозы с целевой скоростью </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">менее 5 минут</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> .</font></font>
Технический подход (инфраструктура, технологический стек, ключевые инструменты и услуги)
[edit]

В основе технологии лежит нейросетевая модель обработки естественного языка (на базе Transformer), размещённая в безопасной облачной инфраструктуре (например, Azure/GCP). Решение использует Python и стандартные фреймворки машинного обучения (PyTorch/TensorFlow). Это аналитический инструмент, разработанный для высокоскоростного анализа больших объёмов данных.

Интеграции или зависимости
[edit]

Основной результат — готовый к использованию API вывод (JSON/CSV) с классифицированными метаданными об угрозах. Мы используем только безопасные облачные вычислительные ресурсы, избегая сложных расширений MediaWiki или прямой интеграции основного кода. Наша система разработана для предоставления аналитики , которую можно использовать с существующими инструментами модерации сообщества.

5. What is the expected impact of your project, and how will you measure success?

Include the following points in your answer:

  • Milestones and progress tracking
  • Project impact and success metrics

Ожидаемым результатом станет наглядное, основанное на данных снижение подверженности пространств Викимедиа скоординированным, системным цифровым угрозам.

Вехи и отслеживание прогресса (двухмесячный спринт)
[edit]

Прогресс будет отслеживаться еженедельно с помощью внутренних технических отчетов и фокусироваться на достижении высокой точности обнаружения:

  • <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Конец месяца 1 (адаптация):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> завершение аннотации данных и точной настройки модели обработки естественного языка; достижение минимального базового показателя точности (например, оценка F1 &gt; 0,60) для новых сложных шаблонов угроз.</font></font>
  • <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Конец 2-го месяца (валидация и PoC):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> финальное тестирование, полная техническая документация и предоставление выходных данных PoC API, демонстрирующих способность модели работать в режиме реального времени.</font></font>
Показатели влияния и успеха проекта
[edit]

Успех измеряется с использованием следующих количественных ключевых показателей эффективности нашего существующего MVP и предлагаемых целевых показателей:

  • <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Точность:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> точность цели: </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">75%</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> и полнота: </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">70%</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> для классификации угроз </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">.</font></font>

'

  • '<font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Скорость:</font></font>'<font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Среднее время от публикации контента до пометки об угрозе: </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">менее 5 минут.</font></font><sup></sup><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">.</font></font>

<b></b>

  • '<b><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Объем обнаружения:</font></font>'<font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> платформа будет протестирована и должна быть способна классифицировать </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">50 000 уникальных единиц вредоносного контента</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> в течение прогнозируемого периода в 12 месяцев.</font></font><sup></sup><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">.</font></font></b>

<b><b></b></b>

  • '<b><b><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Социальное воздействие:</font></font>'<font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> создание аналитического инструмента, который расширяет возможности сообщества по борьбе с дезинформацией, тем самым укрепляя </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">целостность и нейтральность</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> знаний.</font></font></b></b>


6. Who is your target audience, and how have you confirmed there is demand for this project? How did you engage with the Wikimedia community?

Include the following points in your answer:

  • Project demand and target audience description
  • Links to interaction(s) with Wikimedia community
  • Evidence from community consultation such as the [Community Wishlist]

Целевая аудитория — команды модерации и доверия и безопасности сообщества Wikimedia — гражданские деятели, ответственные за обеспечение нейтралитета и безопасности во всех проектах Wikimedia.

Описание спроса и целевой аудитории проекта
[edit]

Этот спрос подтверждается документально подтвержденным глобальным кризисом дезинформации и скоординированных манипуляций , который возлагает непосильную нагрузку на модераторов. Наша целевая аудитория — технически подкованные участники сообщества или администраторы, которым нужна масштабируемая, автоматизированная и высокоточная аналитика для управления объёмом угроз, с которым не справляется традиционная человеческая модерация. InfoShield удовлетворяет острую потребность в технологическом противовесе системным угрозам, создаваемым ИИ.

Ссылки на взаимодействие с сообществом Викимедиа
[edit]

Как независимая, недавно зарегистрированная НКО, мы используем эту заявку на получение гранта Rapid Grant в качестве начальной точки формализованного взаимодействия с Фондом Викимедиа и его сообществом. Цель двухмесячного спринта — предоставить руководителям программ и техническим командам документально оформленный прототип концепции (PoC) , обеспечивающий надежные показатели (точность 75%/70%), подтверждающие пригодность нашей технологии для широкого обсуждения и использования в сообществе.

Данные, полученные в ходе консультаций с сообществом, такие как [Список пожеланий сообщества]
[edit]

Хотя мы не подавали заявку в список пожеланий сообщества, проект напрямую отвечает постоянной потребности технического сообщества в более совершенных инструментах для борьбы с координированными манипуляциями и сохранения нейтралитета , которые постоянно цитируются в обсуждениях сообщества по вопросам честности и качества модерации.

7. How will your team predict and manage potential user security and privacy risks, and what risks do you currently see?

Include the following points in your answer:

  • The level of in-house or consulted security and privacy expertise you will have available to you during delivery of this project
  • How your development, testing, and deployment processes mitigate the introduction of unnecessary security or privacy risks

Проект InfoShield минимизирует риски, связанные с безопасностью и конфиденциальностью пользователей, поскольку он работает исключительно как аналитический инструмент , предназначенный для классификации метаданных угроз. Он не получает доступ к персональным данным пользователей Wikimedia, не хранит и не обрабатывает их.

Уровень внутренней экспертизы в области безопасности и конфиденциальности
[edit]

Наша основная команда состоит из экспертов в области разработки ИИ/МО с более чем 10-летним опытом управления и администрирования продуктов. Мы применяем подход «конфиденциальность на уровне проектирования», ориентированный на безопасную, изолированную облачную архитектуру и анонимную обработку данных. Мы консультируемся с юристами, знакомыми с GDPR (поскольку Unity Bridge находится в ЕС).

Снижение рисков безопасности и конфиденциальности
[edit]
  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Минимизация данных:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> мы обрабатываем только сам вредоносный контент и связанные с ним метаданные, необходимые для классификации (источник, время). Идентификаторы пользователей не требуются и не хранятся в нашем аналитическом ядре.</font></font>
  2. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Изолированная облачная среда:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> разработка и тестирование происходят в безопасных изолированных облачных средах со строгим контролем доступа и регулярными аудитами.</font></font>
  3. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Оценка рисков:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Основной выявленный риск — это </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">алгоритмическая ошибка</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> в модели обработки естественного языка. Этот риск минимизируется благодаря тому, что второй месяц спринта посвящается тщательной валидации и тестированию на различных наборах данных для обеспечения объективности и точности (целевой показатель: 75%/70%).</font></font>
8. Who is on your team, and what is your experience?

Include the following points in your answer:

  • Your experience as a developer, relevant past projects
  • Wikimedia SUL (developer), Gerrit, Github, Gitlab or other relevant public account handles
  • Other team members, their roles and expertise

Основная команда состоит из опытных профессионалов, которые успешно довели текущий MVP до готовности к выходу на рынок, прежде чем перейти к социальной миссии.

Опыт работы разработчиком, соответствующие прошлые проекты
[edit]

В нашу команду входят эксперты в области искусственного интеллекта, естественного языка и машинного обучения . Одним из таких проектов является InfoShield MVP , который успешно продемонстрировал возможность быстрого и эффективного мониторинга и обработки больших объёмов данных в пилотном режиме в Telegram .

Wikimedia SUL (разработчик, Gerrit, Github, Gitlab или другие соответствующие публичные учетные записи)

Основное контактное лицо — Валерий Клинцов . Технические предложения и код будут доступны через закрытый репозиторий (например, GitHub/GitLab) и предоставлены руководителю программы и технической команде по запросу для проверки.

Другие члены команды, их роли и опыт
[edit]
  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Валерий Клинцов (руководитель по продукту/исполнительный директор):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> более 10 лет опыта в управлении продуктом и разработке стратегии проектов </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">. Руководит разработкой стратегии и видения в интересах общества </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">.</font></font>

<b><b></b></b>

  1. '<b><b><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Михаил Новопашин (Управляющий администратор):</font></font>'<font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> более 15 лет опыта в администрировании и управлении проектами. Отвечает за финансовую устойчивость, контроль бюджета и операционную логистику.</font></font><sup></sup><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">.</font></font></b></b>
9. How will the project be maintained long-term?

Include the long-term maintenance plan with maintainer(s) in your answer. If you expect the long-term maintenance to incur expenses, please list those and the plan for long-term expense coverage.

Проект InfoShield является основным технологическим предложением НПО Unity Bridge. Долгосрочная поддержка гарантируется благодаря текущей миссии и стратегии организации.

Долгосрочный план технического обслуживания и покрытие расходов
[edit]
  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Организационные обязательства:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Техническое обслуживание интегрировано в операционный мандат Unity Bridge, обеспечивая непрерывность технологического противодействия цифровым угрозам.</font></font>
  2. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Покрытие расходов:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Долгосрочные расходы будут покрыты за счёт последующего социального финансирования и более крупных грантов (например, от фондов, занимающихся вопросами свободы прессы, цифровых прав и социальной стабильности). Этот грант быстрого финансирования имеет решающее значение для подтверждения </font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">концепции (PoC),</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> необходимого для обеспечения более масштабного и стабильного финансирования.</font></font>
  3. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Передача сообществу:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Мы обязуемся предоставлять полную техническую документацию и аналитические результаты (PoC) техническим группам Wikimedia для упрощения внедрения и потенциальной интеграции в существующие рабочие процессы поддержки сообщества, гарантируя, что инструмент будет полезен и после первоначального двухмесячного спринта.</font></font>
10. Under what license will your code be released, and how will you ensure the product is well documented?

Include the following points in your answer:

  • Code license and compatibility with Wikimedia projects
  • Documentation plan

Основные аналитические компоненты, включая обученные модели обработки естественного языка и код API-обёртки, будут выпущены под лицензией MIT или Apache License 2.0 . Это гарантирует максимальную совместимость и соответствие принципам свободной культуры, позволяя сообществу Wikimedia свободно использовать и адаптировать код.

Лицензия кода и совместимость с проектами Wikimedia
[edit]

Выбор лицензии MIT/Apache 2.0 обеспечивает совместимость с требованиями экосистемы Wikimedia к открытому исходному коду. Поскольку выходные данные представляют собой готовый к API JSON/CSV-файл с секретными метаданными, он обеспечивает высокую совместимость с существующими инструментами Wikimedia (например, ORES и пользовательскими ботами модерации), использующими аналитические данные.

План документации
[edit]

По завершении двухмесячного спринта мы обязуемся предоставить полную документацию на английском языке, включая:

  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Техническая документация:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> описание архитектуры модели обработки естественного языка, источников обучающих данных и показателей производительности (точность, полнота).</font></font>
  2. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Документация API:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> Понятные руководства по использованию выходных данных PoC API (поля данных, структура вызовов).</font></font>
  3. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Руководство по настройке:</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> инструкции по запуску аналитического ядра на изолированном экземпляре сервера.</font></font>
11. Will your project depend on or contribute to third-party tools or services?

Проект будет зависеть от стандартных сторонних услуг для основной работы:

  1. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Службы облачных вычислений (например, Azure/GCP):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> требуются для размещения модели нейронной сети и управления анализом больших объемов данных.</font></font>
  2. <font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;">Стандартные библиотеки машинного обучения (например, PyTorch/TensorFlow, Python):</font></font><font dir="auto" style="vertical-align: inherit;"><font dir="auto" style="vertical-align: inherit;"> используются для разработки и запуска модели обработки естественного языка.</font></font>

Проект не вносит свой вклад в существующие сторонние инструменты или сервисы; основной вклад направлен на сообщество с открытым исходным кодом (через выпуск лицензии MIT/Apache) и аналитическую экосистему Wikimedia (через выходные данные API).

12. Is there anything else you’d like to share about your project? (optional)

Главное преимущество InfoShield заключается в том, что он построен на проверенном, функциональном MVP , успешно обработавшем большие объёмы данных в Telegram до его выхода на социальную платформу. Это минимизирует риски проекта и обеспечивает высокую вероятность достижения целей двухмесячного спринта. Мы не начинаем с нуля, а адаптируем мощную технологию для удовлетворения критически важных потребностей сообщества Wikimedia.

Budget

[edit]
13. Upload your budget for this proposal or indicate the link to it. (required)


14. and 15. What is the amount you are requesting for this proposal? Please provide the amount in your local currency. (required)

5000 USD

16. Convert the amount requested into USD using the Oanda converter. This is done only to help you assess the USD equivalent of the requested amount. Your request should be between 500 - 5,000 USD.

5000 USD

We/I have read the Application Privacy Statement, WMF Friendly Space Policy and Universal Code of Conduct.

No

Endorsements and Feedback

[edit]

Please add endorsements and feedback to the grant discussion page only. Endorsements added here will be removed automatically.

Community members are invited to share meaningful feedback on the proposal and include reasons why they endorse the proposal. Consider the following:

  • Stating why the proposal is important for the communities involved and why they think the strategies chosen will achieve the results that are expected.
  • Highlighting any aspects they think are particularly well developed: for instance, the strategies and activities proposed, the levels of community engagement, outreach to underrepresented groups, addressing knowledge gaps, partnerships, the overall budget and learning and evaluation section of the proposal, etc.
  • Highlighting if the proposal focuses on any interesting research, learning or innovation, etc. Also if it builds on learning from past proposals developed by the individual or organization, or other Wikimedia communities.
  • Analyzing if the proposal is going to contribute in any way to important developments around specific Wikimedia projects or Movement Strategy.
  • Analysing if the proposal is coherent in terms of the objectives, strategies, budget, and expected results (metrics).

Endorse


This is an automatically generated Meta-Wiki page. The page was copied from Fluxx, the web service of Wikimedia Foundation Funds, where the user has submitted their application. Please do not make any changes to this page because all changes will be removed after the next update. Use the discussion page for your feedback. The page was created by CR-FluxxBot.