Между суверенитетом и заработком: нужна ли России национальная ИИ-модель?

Денис Филиппов, генеральный директор MWS AI (входит в МТС Web Services)

В середине марта 2026 года Минцифры опубликовало законопроект о регулировании искусственного интеллекта (ИИ). Он, среди прочего, вводит понятия суверенных и национальных фундаментальных моделей. К ним относятся системы, созданные российскими физическими и юридическими лицами в России с использованием данных, сформированных внутри страны. Законопроект также описывает «доверенные модели». Они, как следует из текста документа, могут включать системы, созданные при участии более широкого круга специалистов (вероятно, с использованием иностранных открытых решений), но должны соответствовать «требованиям безопасности и качества, установленным Банком России, федеральными органами исполнительной власти и госкорпорациями», и обрабатывать данные на территории страны.

По сути, закон, который может вступить в силу 1 сентября 2027 года, закрепит приоритет отечественных решений на российском рынке и позволит России стать технологически независимой страной за счёт создания собственной фундаментальной модели. В то же время законодатели предлагают идти по дорогому пути.

Зарубежная практика показывает, что разработка и обучение такой системы с нуля потребуют сотен миллиардов, если не триллионов рублей, поскольку предполагают работу сразу в нескольких затратных направлениях. Это создание вычислительной инфраструктуры (серверов, графических процессоров (GPU), дата-центров), сбор и подготовка больших объёмов данных, длительный процесс обучения и тестирования модели, а впоследствии — её поддержка и регулярное обновление. Так, американский технологический гигант OpenAI только в прошлом году закрыл раунд на рекордные $ 40 млрд, а в этом году снова привлёк инвестиции, уже на сумму $ 110 млрд, чтобы покрыть расходы на чипы и центры обработки данных, необходимые для работы ИИ.

Это ещё и долго: OpenAI понадобилось порядка 10 лет, чтобы создать ChatGPT — исследования в этом направлении начались ещё в 2015 году. Есть ли столько времени у России с учётом стремительного развития технологий и нарастающей гонки вооружений в ИИ? Кажется, что нет.

Более реалистичным выглядит компромиссный подход: брать открытые (open-source) модели и обучать их под конкретные задачи внутри страны. Это позволит сократить расходы на вычислительные ресурсы, быстрее тестировать продуктовые и бизнес-гипотезы и выводить на рынок конкурентоспособные продукты. Для этого в России есть все условия, включая талантливых специалистов (по способности придумывать и реализовывать бизнес-модели Россия точно не уступает, а часто опережает и Китай, и США), а также нарастающий спрос на ИИ. По нашим наблюдениям, 80% компаний готовы внедрять ИИ-ассистентов для HR-отделов, юристов, аналитиков, разработчиков и других специалистов.

По такому пути давно идёт Китай: местные компании и научные центры создают ИИ-продукты, адаптируя открытые разработки под локальные бизнес-задачи и требования регуляторов. Так, китайская компания DeepSeek AI сразу представила модель DeepSeek-R1 в формате открытого кода. А это дало возможность сторонним компаниям использовать её на своих мощностях. А ещё — создавать собственные продукты на базе системы, включая автономных ИИ-агентов, ставших новой вехой развития индустрии. Схожим образом поступила и Alibaba, запуская Qwen. И это даёт плоды. По данным Reuters, около 80% американских ИИ-проектов, вероятно, базируются на китайских нейросетях. На китайские ИИ-продукты также приходится четверть из топ‑100 крупнейших проектов по выручке. А Fortune в недавнем материале вовсе назвал Китай вероятным победителем ИИ-гонки, во многом благодаря ставке на открытый код.

Примеры гибридного формата, к слову, есть и в США. Так, в январе 2026 года компания Apple, которая, очевидно, обладает всеми ресурсами для запуска собственной модели, заключила многолетнее партнёрство с Google и будет создавать ИИ-продукты на базе Google Gemini. А ещё усиливать за счёт неё существующие разработки — в частности, голосового помощника Siri. Технологический гигант поступал так и раньше: вместо запуска собственной поисковой системы интегрировал Google Search в iOS и таким образом улучшил продукт при минимальных издержках. Вероятно, в будущем Apple выведет на рынок собственную фундаментальную модель, но только тогда, когда это будет экономически оправдано (как уже было с переходом от процессоров Intel к собственным).

Уникальность текущего момента в том, что благодаря открытому коду весь мир оказался примерно в одинаковой стартовой позиции. И выиграет не тот, кто потратит больше на обучение фундаментальной модели, а тот, кто разработает жизнеспособные продукты и найдёт модели монетизации раньше других. Более того, всё, что создаётся для российского рынка, потенциально может работать и за его пределами: для IT-продуктов границ в широком смысле не существует. Понятно, что нужно учитывать политический контекст, но дружественные рынки вполне открыты для российских разработок.

Если использовать гибридный подход, то как обеспечить безопасность продуктов и технологический суверенитет России? Ответ опять же дают китайские соседи. Главный регулятор интернета в стране — Управление по киберпространству Китая (CAC) — требует, чтобы любая компания, которая выпускает на рынок ИИ-продукт, предварительно регистрировала его в общедоступной базе данных — реестре алгоритмов. В заявке необходимо показать, что инструмент не связан ни с одной из категорий рисков — от дискриминации по возрасту и полу до психологического вреда. Данные также должны храниться на территории Китая, на локальных серверах. В совокупности эти меры формируют экосистему, где даже при использовании открытых или зарубежных моделей государство сохраняет контроль над данными и применением ИИ-продуктов.

Задачи соответствия национальным ценностям и требованиям регуляторов можно решить и на уровне внешнего фильтрующего модуля — надстройки, которая проверяет входящие запросы и исходящие ответы модели на соответствие заданным правилам. Она может блокировать нежелательный контент, корректировать тональность, ограничивать обсуждение определённых тем или обеспечивать соблюдение отраслевых стандартов. Это значительно дешевле и быстрее, чем создавать модель с нуля, закладывая все ограничения на этапе обучения, и позволяет гибко адаптировать один и тот же продукт под требования разных рынков и регуляторов.

При этом один подход не исключает другого. Никто не запрещает параллельно вести работу над собственной фундаментальной моделью, но финансировать эту разработку за счёт выручки от продуктов, которые уже работают и приносят деньги. Это прагматичнее, чем ставить всё на дорогостоящее обучение с нуля, откладывая монетизацию на годы вперёд.

Разберёмся в терминах. Большие языковые модели бывают проприетарными и открытыми. Проприетарные — это закрытые разработки, доступ к которым предоставляется через API или по подписке; их архитектура и обучающие данные не раскрываются. Примеры — ChatGPT от OpenAI, Claude от Anthropic, Gemini от Google. Открытые (open-source) модели, напротив, публикуются в свободном доступе: любая компания может скачать их, изучить, дообучить на собственных данных и развернуть локально на собственной инфраструктуре, чтобы данные оставались в её закрытом контуре. Среди наиболее известных — DeepSeek-R1 и Qwen от Alibaba. Обучение модели с нуля (pre-training) — это создание фундаментальной системы «из ничего»: сбор терабайтов данных (по сути, всех доступных в мире данных), проектирование архитектуры, месяцы вычислений на тысячах GPU и миллиарды долларов инвестиций. Дообучение (fine-tuning) — принципиально другой процесс: берётся уже готовая открытая модель и адаптируется под конкретную задачу, отрасль или язык. Это в сотни раз дешевле, быстрее и доступнее — именно поэтому большинство ИИ-продуктов в мире строятся не на собственных фундаментальных моделях, а на дообученных открытых.