FOLDER №03 / SHEET 003 REV·01 / SCALE NTS BY · AUTHOR / 2026 DRAFT

003 FOLDER №03 / SHEET 003

· · · КУДА ПЕРЕХОДИТЬ С CLAUDE И GPT · · ·

REV·01 / SCALE NTS / RU · 2026-05-09

PRE-FLIGHT · SELECT AUDIENCE · 3 MODES

ВЫБЕРИ, КАК ЧИТАТЬ

Этот выпуск идёт в трёх версиях. Выбери одну — выбор сохранится при возврате, переключиться можно в любой момент сверху страницы. Можно читать несколько режимов, если решение принимать вместе с командой.

КАРТА АЛЬТЕРНАТИВ · 8 МАЯ 2026 · МАССОВЫЙ БАН ANTHROPIC · ЧТО ДЕЛАТЬ

РЕЖИМ:

OUTPUT ВЫПУСК №003

КУДА ПЕРЕХОДИТЬ С CLAUDE И GPT

Карта альтернатив для российских пользователей на май 2026. 8 мая Anthropic закрыл тысячи аккаунтов за одну ночь. Это не последняя волна. В этом выпуске — конкретные пути для пользователя, бизнеса и разработчика.

Карта мира AI на май 2026: закрытый Запад, открытый Китай и Россия, open-weights — DWG №01 / СЕРИЯ 003 / КАРТА ПИТОМНИКОВ ТАКС

B01

ЧТО ПРОИЗОШЛО И ЧТО ДЕЛАТЬ SHEET 003 · B01 / 05

Метафора «питомник такс»: каждая модель — порода. Claude, GPT, Gemini — западные питомники, не продают РФ. В Китае и России — свои открытые питомники с породистыми такcами того же класса. Open-weights — «дворовые с родословной».

Календарь волн банов: 2024-2026, ключевые ужесточения, 8 мая 2026 — DWG №02 / ХРОНИКА БЛОКИРОВОК · 2024-05.2026

Если у вас Claude Pro или ChatGPT Plus

Ситуация серьёзная, но не катастрофа. На рынке есть три полностью рабочих сценария — все три работают сегодня, без VPN или с минимальной настройкой.

Бесплатные чаты в браузере, прямо из России без VPN

chat.deepseek.com работает напрямую — регистрация по email, сразу пять миллионов токенов на старт. По качеству DeepSeek в чате близок к ChatGPT. kimi.ai — длинный контекст и хорошая работа с PDF. chat.qwen.ai — Alibaba, нужна регистрация, на русском работает хорошо.

Русские сервисы за рубли с СберID или Yandex ID

gigachat.ru — Сбер, бесплатно физлицам один миллион токенов в год по СберID. Pro — около 100-300 ₽ в месяц. Алиса AI (ya.ru/ai) — Яндекс, входит в подписку Yandex Plus за 199 ₽. Эти сервисы официально работают для российских пользователей, без VPN, без проблем с оплатой.

Подписки Pro у китайских сервисов через Alipay

Если бесплатных лимитов не хватает и нужен полноценный Pro-режим, можно оформить подписку у DeepSeek, Kimi или Qwen через Alipay. Настройка занимает час: регистрация Alipay по российскому номеру с верификацией загранпаспортом, пополнение через P2P-биржу (USDT за рубли, конвертация в юани), привязка к платформе. После этого подписка работает как обычная — двадцать-сорок долларов в месяц.

Что делать прямо сейчас

Если вы платите за Claude Pro или ChatGPT Plus с российской карты или с IP, который мог быть классифицирован как российский — перейдите на резервный канал в ближайшие дни. Аккаунт могут отключить в любой следующей волне. Регистрация на DeepSeek или GigaChat — пять минут.

Что точно теряется

История ваших чатов на серверах Claude и OpenAI. Резервная копия не делается, экспорт нужно сделать заранее (если ещё есть доступ). У DeepSeek и Kimi есть импорт Markdown — старые ценные диалоги можно перенести вручную как контекст в новый чат.

Если у вас в команде работа на Claude или GPT

Ситуация серьёзная, но не катастрофа. На рынке есть две полностью рабочие альтернативы для российского бизнеса.

Переключить инструменты команды на китайский Anthropic-совместимый API

Технически — это меняется одной строкой в настройках Claude Code или другого AI-инструмента. Под капотом запросы идут не к Anthropic, а к китайскому провайдеру (Z.AI, DeepSeek, Kimi и подобные). Те же интерфейсы, те же файлы, тот же терминал — другой мотор. Подписка дешевле Claude Pro в 1.5-3 раза при бо́льших лимитах. По нашему опыту реального production-использования — закрывает примерно 90 процентов рабочих задач. Не закрывает: работа с картинками, поиск в интернете, специфичные расширения.

Перевести команду на российскую инфраструктуру

Главная находка для юрлица — Cloud.ru Evolution AI Factory. В каталоге сервиса больше двадцати моделей, среди которых лучшие китайские (Qwen3, GLM-4.7), российские (GigaChat-2-Max, T-Pro) и даже открытые веса OpenAI (gpt-oss-120b). Всё в рублях, со СБП-оплатой со счёта юрлица, ежемесячными актами и счетами-фактурами. Цены — от единиц до нескольких сотен рублей за миллион токенов. Бухгалтерия закрывается стандартно через СБИС или Диадок. Никакого валютного контроля, никаких посредников, никакого НДС-агента.

Что меняется в работе команды

На инструменте — почти ничего. Разработчики продолжают пользоваться Claude Code или Cursor, просто запросы летят к новому провайдеру. Привычки и процессы остаются. Что точно меняется — финансовая дисциплина: при переходе на российских провайдеров платежи в рублях с актами, при попытках платить иностранцам напрямую — НДС 22% с 2026 года и валютный контроль. Бухгалтерия скажет спасибо за переезд на Cloud.ru.

Что делать прямо сейчас

Срочность высокая для команд, у которых ключи Anthropic или OpenAI оплачивались с РФ-карты или с IP, который мог быть классифицирован как российский. Стандартный план миграции — пять-шесть часов работы одного разработчика на пилот, плюс одна-две недели на полный перевод команды. Календарь миграции — в Блоке 3.

Главное за минуту

Все пять основных китайских провайдеров (Z.AI/GLM, DeepSeek, Kimi/Moonshot, Alibaba/Qwen, MiniMax) запустили официальные Anthropic-compatible эндпоинты. Меняется одна переменная в ~/.claude/settings.json:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "ваш-zai-ключ"
  }
}

Закрываешь терминал, открываешь новый, запускаешь claude — Claude Code дальше работает на GLM-4.7 вместо Sonnet. Полная совместимость по text content, tool use, file editing, agentic loops.

Что НЕ работает через Anthropic-compat

image content (картинки) и document content (PDF)
server_tool_use (server-side web_search, code_execution)
server-side MCP через anthropic-beta header (типы mcp_tool_use, mcp_tool_result) и поле mcp_servers в запросе
container_upload
thinking.budget_tokens, top_k, cache_control — молча игнорируются

Локальные MCP работают. Серверы, которые вы добавляете командой claude mcp add в свой Claude Code, общаются с MCP-сервером на вашей машине, а в API провайдера летят как обычные tool_use вызовы. Z.AI это явно поддерживает (документация упоминает Vision MCP, Web Search MCP, Web Reader MCP), DeepSeek и Kimi — то же самое. Не работает только то, что Anthropic недавно добавил как server-side фичу: когда сам API делает MCP-вызов вместо клиента. Этот канал у альтернативных провайдеров отсутствует.

То есть это «Claude Code на 90-95%» — для большинства повседневной разработки и для типового MCP-стека (файловая система, git, search, vision) полностью достаточно. Не закрывает: работу с картинками в чате модели и server-side web_search через сам API.

Цены и подписки

GLM Coding Lite — от $18/мес, примерно 80 промптов за пятичасовое окно (в Claude Pro — около 45). Pay-per-use тоже дешевле:

GLM-4.7 — $0.60 / $2.20 за 1M токенов (input/output)
DeepSeek V4 Pro — $0.435 / $0.87 (со скидкой 75% до 31.05.2026)
Claude Sonnet — $3 / $15

Выбор моделей по задаче — не про роутинг 5-6 моделей

По нашему 48-парному замеру на реальных задачах от 9 мая 2026 (сопоставление коммитов с багами) победитель — MiMo V2.5 Pro без рассуждений через OpenRouter (F1 0.86, задержка 2.5с). DeepSeek V4 Pro в режиме рассуждений даёт F1 0.90, но при задержке 11с и нестабильно: при увеличении бюджета рассуждений до 4000 полнота падает с 0.82 до 0.67 — избыточное рассуждение. Без рассуждений DeepSeek даёт F1 0.73 — проигрывает бесплатному Nemotron 3 Super 120B (0.78 через бесплатный уровень OpenRouter). GLM 5.1 baseline — F1 0.83 при задержке 3.1с, стабильно, в боевой работе. Полный разбор — Блок 4.5.

Вердикт по нарративу community 2026

GLM-5.1 через Z.AI Coding Plan + Claude Code — самая близкая замена Sonnet для повседневной разработки. DeepSeek — дешёвый второй слой для шаблонной генерации/рутинных задач/тестов, не основная замена. Kimi — для длинного контекста и creative задач. Qwen3-Coder — для специфичных coding-кейсов. Multi-model осмыслен только когда нужны разные ниши, а не как «давайте на всякий случай 5 эндпоинтов».

B02

ДЕНЬГИ, ДОКУМЕНТЫ, СРОЧНОСТЬ SHEET 003 · B02 / 05

Сколько это будет стоить

На бесплатном уровне — ноль. У всех трёх главных альтернатив в браузере есть щедрые бесплатные пакеты:

chat.deepseek.com — 5 миллионов токенов на старт, потом возобновляемый дневной лимит
kimi.ai — бесплатные сообщения с лимитом по объёму
chat.qwen.ai — бесплатно после регистрации Alibaba
gigachat.ru — 1 миллион токенов в год по СберID, ~1500-2000 длинных сообщений
ya.ru/ai (Алиса) — бесплатно в стандартной версии

Если бесплатного хватает — на этом можно остановиться. Большинство людей не упирается в лимиты.

Если нужен Pro-режим:

Сервис	Подписка	Цена/мес	Способ оплаты
Claude Pro (для сравнения)	базовый	$20	заблокирован для РФ
ChatGPT Plus	базовый	$20	заблокирован для РФ
GigaChat Pro	физлицо	~100-300 ₽	СБП через СберID
Yandex Plus + Алиса Pro	физлицо	199 ₽	СБП, корп карты
DeepSeek Pro	стандарт	~$10	Alipay или китайская UnionPay
Kimi+	стандарт	~$15-20	Alipay
Qwen Premium	стандарт	~$20	Alipay через Alibaba

Для русскоязычных задач GigaChat Pro и Алиса Pro — самый простой и дешёвый путь. Сто-двести рублей в месяц, никаких VPN, никаких иностранных платёжных систем, всё через привычный СберID или Yandex ID.

Что меняется в работе

На самом инструменте чата — почти ничего. Те же диалоги, те же возможности, тот же интерфейс на русском. Большинство китайских и русских сервисов поддерживают тот же набор фич: загрузка документов, работа с кодом, генерация изображений (через расширения), возможность скармливать модели большие тексты целиком (книги, длинные переписки) — то, что в технических обзорах называют «длинный контекст».

История чатов — отдельная тема. Ваши прошлые диалоги остаются на серверах Claude и OpenAI пока вас не забанили. Если есть доступ — экспортируйте важное в Markdown. У DeepSeek и Kimi есть импорт Markdown в новый чат: можно перенести цепочку как контекст «вот наша предыдущая переписка», и продолжить там.

Когда это срочно

Срочно — если вы платите за Claude Pro или ChatGPT Plus, и эта подписка ещё не отвалилась. Открывайте экспорт чатов прямо сейчас, пока есть доступ. Параллельно регистрируетесь на gigachat.ru или chat.deepseek.com — 5 минут.
Не срочно — если вы пользуетесь только бесплатным Claude.ai через VPN. У вас всё равно нет подписки и истории. Просто переходите на бесплатные альтернативы без VPN.
Совсем не срочно — если вы уже на GigaChat / Алиса / DeepSeek / Kimi.

Стоимость месяц для команды: Claude Pro, GLM Coding, Cloud.ru, GigaChat — DWG №03 / TABLE №1 / ЦЕНЫ MAY 2026

Сколько это будет стоить

На уровне отдельного разработчика: примерно столько же или меньше. Подписка Claude Pro — $20/мес с лимитом ~45 сообщений за 5 часов. GLM Coding Lite — $18 с лимитом ~80 промптов за то же окно. Один промпт в Z.AI считается как полная сессия с 15-20 внутренними вызовами модели — это больше, чем «одно сообщение» в Claude Pro. Грубая оценка: за те же деньги вы получаете трёх-четырёхкратный рабочий запас.

Для активного разработчика, упирающегося в лимиты Claude Pro, есть GLM Coding Pro — около $60 в месяц с лимитом 4000 промптов за 5 часов. Это пятикратный объём от Lite. Самые тяжёлые кейсы — Coding Max за $160 с 8000 промптов в неделю. Это уже уровень Claude Max, и для большинства команд избыточно.

НДС 22% с 2026 — главный финансовый аргумент

На уровне команды-юрлица в России — ситуация принципиально другая. Прямая оплата иностранным провайдерам со счёта юрлица создаёт два юридических обязательства:

НДС 22% с 2026 года при покупке электронных услуг иностранных компаний (статья 174.2 Налогового кодекса). Платит юрлицо как налоговый агент.
Валютный контроль по 173-ФЗ — банк может запросить документы о назначении платежа, договоры, инвойсы.

Решение для бизнеса — Cloud.ru Evolution AI Factory. Каталог из 20+ моделей, оплата в рублях с расчётного счёта, ежемесячные акты и счета-фактуры. Цены за 1M токенов: от 0 ₽ (preview-режим у GLM-4.7) до 569 ₽ (GigaChat-2-Max, флагман Сбера). Большинство китайских и open-weight моделей — в диапазоне нескольких рублей за input и нескольких десятков за output. Никаких валютных контролей, никаких НДС-обязательств — Cloud.ru уже включил в цену.

Документооборот: рубли с актами через Cloud.ru vs прямая оплата иностранцам — DWG №04 / FLOW №1 / ДОКУМЕНТООБОРОТ

Что меняется в работе команды

На инструментах — почти ничего. Разработчики, которые работали в Claude Code, продолжают работать в Claude Code. У них меняется одна строка в локальных настройках, и весь остальной рабочий процесс остаётся. Файлы, шаги, привычки, скорость работы — то же.

Что точно меняется — финансовая дисциплина. Если команда покупала подписки Claude или OpenAI на личные карты с компенсацией от компании — этот процесс упрощается на одного провайдера, причём российского, с полной отчётностью. Если оплата шла напрямую с расчётного счёта — теперь не нужны посредники, валютный контроль, НДС-агент, инвойсы на английском.

Меняется и профиль рисков. Аккаунт у Anthropic могут заблокировать в любой момент очередной волны — это не прихоть, а применение политики. Команды, которые мигрировали на стабильных провайдеров, перестают зависеть от этой неопределённости. История чатов, проекты, ключи — всё в стабильных юрисдикциях.

Когда это срочно

Heatmap срочности миграции: типы команд × текущее использование AI — DWG №05 / MATRIX №1 / ПРИОРИТЕТЫ

Срочно — если ваша команда работает на Claude или OpenAI через VPN с российскими картами. Это основная цель массовых банов. 8 мая 2026 Anthropic закрыл тысячи таких аккаунтов за одни сутки. Запланируйте миграцию в ближайший спринт.
Стандартный план — 5-6 часов одного разработчика на пилот, потом 1-2 недели на перевод команды. Параллельно бухгалтерия открывает аккаунт на Cloud.ru или Yandex AI Studio как юрлицо — занимает 1-2 рабочих дня (договор оферты, реквизиты, активация сервиса).
Не срочно — если команда уже работает через российских провайдеров (Yandex, Sber) или гибридную схему с агрегаторами в рублях.

Цены: подписки и pay-per-use

Базовые цифры за 1M токенов на май 2026 (input / output), все верифицированы через WebFetch на официальные docs.* провайдеров:

Провайдер	Модель	Input	Output	Контекст
Anthropic	`claude-sonnet-4.6`	$3.00	$15.00	1M
Anthropic	`claude-opus-4.6`	$15.00	$75.00	200K
Z.AI	`glm-5.1` (флагман)	$1.40	$4.40	200K
Z.AI	`glm-4.7`	$0.60	$2.20	200K
Z.AI	`glm-4.5-air`	$0.20	$1.10	128K
Z.AI	`glm-4.7-flash`	$0	$0	128K
DeepSeek	`v4-pro` (75% off до 31.05)	$0.435	$0.87	1M
DeepSeek	`v4-flash`	$0.14	$0.28	1M
Moonshot	`kimi-k2.6`	$0.95	$4.00	262K
Moonshot	`kimi-k2.5`	$0.60	$3.00	262K
Alibaba	`qwen3-max` ≤32K	$1.20	$6.00	32K
Alibaba	`qwen3.5-plus` ≤256K	$0.40	$2.40	256K
Alibaba	`qwen3-coder-flash`	$0.30	$1.50	—
MiniMax	`m2.7`	~$0.29	~$1.17	205K

DeepSeek V4 Pro со скидкой в 7 раз дешевле Sonnet на input, в 17 раз дешевле на output. После 31 мая 2026 цена удвоится до $0.87 / $1.74 — всё равно в полтора-два раза дешевле Sonnet.

Z.AI GLM Coding Plan — альтернатива Claude Pro

Тариф	Цена/мес от	Промптов/5ч	Промптов/нед	MCP/мес
Claude Pro (для сравнения)	$20	~45	—	—
GLM Coding Lite	$18	~80	~400	100
GLM Coding Pro	(на сайте)	~400	~2,000	1,000
GLM Coding Max	(на сайте)	~1,600	~8,000	4,000

Точные цены Pro/Max на странице z.ai/subscribe — она рендерится клиентским JS, через curl я не извлёк (поэтому проверь в браузере перед оплатой). Документация даёт лимиты: Lite ≈ 3× Claude Pro, Pro ≈ 5× Lite, Max ≈ 4× Pro. Один промпт у Z.AI — это полная multi-step сессия с 15-20 внутренними вызовами модели, не одно user-сообщение.

Множитель GLM-5.1 / GLM-5-Turbo: один ваш промпт в пик (14:00-18:00 UTC+8 — это 09:00-13:00 МСК) расходует три промпта из лимита подписки, вне пика — два. То есть в Coding Pro ваши «4 000 промптов в неделю» при пиковой работе на флагмане превращаются в ~1 333. До конца июня 2026 — вне пика множитель ×1 как промо.

НДС 22% при прямой оплате иностранцам (с 2026)

С 1 января 2026 ставка НДС в России — 22%. При покупке электронных услуг (включая API LLM-провайдеров) у иностранных компаний российское юрлицо становится налоговым агентом по статье 174.2 НК РФ: самостоятельно начисляет, удерживает и платит НДС с каждого платежа. Физлица формально не должны (платит сам провайдер при постановке на учёт), но на практике — иностранцы часто не вставали на учёт, и это превращалось в серую зону.

Это означает, что прямой ключ Anthropic за условные $200/мес со счёта юрлица — это $200 + 22% сверху на бухгалтерские плечи. Через российских провайдеров (Cloud.ru, Yandex, Sber) НДС уже включён в тариф.

Дорожная карта по бюджету

Один разработчик активно использует Claude Code. Считаем по сценариям.

Сценарий «Lite» (~30 рабочих часов в неделю активной работы с агентом)

Claude Pro $20/мес упирается в лимиты, нужен Pro Max за $100
GLM Coding Lite $18/мес = три таких объёма, лимиты не упираются
Итого экономия: $80-100 на разработчика в месяц

Сценарий «Heavy» (60+ часов, автономные агентные задачи, большие проекты)

Claude Pro Max $100-200/мес
GLM Coding Pro ~$60/мес = пятикратный объём от Lite
Сравнимо или дешевле, плюс независимость от политики использования Anthropic

Сценарий «оплата за использование, активная разработка» (~5-10M токенов/мес)

Claude Sonnet API: $50-150/мес
DeepSeek V4 Pro со скидкой: $5-15/мес
GLM-4.7 pay-per-use: $10-20/мес
Экономия в разы для интенсивных рабочих процессов

Команда из 5 разработчиков на Pro-подписках: $300-1000/мес vs $90-300/мес на GLM. Чистая экономия порядка $200-700/мес плюс отсутствие риска потери всех аккаунтов.

B03

ДОРОЖНЫЕ КАРТЫ МИГРАЦИИ SHEET 003 · B03 / 05

Карта быстрого переезда (15 минут)

Сначала экспорт

Если у вас активный Claude Pro или ChatGPT Plus — зайдите в настройки аккаунта и сделайте экспорт всех чатов. Claude → Settings → Privacy → Export Data. ChatGPT → Settings → Data Controls → Export Data. Получаете архив с диалогами в Markdown или JSON. Это страховка: если завтра аккаунт отключат, у вас остаётся история.

Регистрация на основной альтернативе

Самое простое — chat.deepseek.com. Вход через email или Google ID, без VPN, без верификаций. Регистрация — минута. Сразу пять миллионов токенов на пробу.

Регистрация на русскоязычной альтернативе

gigachat.ru — вход через СберID (если есть Сбер-аккаунт, это одно нажатие). Бесплатно один миллион токенов в год — этого хватает на месяцы обычного использования. Параллельно — Алиса на ya.ru/ai через Yandex ID.

Импорт важного контекста

Если у вас были ценные диалоги в Claude — открываете новый чат в DeepSeek или Kimi, копируете самое важное из экспорта как контекст: «Вот наш предыдущий разговор, продолжаем». Не всё переедет, но ключевое — переедет.

Тест: типичная задача

Дайте новой модели одну вашу обычную задачу — генерация текста, помощь с переводом, кодом, разбор документа. Сравните с тем, что давал Claude. Чаще всего разница не заметна.

Если нужен Pro-режим (час времени)

Если бесплатных лимитов мало:

Регистрируете Alipay по российскому номеру (см. Блок 5).
Покупаете на P2P USDT за рубли через Bybit или Binance (5-10 минут с СБП).
Конвертируете USDT → CNY через сервис в Alipay.
На сайте DeepSeek / Kimi / Qwen выбираете Pro-подписку, оплачиваете через Alipay по QR-коду.

Alipay — один раз настроил, дальше работает. Все китайские сервисы принимают.

Альтернатива без всякого Alipay — GigaChat Pro (~100-300 ₽/мес через СберID и СБП) или Yandex Plus с Алисой Pro (199 ₽/мес). Для русского языка эти варианты часто достаточны.

Карта для команды разработчиков (5 шагов, 1-2 недели)

Пилот на одном разработчике, день 1-2

Выбираете одного добровольца. Он регистрирует аккаунт на Z.AI или DeepSeek (15 минут с банковской картой через посредника или Alipay), получает API-ключ и меняет одну переменную в своих локальных настройках Claude Code. Дальше работает обычным две-три задачи в обычном режиме. По итогу даёт отзыв: что работает, что просаживает, какие задачи не закрываются.

Решение по сценариям, день 2-3

На основе отзыва от пилота решаете: переходим на одну модель (GLM-4.7 как новый «Sonnet команды»), или строим связку из двух-трёх провайдеров под разные задачи. Для большинства команд хватает одного основного провайдера.

Параллельно — открытие юрлицу аккаунта на Cloud.ru, день 1-3

Бухгалтерия регистрирует по реквизитам ОГРН/ИНН/КПП, активирует сервис Evolution AI Factory, настраивает закрытие документов через СБИС или Диадок. Это идёт независимо от пилота.

Команда переключается, неделя 2

Все разработчики получают единый шаблон настроек (~/.claude/settings.json с провайдером команды), миграция занимает по 15-30 минут на человека. Задачи не приостанавливаются.

Контроль, неделя 3-4

В первые недели смотрите на жалобы и трекаете кейсы где новая модель явно проигрывает. Если такие есть — добавляете второй endpoint к Claude через прокси для конкретных задач (vision, MCP-tools).

Карта для юрлица (4 шага, 1-2 рабочих дня)

Регистрация на Cloud.ru как юрлицо

Сайт cloud.ru, кнопка «Создать аккаунт», выбираете «Юридическое лицо», вводите ОГРН/ИНН/КПП, юридический адрес, фактический адрес, подписываете договор оферты в личном кабинете. Привязываете счёт юрлица или корпоративную карту.

Активация Evolution AI Factory

В меню сервисов выбираете «Foundation Models», принимаете дополнительные условия по конкретному каталогу моделей. Получаете доступ к каталогу из 20+ моделей: GigaChat-2 (Lite/Pro/Max), Qwen3 всех размеров, GLM-4.7, T-Pro 32B, gpt-oss-120b, Whisper, embeddings.

Получение API-ключа

В разделе «Сервисные аккаунты» создаёте сервисный аккаунт, выпускаете постоянный ключ доступа. Передаёте разработчикам.

Настройка документооборота

В разделе «Биллинг» выбираете формат закрытия: ежемесячный акт + счёт-фактура, отправка на почту бухгалтера или интеграция с СБИС/Диадок. Цены указаны с НДС, никаких дополнительных обязательств не возникает.

Личная миграция (1 час чистого времени)

Дорожная карта миграции для разработчика: 5 шагов за 1 час — DWG №17 / ROADMAP №1 / DEV MIGRATION

Регистрация на провайдере (15 минут)

Z.AI Coding Plan для основного workflow — z.ai/subscribe, оплата картой через посредника или Alipay. DeepSeek pay-per-use — platform.deepseek.com, аналогично. Если есть китайская UnionPay-карта — прямая оплата. Если только российская — через Alipay (см. Блок 5).

Получение API-ключа (5 минут)

В личном кабинете провайдера — раздел «API Keys». Выпускаете ключ, копируете.

Правка settings.json (5 минут)

В файл ~/.claude/settings.json добавляете блок env с двумя переменными — ANTHROPIC_BASE_URL (адрес эндпоинта провайдера) и ANTHROPIC_AUTH_TOKEN (ваш ключ). Готовые конфиги для всех 5 провайдеров — в Блоке 5.

Перезапуск терминала (1 минута)

Закрываете все терминалы, открываете новый. Переменные перечитываются.

Тестовый прогон (15-30 минут)

Запускаете claude в директории какого-нибудь активного проекта. Просите выполнить пару типовых задач — рефакторинг, добавление теста, поиск по коду. Сравниваете с тем, как работал Claude Sonnet. Чаще всего — разница не заметна.

Если что-то пошло не так — возвращаетесь к старым настройкам (или к alternative провайдеру) одной строчкой.

Гибридная конфигурация (если нужен vision или server-side MCP)

Стандартный Anthropic-compat не покрывает vision, server-side web_search и server-side MCP. Локальные MCP-серверы через claude mcp add работают на любом провайдере без дополнительных профилей. Гибрид нужен только если у вас в workflow картинки или PDF.

Профиль 1 — основной, через Z.AI:

function claude-glm() {
  export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
  export ANTHROPIC_AUTH_TOKEN="$ZAI_KEY"
  claude "$@"
}

Профиль 2 — для vision-задач, через прокси к Claude или к Yandex AI Studio с qwen3-vl-plus:

function claude-vision() {
  unset ANTHROPIC_BASE_URL
  export ANTHROPIC_API_KEY="$ANTHROPIC_KEY_VIA_PROXY"
  claude "$@"
}

Запускаешь нужный профиль в зависимости от задачи. Подробности — Блок 5.

Дорожная карта для своего проекта (1-2 рабочих дня)

Если вы переводите не только локальный workflow, но и production-проект, который использует Anthropic API напрямую:

Аудит всех вызовов к Anthropic API в коде — где они, что отправляют, какие фичи используют (text-only, tool use, vision, MCP).
Замена base_url на endpoint выбранного китайского провайдера. SDK от Anthropic работает прозрачно — нужно поменять только переменную окружения или параметр клиента.
Тестирование на пути «text + tool use» — должно работать без изменений.
Проверка vision/MCP-зависимых частей — там нужна альтернативная модель или второй endpoint.
Деплой в тестовую среду (staging), неделя наблюдения, потом в рабочую.

Если переезжаете на открытые веса с самостоятельным хостингом (T-Pro / GLM-4.5-Air / Llama 4) — добавляется аренда GPU у Selectel/Cloud.ru/VK Cloud (от 22-50 тыс. руб/мес за 4090 / A100), запуск vLLM или TGI, собственный OpenAI-совместимый сервер. Это занимает пару дней работы DevOps.

B04

ТЕХНИЧЕСКИЙ РАЗБОР SHEET 003 · B04 / 05

Этот блок виден всем, независимо от выбранного режима. Здесь — карта западных блокировок, механика Anthropic-compat эндпоинтов, наш замер моделей, российская инфраструктура и open-weights.

Что блокирует Запад

Шесть западных провайдеров на май 2026:

Anthropic (Claude.ai, Claude API, Claude Code)

Геоблокировка по IP жёсткая. Платёжные карты РФ не проходят (Stripe). Email-домен .ru ловится как косвенный маркер. С сентября 2025 политика supported countries исключает entities, более 50% которых ассоциированы с РФ. Май 2026 — массовые баны через VPN-детекцию, история чатов и проектов теряются вместе с аккаунтом.

OpenAI (ChatGPT, OpenAI API)

Аналогичная картина. Supported countries не включают РФ с 2024. Регулярные баны при попытках обхода. Stripe-фильтры по картам.

Google (Gemini app, AI Studio, Vertex AI)

Самая жёсткая VPN-детекция в 2026. Россия исключена из supported regions явно (ai.google.dev, обновление апрель 2026).

xAI (Grok via grok.com)

X заблокирован в РФ с 2022, grok.com следом по тем же санкционным основаниям. Через api.x.ai прямого доступа из РФ нет, только через прокси.

Perplexity

Геоблокировки нет — сайт работает напрямую из РФ. Проблема только с оплатой Pro/Max через Stripe. Бан-волн пока не зафиксировано.

Mistral (Le Chat, api.mistral.ai)

Геоблокировки нет, но 20-й пакет санкций ЕС (апрель 2026) обязывает европейские компании ограничивать AI-услуги российским лицам. Open-weights версии Mistral остаются доступны через Hugging Face.

Карта мира AI на май 2026

Четыре кластера с разными правилами:

Запад (закрыт). Anthropic, OpenAI, Google, xAI, Perplexity, Mistral, Cohere. Любая попытка официальной оплаты — отказ или бан. VPN детектируется всё лучше.
Китай (открыт + Anthropic-compat). DeepSeek, Alibaba (Qwen), Z.AI (GLM), Moonshot (Kimi), MiniMax, ByteDance (Doubao). Все, кроме Doubao на момент проверки, запустили Anthropic-совместимые эндпоинты. Оплата через Alipay (физлица), иностранные виртуальные карты, или китайская UnionPay.
Россия (рублёвая оплата). Cloud.ru Evolution AI Factory, Yandex AI Studio, GigaChat от Сбера, Selectel/VK Cloud для GPU. Расчётный счёт юрлица, акты и счета-фактуры, никаких валютных контролей.
Open-weights (self-host). T-Pro и T-Lite от T-Bank (Apache 2.0), Vikhr-Nemo и Vistral, Llama 4.x, Qwen3, GLM-4.5-Air, Falcon от TII, Phi-4. Скачиваешь веса, поднимаешь на своём GPU.

Anthropic-compatible endpoints — главный механизм

Анатомия Anthropic-compat endpoint: одна переменная, разные моторы — DWG №06 / SCHEMA / ANTHROPIC-COMPAT

Ключевая для разработчика находка 2025-2026: пять китайских провайдеров запустили эндпоинты в формате Anthropic API. Claude Code, Cline, Cursor и подобные инструменты переключаются на эти эндпоинты сменой одной переменной окружения.

Провайдер	Endpoint	Источник доков
Z.AI (GLM)	`https://api.z.ai/api/anthropic`	docs.z.ai/devpack/quick-start
DeepSeek	`https://api.deepseek.com/anthropic`	api-docs.deepseek.com/guides/anthropic_api
Kimi/Moonshot	`https://api.moonshot.ai/anthropic`	platform.kimi.ai/docs/guide/agent-support
Alibaba/Qwen	`https://dashscope-intl.aliyuncs.com/apps/anthropic`	alibabacloud.com/help/.../anthropic-api-messages
MiniMax	`https://api.minimaxi.com/anthropic`	platform.minimaxi.com/docs/api-reference/text-anthropic-api

5 ENDPOINTS · ANTHROPIC-COMPAT · MAY 2026

WORKS ✓ · text · tool use · file edit · agentic loops NOT WORKS ✕ · vision · pdf · web_search · MCP

Z.AI · GLM-4.7★ основная замена

api.z.ai/api/anthropic

SONNET → glm-4.7HAIKU → glm-4.5-air

$18/mo · Coding Lite

DeepSeek · V4 Pro[1m] · pay-per-use

api.deepseek.com/anthropic

SONNET → v4-proHAIKU → v4-flash

1M context · шаблонная генерация

Kimi · MoonshotK2.6 · 262K ctx

api.moonshot.ai/anthropic

SONNET → k2.6HAIKU → k2.6-lite

NB: не .cn — именно .ai

Alibaba · Qwen3-Maxintl · pay-per-use

dashscope-intl.aliyuncs.com

SONNET → qwen3-maxHAIKU → qwen3-plus

только междунар. версия

MiniMax · M2.7205K ctx · ppu

api.minimaxi.com/anthropic

SONNET → m2.7HAIKU → m2.7-lite

резерв · text + tool use

ANTHROPIC_BASE_URL · одной строкой переключает питомник

DWG №07 / RACK №1 / 5 ENDPOINTS

Что работает через эти эндпоинты:

text content, JSON tool calls, file editing
streaming, system prompts, temperature, top_p, stop_sequences
max_tokens, agentic loops с многошаговыми вызовами
tool_use и tool_choice (none, auto, any, tool)

Что НЕ работает (важно):

image content (картинки)
document content (PDF и аналоги)
search_result content
redacted_thinking
server_tool_use (server-side web_search, code_execution и подобное)
server-side MCP (типы mcp_tool_use, mcp_tool_result, поле mcp_servers) — это когда сам API провайдера делает MCP-вызов
container_upload
параметр thinking.budget_tokens молча игнорируется
top_k, cache_control молча игнорируются

Что важно: локальные MCP-серверы (через claude mcp add) работают. Claude Code сам общается с MCP-сервером на вашей машине, в API провайдера улетают обычные tool_use вызовы. Не блокируется. Z.AI явно описывает в документации работу Vision MCP / Web Search MCP / Web Reader MCP с GLM Coding Plan, DeepSeek и Kimi ведут себя аналогично. Что не работает — это server-side MCP, который Anthropic недавно добавил как первоклассный API-feature. У альтернативных провайдеров этой возможности нет.

ЧТО НЕ ПРОЛЕЗАЕТ ЧЕРЕЗ ТОННЕЛЬ

Через api.anthropic.com пролезает всё. Через compat-shim — узкое горло: только text, tool use, file edit.

РАБОТАЕТ ✓

text content
JSON tool calls (tool_use, tool_choice)
file editing
streaming
system prompts
agentic loops

НЕ РАБОТАЕТ ✕

image content (картинки)
document content (PDF)
search_result
server_tool_use (web_search)
server-side MCP
container_upload

90% workflow · узкое горло достаточно

DWG №08 / SCHEMA / ANTHROPIC-COMPAT LIMITS

Эти ограничения — на уровне протокола Anthropic-compat, не на уровне моделей. Если нужны эти возможности — отдельный второй endpoint к настоящему Claude через прокси, или альтернатива (например, qwen3-vl-plus напрямую через DashScope для vision, не через Anthropic-compat).

Базовый конфиг в ~/.claude/settings.json:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "your-zai-key",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "API_TIMEOUT_MS": "3000000"
  }
}

API_TIMEOUT_MS=3000000 (50 минут) — рекомендация из документации Z.AI. Длинные agentic-сессии с многошаговыми правками кода реально доходят до 30-40 минут одного запроса; стандартный таймаут Claude Code обрывает их посередине.

Для DeepSeek с активацией 1M контекста — суффикс [1m] обязателен:

"ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro[1m]"

Без него по умолчанию контекст 200K.

Готовые конфиги для всех 5 провайдеров — в Блоке 5.

Coding Plan'ы и pay-per-use

Coding Plan vs pay-per-use: подписка vs тариф за токены — DWG №14 / TABLE №2 / TARIFFS

Z.AI запустил подписочную модель — альтернатива Claude Pro. Цены и лимиты (источник docs.z.ai/devpack/overview, май 2026):

Тариф	Цена/мес от	Промптов/5ч	Промптов/нед	MCP/мес
Claude Pro (для сравнения)	$20	~45	—	—
GLM Coding Lite	$18	~80	~400	100
GLM Coding Pro	(точные на сайте)	~400	~2,000	1,000
GLM Coding Max	(точные на сайте)	~1,600	~8,000	4,000

Точные цены Pro/Max — на странице z.ai/subscribe (рендерится клиентским JS, проверяй в браузере). По документации Lite ≈ 3× Claude Pro, Pro ≈ 5× Lite, Max ≈ 4× Pro. Один промпт у Z.AI — это не «одно сообщение», а полная multi-step сессия с 15-20 внутренними вызовами.

Множители для GLM-5.1 / GLM-5-Turbo: ×3 в пик (14:00-18:00 UTC+8), ×2 вне пика. До конца июня 2026 — ×1 вне пика как промо.

Плоскость моделей: цена output vs длина контекста — DWG №15 / MAP / PRICE × CONTEXT

Оплата за использование дешевле даже Lite-подписки, если работа неравномерная. DeepSeek V4 Pro со скидкой 75% — $0.435 / $0.87 за 1M токенов (до 31.05.2026), после удвоится до $0.87 / $1.74. Kimi K2.6 — $0.95 / $4.00. GLM-4.7 — $0.60 / $2.20. Qwen3-Coder-flash — $0.30 / $1.50. Все варианты в разы дешевле Claude Sonnet ($3 / $15) и Opus ($15 / $75).

Оплата за использование — для тех, у кого нагрузка неровная (есть недели интенсивной работы и недели пауз). Подписка — для тех, кто пишет код каждый день и упирается в лимиты Claude Pro.

DeepSeek reality check (наш собственный замер 09.05.2026)

DeepSeek V4 Pro часто называют «новый Claude для кодинга». На бенчмарках производителя — сильные цифры (SWE-Bench Verified 78-80%, MMLU-Pro 87.5%, контекст 1M). На реальных production-задачах — нюансы.

48-парный бенчмарк: F1 vs latency для 7 моделей, 09.05.2026 — DWG №09 / BENCH №1 / 48 PAIRS · 09.05.2026 · ANON

Свежий 48-парный замер на задаче «связан ли коммит с открытым багом» (один из моих проектов, 9 мая 2026). F1 — итоговая мера точности, от 0 до 1, чем выше — тем лучше. Задержка — время до ответа модели.

Конфигурация	F1	Latency	Замечание
MiMo V2.5 Pro no-thinking (через OpenRouter)	0.86	2.5с	победитель по балансу
DeepSeek V4 Pro thinking max=400	0.90	11с	лидер только при малом бюджете рассуждений
GLM 5.1 baseline (через Z.AI direct)	0.83	3.1с	стабильный, был в боевой работе
Nemotron 3 Super 120B free (OpenRouter)	0.78	9.7с	бесплатно через бесплатный уровень
Gemini 3.1 Pro Preview (OpenRouter)	0.80	4с	принудительные рассуждения, защищает от ложных срабатываний
DeepSeek V4 Pro no-thinking	0.73	4.9с	проиграл бесплатному Nemotron
DeepSeek V4 Pro thinking-4k	0.78	13.9с	избыточное рассуждение, полнота упала с 0.82 до 0.67

Парадокс overthinking: длиннее не значит точнее — DWG №10 / EFFECT / OVERTHINKING

Что это значит:

DeepSeek хорош только в одной конфигурации — режим рассуждений включён, но с небольшим бюджетом токенов. При увеличении бюджета рассуждений модель «расшатывается»: дольше думает, но полнота ответа падает. Этот эффект называют «избыточным рассуждением» (overthinking).
Без режима рассуждений DeepSeek проигрывает даже бесплатному Nemotron 3 Super 120B (доступен бесплатно через OpenRouter).
В стандартном использовании модель или думает по умолчанию, или не думает вовсе — и в обоих случаях уступает альтернативам.

DeepSeek V4 reality check: цитаты из community 04-05.2026 — DWG №16 / FIELD-NOTES / DEEPSEEK 04-05.2026

Что говорит сообщество в 2026 году (Reddit r/SillyTavernAI, r/ClaudeAI, r/LocalLLaMA, vc.ru, Habr — апрель-май):

AA-Omniscience (тест на галлюцинации): 94-96% процент выдуманных ответов у DeepSeek V4
Habr статья 1033208: кибербезопасность 32% против 71% у GPT-5.5, разработку с агентами 44% против 78%
LMSYS Chatbot Arena, май 2026: рейтинг Elo ~800 у DeepSeek V4 против ~999 у Claude Opus (Elo — система рейтингов, как в шахматах; выше — лучше)
Жалобы практиков: «потратил $50 на V4 Pro — ЛЕНИВЫЙ, склонен ко ЛЖИ» (X @entrepeneur4lyf, май 2026), «хуже, чем GLM 4.6 или Kimi K2», «4 из 5 ответов пропускают элементы инструкции», «иногда переходит на китайский в середине ответа»
Цензура облачной версии: ~85% отказов на 1156 китайских политических вопросах

Где DeepSeek реально хорош: дешёвая шаблонная генерация кода, написание тестов, рефакторинг по чёткому плану, работа с большим контекстом (1M токенов). Где плох: автономная работа агента с длинной цепочкой решений, следование сложным инструкциям, творческие задачи с нюансами.

Вывод

DeepSeek — хороший дешёвый второй слой в команде моделей, но не основной выбор для замены Claude Sonnet. Основной — GLM-4.7 через Z.AI Coding Plan. По community-консенсусу 2026 GLM ближе всех к Claude по реальному опыту работы.

Multi-model где реально нужен

MULTI-MODEL КАК СТАЯ ОХОТНИКОВ

Диспетчер смотрит на тип входа и выбирает таксу.

text → GLM

1M ctx → DEEPSEEK

PDF · vision → CLAUDE

★ основная

GLM-4.7

via Z.AI · 90% задач

text · tool use · file edit. Основная замена Sonnet.

long context

DeepSeek V4 Pro

api.deepseek.com · 1M ctx

для логов и дампов. Дёшево, но избыточные рассуждения при большом бюджете thinking.

vision · MCP

Claude Sonnet

через прокси / VPN

PDF · картинки · server-side MCP. Когда нужно «всё».

Разные задачи — разные таксы. Но не каждый день всех.

DWG №11 / PACK №1 / MULTI-MODEL

Изначально казалось, что нужен сложный роутинг из 5-6 моделей. На практике для большинства разработчиков GLM закрывает 90% задач, а multi-model — узкие случаи.

Где НЕ нужен

генерация кода, рефакторинг, дебаг, написание тестов
правка нескольких файлов, проектирование архитектуры
автономная работа агента с использованием инструментов
чтение и поиск по коду проекта

Где нужен второй адрес API

Анализ изображений и PDF. Anthropic-совместимый режим не поддерживает картинки и документы. Решения: запрос напрямую к qwen3-vl-plus через DashScope (не через Anthropic-совместимый режим), или Claude Sonnet через прокси, или Yandex AI Studio с собственными vision-моделями.
Поиск в интернете. Anthropic-совместимый режим не поддерживает встроенный веб-поиск. Решения: отдельный запрос к Perplexity (доступна из РФ напрямую) или к Grok через прокси.
Серверный MCP. Это новая возможность Anthropic API — сам API делает MCP-вызов и возвращает результат. У альтернативных провайдеров не работает. Локальные MCP-серверы (которые добавляются через claude mcp add) — работают, потому что сам Claude Code их обрабатывает, а к API провайдера уходят обычные вызовы инструментов.
Длинный контекст более 200K. GLM-4.7 — 200K, GLM-5.1 — 200K. Если нужно больше — DeepSeek V4 (1M), Kimi K2.6 (262K). Здесь DeepSeek V4 Flash в режиме оплаты за использование — лучший выбор.

Реальный рабочий рецепт

Основной рабочий процесс: подписка GLM Coding Pro (через Claude Code)
Длинный контекст: API-ключ DeepSeek V4 Flash (оплата за использование)
Изображения и серверный MCP: Claude Sonnet через прокси, если есть рабочий канал; либо нативные API китайских провайдеров

Это схема «2-3 модели», разделённых по типу задачи, а не динамическая маршрутизация. Переключать профиль вручную через bash-функции в ~/.bashrc — пять секунд работы.

Российская инфраструктура — Cloud.ru и Yandex AI Studio

бухгалтер не плачет

CLOUD.RU · EVOLUTION AI FACTORY

РФ-питомник · открытые вольеры · рубли · акт + сф

Вольер · 01

GigaChat-2-Max

569 ₽ / 1M tokens

русский фокус

Акт + СФ

Вольер · 02

Qwen3-Max

35–67 ₽ in · ~268 ₽ out

китайский флагман

Акт + СФ

Вольер · 03 ★

GLM-4.7

PREVIEW · FREE

тот же мотор, что Z.AI

Акт + СФ

Вольер · 04

T-Pro 32B

5–15 in · 12–40 out ₽

от Т-Технологий

Акт + СФ

Вольер · 05

gpt-oss-120b

9–25 in · 18–55 out ₽

открытые веса, MoE (смесь экспертов)

Акт + СФ

Вольер · 06

Embeddings

~ ₽ / 1M tokens

для RAG и поиска

Акт + СФ

Вольер · 07

Whisper

по часам

распознавание речи

Акт + СФ

КУПИТЬ ЗА РУБЛИ → СБИС → АКТ + СФ

DWG №12 / RACK №2 / РФ-ПИТОМНИК

Главная находка для русскоязычной аудитории — Cloud.ru Evolution AI Factory. Это самый богатый каталог моделей в РФ-юрисдикции, доступный за рубли с актами и счёт-фактурами.

Cloud.ru Evolution AI Factory

cloud.ru/products/evolution-ai-factory/catalog-foundation-models. На май 2026 в каталоге:

GigaChat-2 (Lite, Pro, Max) от Сбера
Qwen3 всех размеров (от 1.5B до 235B)
GLM-4.6, GLM-4.7 — в free preview
T-Pro-it-2.0 (32B), T-Lite-it-1.0 (7B)
gpt-oss-120b (открытые веса OpenAI)
Vikhr, embeddings модели, Whisper

Цены за 1M токенов: от 0 ₽ (preview-режимы) до 569 ₽ (GigaChat-2-Max). Большинство Qwen, GLM, T-Lite — 1.76-67 ₽ input, 3.5-268 ₽ output. Это в разы дешевле прямой китайской оплаты с учётом всех комиссий за конвертацию USD/CNY.

Документооборот: договор оферты, ежемесячные акты, счета-фактуры. Интеграция с СБИС/Диадок. Цены указаны с НДС.

AISTUDIO.YANDEX.RU · РУБЛИ · АКТЫ · СФ

№1DeepSeek V3.2
№2Qwen3-235B-A22B
№3Gemma3-27B / Llama-3.3-70B
№4gpt-oss 120B / 20B
№5phi-4 14B

Везёт чужих пород по яндексовым путям

DWG №13 / SCHEMA / YANDEX MARKETPLACE

Yandex AI Studio

aistudio.yandex.ru. Каталог Foundation Models включает:

YandexGPT Pro 5.1, Lite 5, Alice AI LLM — собственные модели
DeepSeek V3.2, Qwen3-235B-A22B, Gemma3-27B-It, Llama-3.3-70B-Instruct, gpt-oss варианты, phi-4 — открытые веса от мировых лабораторий

Цены за 1K токенов: Alice AI LLM ~0.35 ₽ in / 0.83 ₽ out, YandexGPT Pro 5.1 ~0.56 ₽, DeepSeek и Qwen 0.14-0.35 ₽, Gemma3 от 0.07 ₽. Платежи: СБП, корп карты, лицевой счёт юрлица. Полный комплект документов для бухгалтерии.

GigaChat

developers.sber.ru. Только свои модели. Физлицам бесплатно 1M токенов в год по СберID. Юрлицам с февраля 2026 оплата по факту использования: Lite 0.065 ₽ / Pro 0.5 ₽ / Max 0.65 ₽ за 1K токенов. Для русскоязычных задач (юридический контекст, локальные реалии) — лидер теста MERA среди российских моделей.

Selectel, VK Cloud, Cloud4Y, Beeline Cloud, RuVDS

Не готовый API, а аренда GPU для самостоятельного развертывания модели. От 22 тыс. руб/мес за 4090 и от 100 тыс. руб/мес за A100. Подходит для запуска vLLM или TGI с открытыми весами (T-Pro, Vikhr, Llama, Qwen).

MTS AI / MWS AI Cotype

Cotype Light 3 (9B мультимодальная), Cotype Pro 2.5, Cotype Nano (открытый код). В основном корпоративное развертывание на серверах клиента с лицензированием от 6.4 млн руб. Nano — бесплатно, можно развернуть самостоятельно.

T-Bank T-Tech

T-Pro-it-2.0 (32B) и T-Lite-it-2.1 (7-8B). Open-weights Apache 2.0 на huggingface.co/t-tech. Сильны в русском, reasoning через <think>, tool-calling. Своего cloud API нет — берётся через Cloud.ru или self-host.

Не-китайцы и не-запад

Кроме крупных US/EU/CN игроков и российской инфраструктуры есть несколько провайдеров, но большинство либо закрыты для РФ, либо доступны только через open-weights.

Доступно из РФ

Falcon (TII, ОАЭ). Open-weights Falcon-H1 (3B-34B), Falcon 3, Mamba-варианты. Бесплатно скачать, hosted доступ через Core42 / Azure / AWS — но AWS/Azure для РФ закрыты, остаётся скачать веса и развернуть на Selectel/Cloud.ru.
Sarvam AI (Индия). Sarvam 105B / 30B open-weights, API ~₹2.5-4 input / ₹10-16 output за 1M. Хорош для индийских языков, для русского — не специализирован.
Upstage Solar (Корея). Solar Pro $0.15 input / $0.60 output за 1M. Многоязычный, корейский фокус. Доступен из РФ.
Naver HyperCLOVA X (Корея). Через Naver Cloud, enterprise-pricing. SEED модели open-source.

Закрыто для РФ

Mistral AI (Франция). После 20-го пакета ЕС — geo-block для РФ, оплата картами не проходит. Open-weights версии остаются на Hugging Face.
Cohere (Канада). Россия в Restricted Locations официально — доступ заблокирован.
Together AI, Fireworks AI, DeepInfra, Groq Cloud, Cerebras, HuggingFace Inference Endpoints. Все хостинг-провайдеры с условиями использования, запрещающими обслуживание РФ. Аккаунты блокируются при обнаружении.
Aleph Alpha (Германия), Silo AI (Финляндия), Stability AI. Ограниченное состояние, преимущественно enterprise.

Вывод: для РФ-разработчика реалистичные альтернативы вне китайских и российских — это в основном open-weights через self-host на российских GPU. Управляемых API-сервисов из этой зоны почти нет.

B05

ГОТОВЫЕ КОНФИГИ И ПОШАГОВЫЕ ИНСТРУКЦИИ SHEET 003 · B05 / 05

Регистрация в DeepSeek (бесплатно, без VPN)

Открыть chat.deepseek.com из любого браузера. Сайт работает напрямую из России без VPN.
Кнопка «Sign Up». Ввести email, придумать пароль. Альтернатива — вход через Google ID одной кнопкой.
Подтверждение email — ссылка приходит в течение минуты. Проверьте спам если не пришло.
После входа сразу 5 миллионов токенов на старте + ежедневное пополнение бесплатного лимита.
В мобильном — приложение DeepSeek в App Store / Google Play, тот же логин.

Интерфейс на английском, но модель отвечает на русском без проблем. История чатов хранится на серверах.

Регистрация в GigaChat (бесплатно физлицам)

Зайти на gigachat.ru. Кнопка «Подключить».
Вход через СберID. Если у вас есть Сбер-аккаунт — это одно нажатие. Нет — нужно создать СберID (бесплатно, по паспорту через мобильное приложение Сбер).
Принять условия использования сервиса.
Готово. Сразу доступен чат через веб-интерфейс. Бесплатно один миллион токенов в год.
Мобильное приложение «GigaChat» в App Store / Google Play, тот же СберID.

Для подписки Pro (~100-300 ₽/мес) — в личном кабинете GigaChat выбрать тариф, оплата через СБП. Pro даёт более крупные лимиты и приоритетный доступ в часы пик.

Регистрация Alipay для оплаты китайских Pro-подписок

Если бесплатных лимитов мало и нужна Pro-подписка у DeepSeek, Kimi или Qwen — Alipay остаётся самым стабильным методом из России.

Скачать Alipay

App Store / Google Play. Зарегистрироваться по российскому номеру (+7).

Верификация загранпаспортом

В разделе «My Profile» → «Identity Verification» выбрать «Foreign Passport». Загрузить фото загранпаспорта и selfie. NFC-проверка через приложение, занимает 2-5 минут.

Пополнить кошелёк

Через P2P-биржу Bybit или Binance (P2P — прямой обмен криптовалюты между людьми): купить USDT (криптовалюта) по сети TRC-20 за рубли через СБП, перевести на свой Alipay через сервис конвертации USDT → CNY (юани). Комиссия 1-3% плюс рыночный спред.

Привязать к платформам

В консоли DeepSeek / Z.AI / Moonshot выбрать пополнение через Alipay. Сканировать QR-код в приложении Alipay, подтвердить.

Авто-пополнение

Большинство платформ поддерживают регулярные платежи через Alipay. Настроить лимит и максимальный размер автоплатежа.

Время на полную настройку — 1-2 часа. Один раз — потом просто работает.

Как подготовить свои заметки к новой ИИ

Если вы годами копили промпты, чат-истории и инструкции в Claude или ChatGPT — переезд требует организации. Без неё вы потеряете половину наработок в первую неделю.

Экспорт и инвентаризация

Сохраните важные чаты в Markdown или HTML. Claude и ChatGPT дают экспорт в настройках аккаунта. Создайте три папки: prompty/ (шаблоны запросов), otvety/ (удачные ответы для референса), instrukcii/ (пошаговые процедуры).

Тестирование на новой модели

Не переписывайте все промпты сразу. Возьмите 5-10 самых частых задач и прогоните через DeepSeek, Kimi или Qwen. Зафиксируйте разницу в ответах — где новая модель лучше, где хуже, где нужен другой промпт.

Фиксация правил в одном файле

Создайте текстовый файл MOI-AI-PRAVILA.md в корне ваших заметок. 10-15 правил: какая модель для какой задачи, стандартный формат промпта, запрещённые приёмы (например, «не проси считать точные цифры в CSV»). Это ваш личный AGENTS.md — он сэкономит часы на подборе модели под задачу.

Правило одного файла

Не распыляйте правила по десятку заметок. Один файл в корне — единственное место, куда вы заглянете через месяц, когда забудете, почему выбрали именно эту модель.

Регистрация на Cloud.ru как юрлицо

Регистрация по реквизитам

На сайте cloud.ru — кнопка «Создать аккаунт», выбор «Юридическое лицо». Заполняете ОГРН, ИНН, КПП, юридический и фактический адрес. Договор оферты подписывается прямо в личном кабинете.

Привязка платёжного метода

Корпоративная карта или счёт юрлица. Цены на сайте указаны с НДС. Минимальный депозит не требуется.

Активация Evolution AI Factory

В меню сервисов — «Foundation Models». Принимаете дополнительные условия по конкретному каталогу моделей.

Получение API-ключа

Раздел «Сервисные аккаунты» — создаёте сервисный аккаунт, выпускаете постоянный ключ доступа для базовых моделей. Передаёте разработчику.

Настройка документооборота

В разделе «Биллинг» — формат закрытия документов: ежемесячный акт + счёт-фактура, отправка на email бухгалтера или интеграция с СБИС/Диадок.

Интеграция в свою инфраструктуру

API OpenAI-compatible. Разработчик получает base_url и model name, интегрирует стандартным способом.

Документация: cloud.ru/documents/tariffs/evolution/foundation-models, cloud.ru/products/evolution-ai-factory.

Регистрация в Yandex AI Studio

Личный кабинет Yandex Cloud. Заходите на yandex.cloud. Создаёте организацию или входите от имени юрлица.
Активация AI Studio. В консоли — раздел «AI Studio» → «Foundation Models». Принимаете условия использования.
Создание сервисного аккаунта. В разделе управления доступом (IAM) создаёте сервисный аккаунт с ролью ai.foundationModels.user.
API-ключ или токен доступа. Получаете постоянный API-ключ или краткосрочный токен. Для рабочей среды обычно ключ.
Билинг. Подключаете платёжный аккаунт юрлица, выбираете формат документов.

Каталог моделей: aistudio.yandex.ru. Цены: aistudio.yandex.ru/docs/en/ai-studio/pricing.

Шаблон письма команде

Если нужно объявить миграцию команде официально:

Тема: Миграция на новых AI-провайдеров

Коллеги,

В связи с массовыми блокировками российских пользователей у Anthropic
(8 мая 2026, тысячи аккаунтов) и продолжающимся ужесточением политики
Anthropic / OpenAI / Google в отношении российских пользователей
переводим команду на альтернативных провайдеров.

Что делаем
1. Основной workflow Claude Code переключаем на Z.AI / GLM-4.7. Каждый
   разработчик меняет одну переменную в ~/.claude/settings.json.
   Инструкция и ключ — у [технический лид].
2. Параллельно открываем юрлицу аккаунт на Cloud.ru Evolution AI Factory
   для российских моделей и корпоративных платежей в рублях.
   Ответственный, [бухгалтер].
3. Старые ключи Anthropic / OpenAI деактивируем после переезда
   (планируется через 2 недели).

Что не меняется
- Инструменты те же. Claude Code, Cursor, IDE-плагины, привычный рабочий процесс.
- Качество близкое к Sonnet. По нашему пилоту, 90% задач закрываются
  без потерь.

Что меняется
- Платёжная дисциплина: больше нет личных карт под подписки, всё через
  Cloud.ru рублями с актами.
- Цена: ниже текущей.
- Стабильность: больше не зависим от правил Anthropic.

Срок миграции, две недели. Вопросы, в Slack #ai-migration.

Как подготовить команду к переходу на другую ИИ

Для бизнеса потеря доступа к Claude или GPT — не только техническая проблема, но и риск для процессов. Если маркетинг, поддержка или аналитика завязаны на западные модели, переезд требует планирования.

Инвентаризация использования

Проведите опрос: кто из сотрудников использует ИИ, для каких задач, какие модели, какие промпты. Результат — таблица: «Задача → Текущая модель → Альтернатива → Риск качества».

Пилот на некритичных задачах

Не переводите всё сразу. Выберите 2-3 задачи с низким риском (генерация черновиков, суммирование документов) и прогоните через GigaChat, DeepSeek или Cloud.ru. Оцените качество и затраты.

Документация и правила

Создайте внутренний документ с тремя блоками: Read order (что читать сотруднику при старте), Project invariants (что нельзя делать — например, не загружать персональные данные клиентов в китайские чаты), Verification gate (как проверить результат перед отправкой клиенту).

Параллельная работа и rollback

На первых двух неделях держите оба канала — западный и альтернативный. Сравнивайте результаты. Если альтернатива не тянет — откат мгновенный, бизнес не пострадает.

Готовые конфиги settings.json

Скопируй нужный, поставь свой ключ, перезапусти терминал — работает.

Z.AI / GLM (рекомендуется для основного workflow)

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "your-zai-key",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "API_TIMEOUT_MS": "3000000"
  }
}

DeepSeek

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
    "ANTHROPIC_API_KEY": "your-deepseek-key",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro[1m]",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash"
  }
}

Суффикс [1m] у deepseek-v4-pro обязателен для активации полного контекста 1M токенов. Без него по умолчанию 200K.

Kimi / Moonshot

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.moonshot.ai/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "your-moonshot-key",
    "ANTHROPIC_MODEL": "kimi-k2.6",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "kimi-k2.6",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "kimi-k2.6",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "kimi-k2.5"
  }
}

Alibaba / Qwen (DashScope International)

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://dashscope-intl.aliyuncs.com/apps/anthropic",
    "ANTHROPIC_API_KEY": "your-dashscope-key",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "qwen3-coder-plus",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "qwen3-coder-flash"
  }
}

MiniMax

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.minimaxi.com/anthropic",
    "ANTHROPIC_API_KEY": "your-minimax-key",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "MiniMax-M2.7"
  }
}

После изменения settings.json — закрыть терминал, открыть новый, проверить через claude в директории проекта.

Скрипт быстрого переключения провайдеров

Если хочется на лету менять провайдер без редактирования settings.json — bash-функции в ~/.bashrc или ~/.zshrc:

function ai-zai() {
  export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
  export ANTHROPIC_AUTH_TOKEN="$ZAI_KEY"
  export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.1"
  echo "→ Z.AI / GLM-4.7"
}

function ai-ds() {
  export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
  export ANTHROPIC_API_KEY="$DEEPSEEK_KEY"
  export ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
  echo "→ DeepSeek V4 Pro 1M"
}

function ai-kimi() {
  export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
  export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_KEY"
  export ANTHROPIC_DEFAULT_SONNET_MODEL="kimi-k2.6"
  echo "→ Kimi K2.6"
}

function ai-anthropic() {
  unset ANTHROPIC_BASE_URL
  export ANTHROPIC_API_KEY="$ANTHROPIC_KEY"
  echo "→ Anthropic (origin)"
}

Ключи хранить в .zshenv или системном keychain, не в .bashrc. Использование: ai-zai && claude, или ai-ds && claude — для разных сессий разные провайдеры.

Промпты для копипаста в Claude Code

Когда нужно быстро попросить агента помочь с миграцией.

УСТАНОВИТЬ И НАСТРОИТЬ Z.AI КАК BACKEND

Помоги настроить Claude Code на работу через Z.AI вместо Anthropic.

1. Прочитай мой ~/.claude/settings.json и сохрани текущую конфигурацию в backup.
2. Перепиши settings.json с Anthropic-compatible эндпоинтом Z.AI:
   - ANTHROPIC_BASE_URL = https://api.z.ai/api/anthropic
   - ANTHROPIC_AUTH_TOKEN = (попроси меня вставить ключ)
   - default models: glm-4.7 для Sonnet и Opus, glm-4.5-air для Haiku
   - API_TIMEOUT_MS = 3000000
3. Скажи мне закрыть и открыть терминал.
4. Прогон тестовый: попроси меня запустить claude в любой директории и описать результат.

СРАВНИТЬ ПРОИЗВОДИТЕЛЬНОСТЬ DEEPSEEK И GLM НА КОНКРЕТНОЙ ЗАДАЧЕ

Я хочу сравнить, какая модель лучше под мою задачу: GLM-4.7 через Z.AI
или DeepSeek V4 Pro через api.deepseek.com.

1. Возьми три типичных моих задачи (выбери три файла из текущего проекта).
2. Для каждой задачи сформулируй короткий промпт длиной 30-50 слов.
3. Через два разных ANTHROPIC_BASE_URL прогони один и тот же промпт.
4. Сохрани результаты, latency и приблизительную стоимость в файл results.md.
5. Дай таблицу сравнения и свой вердикт: что я должен использовать как default.

ПЕРЕВЕСТИ ПРОЕКТ НА OPEN-WEIGHTS С SELF-HOST

У меня есть продакшн-проект, который сейчас зависит от Anthropic API.
Хочу понять, что нужно, чтобы переехать на T-Pro 32B на собственном GPU
(аренда у Selectel или Cloud.ru, около 50k руб/мес за GPU 4090 / A100).

1. Прочитай мой код и найди все вызовы к Claude API.
2. Сделай оценку, какие задачи реально требуют Sonnet, а какие, можно ли обойтись T-Pro.
3. Опиши план миграции с тремя этапами: dev-окружение, staging, prod.
4. Оцени потери в качестве по каждой задаче, где будет заметная разница.
5. Дай итоговый список изменений в коде.

Ссылки на официальные доки

Подключение Anthropic-compat endpoints

Z.AI Claude Code: docs.z.ai/scenario-example/develop-tools/claude
Z.AI Coding Plan overview: docs.z.ai/devpack/overview
DeepSeek Anthropic API: api-docs.deepseek.com/guides/anthropic_api
DeepSeek Claude Code integration: api-docs.deepseek.com/quick_start/agent_integrations/claude_code
Kimi agent support: platform.kimi.ai/docs/guide/agent-support
Alibaba Anthropic API: alibabacloud.com/help/en/model-studio/anthropic-api-messages
Alibaba Claude Code: alibabacloud.com/help/en/model-studio/claude-code
MiniMax Anthropic API: platform.minimaxi.com/docs/api-reference/text-anthropic-api

Цены и тарифы

Z.AI pricing: docs.z.ai/guides/overview/pricing
Z.AI Coding Plan subscription: z.ai/subscribe
DeepSeek pricing: api-docs.deepseek.com/quick_start/pricing
Kimi K2.6 pricing: platform.kimi.ai/docs/pricing/chat-k26
Alibaba pricing: alibabacloud.com/help/en/model-studio/billing-for-model-studio
MiniMax pricing: platform.minimaxi.com/docs/guides/pricing-paygo

Российская инфраструктура

Cloud.ru Foundation Models: cloud.ru/products/evolution-ai-factory/catalog-foundation-models
Cloud.ru pricing: cloud.ru/documents/tariffs/evolution/foundation-models
Yandex AI Studio: aistudio.yandex.ru/docs/en/ai-studio/
Yandex AI Studio models: aistudio.yandex.ru/docs/en/ai-studio/concepts/generation/models
Yandex pricing: aistudio.yandex.ru/docs/en/ai-studio/pricing
GigaChat docs: developers.sber.ru/docs/ru/gigachat/api/overview
GigaChat tariffs: developers.sber.ru/docs/ru/gigachat/tariffs/

Open-weights

T-Pro и T-Lite: huggingface.co/t-tech
Vikhr models: huggingface.co/Vikhrmodels
Falcon (TII): huggingface.co/tiiuae

Как технически подготовить проект к работе с другой ИИ

Если ваш проект завязан на Claude API, Claude Code или GPT — переезд требует не только смены ключа, но и подготовки инфраструктуры. Опыт миграций показывает: проекты с документацией и автоматическими проверками переезжают за дни, без них — за недели с инцидентами.

Три уровня подготовки

Уровень	Что делать	Время	Результат
Базовый	Создать AGENTS.md с правилами проекта: стек, деплой, запреты	2-3 ч	Любой новый агент читает один файл перед правкой
Средний	Добавить skills — структурированные знания по темам	1-2 дня	Агенты не нарушают production-инварианты
Продвинутый	Git pre-commit hook, verification gate, multi-agent etiquette	3-4 дня	Несколько агентов работают параллельно без конфликтов

Что писать в AGENTS.md

Это главный файл проекта для автономных агентов — инструкция «читай это первым». Формат — обычный Markdown-текст. Обязательные блоки:

Назначение проекта — что это за проект, 2-3 предложения
Стек технологий — языки, фреймворки, базы данных
Ключевые соглашения — стиль кода, именование, критические паттерны
Процесс деплоя — как деплоить, где прод, что трогать нельзя
Порядок чтения — какие файлы читать при старте работы
Ключевые запреты — нарушение = инцидент (например, «не деплоить без PR»)

Скиллы — структурированные знания агента

Скиллы (skills) заменяют разрозненные правила и память агента. Одна тема = один скилл. Примеры для типового проекта:

<project>-deploy-invariants — как деплоить, что нельзя, процедура отката
<project>-content-guard — правила контента (если проект контент-тяжёлый)
<project>-autonomous-patterns — критерии остановки для автономной работы
<project>-handoff-check — чеклист перед стартом сессии: ветка, чужие планы, незакоммиченные изменения

Антипаттерн: один огромный скилл

Не складывайте всё в один скилл. Если он больше 150 строк — разбейте по темам. Иначе агент не найдёт нужное в потоке текста.

Защита веток — обязательно для автономных агентов

Создайте в проекте .githooks/pre-commit — простой скрипт, который блокирует коммит прямо в main или develop. Активируйте командой: git config core.hooksPath .githooks. Это ловит всех — Claude, Kimi, Codex, человека. Обход только через git commit --no-verify с явного разрешения владельца.

Контрольная проверка — что проверить перед словом «готово»

Любой агент перед заявлением «готово» должен прогнать команды проекта:

npm run build        # exit 0
npm run test         # exit 0
# или для Python:
pytest               # exit 0

Без подтверждённого результата заявление «готово» запрещено. Для бага — сначала найти причину, потом исправить. Три неудачных попытки = архитектурная проблема, остановиться и спросить человека.

Правила для нескольких агентов

Если на проекте работает несколько агентов параллельно:

Ветки: <agent>/<scope>-<slug> — claude/plan-auth, kimi/fix-css, codex/migrate-db
Планы: общий каталог .claude/memory/plans/<slug>.md с полями Owner, Status, Branch
Проверка перед стартом: git status, список активных планов, проверка чужих веток
Коммит: автономный агент не коммитит без явного запроса

FIN

ФИНАЛ SHEET 003 · FIN

Новый дом найден: GLM, Cloud.ru, T-Pro под навесом AI-PETSHOP MAY 2026 — DWG №14 / СВОД / СЕРИЯ 003 / ВЫПУСК ПОДПИСАН

Карта мира AI перерисовалась — но это не разрушение, это переход. На новой карте у российского пользователя достаточно живых путей. Если вы пользователь чата — бесплатные DeepSeek, Kimi, Qwen, GigaChat, Алиса работают прямо из браузера, без VPN, без сложной настройки. Если вы бизнес — Cloud.ru Evolution AI Factory даёт двадцать с лишним моделей в рублях с актами. Если вы разработчик — одна строчка ANTHROPIC_BASE_URL в settings.json и Claude Code дальше работает на GLM или DeepSeek.

Ни один из этих путей не покрывает 100% возможностей оригинального Claude или GPT, но в комбинации они закрывают 95-98% реальных задач. И в большинстве случаев — за в три-десять раз меньшие деньги, чем фронтир-модели Запада.

AUTHOR SERIES 003

ВЫПУСК ОПУБЛИКОВАН 2026-05-09 / RU

FOLDER №03 SHEET 003 / 05

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.