ВЫБЕРИ, КАК ЧИТАТЬ
Этот выпуск идёт в трёх версиях. Выбери одну — выбор сохранится при возврате, переключиться можно в любой момент сверху страницы. Можно читать несколько режимов, если решение принимать вместе с командой.
КАРТА АЛЬТЕРНАТИВ · 8 МАЯ 2026 · МАССОВЫЙ БАН ANTHROPIC · ЧТО ДЕЛАТЬ
OUTPUT ВЫПУСК №003
КУДА ПЕРЕХОДИТЬ С CLAUDE И GPT
Карта альтернатив для российских пользователей на май 2026. 8 мая Anthropic закрыл тысячи аккаунтов за одну ночь. Это не последняя волна. В этом выпуске — конкретные пути для пользователя, бизнеса и разработчика.
Метафора «питомник такс»: каждая модель — порода. Claude, GPT, Gemini — западные питомники, не продают РФ. В Китае и России — свои открытые питомники с породистыми такcами того же класса. Open-weights — «дворовые с родословной».
Если у вас Claude Pro или ChatGPT Plus
Ситуация серьёзная, но не катастрофа. На рынке есть три полностью рабочих сценария — все три работают сегодня, без VPN или с минимальной настройкой.
Бесплатные чаты в браузере, прямо из России без VPN
chat.deepseek.com работает напрямую — регистрация
по email, сразу пять миллионов токенов на старт. По качеству DeepSeek
в чате близок к ChatGPT. kimi.ai — длинный контекст
и хорошая работа с PDF. chat.qwen.ai — Alibaba, нужна
регистрация, на русском работает хорошо.
Русские сервисы за рубли с СберID или Yandex ID
gigachat.ru — Сбер, бесплатно физлицам один миллион
токенов в год по СберID. Pro — около 100-300 ₽ в месяц. Алиса AI
(ya.ru/ai) — Яндекс, входит в подписку Yandex Plus
за 199 ₽. Эти сервисы официально работают для российских
пользователей, без VPN, без проблем с оплатой.
Подписки Pro у китайских сервисов через Alipay
Если бесплатных лимитов не хватает и нужен полноценный Pro-режим, можно оформить подписку у DeepSeek, Kimi или Qwen через Alipay. Настройка занимает час: регистрация Alipay по российскому номеру с верификацией загранпаспортом, пополнение через P2P-биржу (USDT за рубли, конвертация в юани), привязка к платформе. После этого подписка работает как обычная — двадцать-сорок долларов в месяц.
Если вы платите за Claude Pro или ChatGPT Plus с российской карты или с IP, который мог быть классифицирован как российский — перейдите на резервный канал в ближайшие дни. Аккаунт могут отключить в любой следующей волне. Регистрация на DeepSeek или GigaChat — пять минут.
Что точно теряется
История ваших чатов на серверах Claude и OpenAI. Резервная копия не делается, экспорт нужно сделать заранее (если ещё есть доступ). У DeepSeek и Kimi есть импорт Markdown — старые ценные диалоги можно перенести вручную как контекст в новый чат.
Если у вас в команде работа на Claude или GPT
Ситуация серьёзная, но не катастрофа. На рынке есть две полностью рабочие альтернативы для российского бизнеса.
Переключить инструменты команды на китайский Anthropic-совместимый API
Технически — это меняется одной строкой в настройках Claude Code или другого AI-инструмента. Под капотом запросы идут не к Anthropic, а к китайскому провайдеру (Z.AI, DeepSeek, Kimi и подобные). Те же интерфейсы, те же файлы, тот же терминал — другой мотор. Подписка дешевле Claude Pro в 1.5-3 раза при бо́льших лимитах. По нашему опыту реального production-использования — закрывает примерно 90 процентов рабочих задач. Не закрывает: работа с картинками, поиск в интернете, специфичные расширения.
Перевести команду на российскую инфраструктуру
Главная находка для юрлица — Cloud.ru Evolution AI Factory. В каталоге сервиса больше двадцати моделей, среди которых лучшие китайские (Qwen3, GLM-4.7), российские (GigaChat-2-Max, T-Pro) и даже открытые веса OpenAI (gpt-oss-120b). Всё в рублях, со СБП-оплатой со счёта юрлица, ежемесячными актами и счетами-фактурами. Цены — от единиц до нескольких сотен рублей за миллион токенов. Бухгалтерия закрывается стандартно через СБИС или Диадок. Никакого валютного контроля, никаких посредников, никакого НДС-агента.
Что меняется в работе команды
На инструменте — почти ничего. Разработчики продолжают пользоваться Claude Code или Cursor, просто запросы летят к новому провайдеру. Привычки и процессы остаются. Что точно меняется — финансовая дисциплина: при переходе на российских провайдеров платежи в рублях с актами, при попытках платить иностранцам напрямую — НДС 22% с 2026 года и валютный контроль. Бухгалтерия скажет спасибо за переезд на Cloud.ru.
Срочность высокая для команд, у которых ключи Anthropic или OpenAI оплачивались с РФ-карты или с IP, который мог быть классифицирован как российский. Стандартный план миграции — пять-шесть часов работы одного разработчика на пилот, плюс одна-две недели на полный перевод команды. Календарь миграции — в Блоке 3.
Главное за минуту
Все пять основных китайских провайдеров (Z.AI/GLM, DeepSeek,
Kimi/Moonshot, Alibaba/Qwen, MiniMax) запустили официальные
Anthropic-compatible эндпоинты. Меняется одна переменная
в ~/.claude/settings.json:
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_AUTH_TOKEN": "ваш-zai-ключ"
}
}
Закрываешь терминал, открываешь новый, запускаешь claude —
Claude Code дальше работает на GLM-4.7 вместо Sonnet. Полная
совместимость по text content, tool use, file editing, agentic loops.
- image content (картинки) и document content (PDF)
- server_tool_use (server-side web_search, code_execution)
- server-side MCP через anthropic-beta header (типы
mcp_tool_use,mcp_tool_result) и полеmcp_serversв запросе - container_upload
- thinking.budget_tokens, top_k, cache_control — молча игнорируются
Локальные MCP работают. Серверы, которые вы добавляете
командой claude mcp add в свой Claude Code, общаются
с MCP-сервером на вашей машине, а в API провайдера летят как
обычные tool_use вызовы. Z.AI это явно поддерживает (документация
упоминает Vision MCP, Web Search MCP, Web Reader MCP), DeepSeek
и Kimi — то же самое. Не работает только то, что Anthropic
недавно добавил как server-side фичу: когда сам API делает
MCP-вызов вместо клиента. Этот канал у альтернативных провайдеров
отсутствует.
То есть это «Claude Code на 90-95%» — для большинства повседневной разработки и для типового MCP-стека (файловая система, git, search, vision) полностью достаточно. Не закрывает: работу с картинками в чате модели и server-side web_search через сам API.
Цены и подписки
GLM Coding Lite — от $18/мес, примерно 80 промптов за пятичасовое окно (в Claude Pro — около 45). Pay-per-use тоже дешевле:
- GLM-4.7 — $0.60 / $2.20 за 1M токенов (input/output)
- DeepSeek V4 Pro — $0.435 / $0.87 (со скидкой 75% до 31.05.2026)
- Claude Sonnet — $3 / $15
Выбор моделей по задаче — не про роутинг 5-6 моделей
По нашему 48-парному замеру на реальных задачах от 9 мая 2026 (сопоставление коммитов с багами) победитель — MiMo V2.5 Pro без рассуждений через OpenRouter (F1 0.86, задержка 2.5с). DeepSeek V4 Pro в режиме рассуждений даёт F1 0.90, но при задержке 11с и нестабильно: при увеличении бюджета рассуждений до 4000 полнота падает с 0.82 до 0.67 — избыточное рассуждение. Без рассуждений DeepSeek даёт F1 0.73 — проигрывает бесплатному Nemotron 3 Super 120B (0.78 через бесплатный уровень OpenRouter). GLM 5.1 baseline — F1 0.83 при задержке 3.1с, стабильно, в боевой работе. Полный разбор — Блок 4.5.
GLM-5.1 через Z.AI Coding Plan + Claude Code — самая близкая замена Sonnet для повседневной разработки. DeepSeek — дешёвый второй слой для шаблонной генерации/рутинных задач/тестов, не основная замена. Kimi — для длинного контекста и creative задач. Qwen3-Coder — для специфичных coding-кейсов. Multi-model осмыслен только когда нужны разные ниши, а не как «давайте на всякий случай 5 эндпоинтов».
Сколько это будет стоить
На бесплатном уровне — ноль. У всех трёх главных альтернатив в браузере есть щедрые бесплатные пакеты:
- chat.deepseek.com — 5 миллионов токенов на старт, потом возобновляемый дневной лимит
- kimi.ai — бесплатные сообщения с лимитом по объёму
- chat.qwen.ai — бесплатно после регистрации Alibaba
- gigachat.ru — 1 миллион токенов в год по СберID, ~1500-2000 длинных сообщений
- ya.ru/ai (Алиса) — бесплатно в стандартной версии
Если бесплатного хватает — на этом можно остановиться. Большинство людей не упирается в лимиты.
Если нужен Pro-режим:
| Сервис | Подписка | Цена/мес | Способ оплаты |
|---|---|---|---|
| Claude Pro (для сравнения) | базовый | $20 | заблокирован для РФ |
| ChatGPT Plus | базовый | $20 | заблокирован для РФ |
| GigaChat Pro | физлицо | ~100-300 ₽ | СБП через СберID |
| Yandex Plus + Алиса Pro | физлицо | 199 ₽ | СБП, корп карты |
| DeepSeek Pro | стандарт | ~$10 | Alipay или китайская UnionPay |
| Kimi+ | стандарт | ~$15-20 | Alipay |
| Qwen Premium | стандарт | ~$20 | Alipay через Alibaba |
Для русскоязычных задач GigaChat Pro и Алиса Pro — самый простой и дешёвый путь. Сто-двести рублей в месяц, никаких VPN, никаких иностранных платёжных систем, всё через привычный СберID или Yandex ID.
Что меняется в работе
На самом инструменте чата — почти ничего. Те же диалоги, те же возможности, тот же интерфейс на русском. Большинство китайских и русских сервисов поддерживают тот же набор фич: загрузка документов, работа с кодом, генерация изображений (через расширения), возможность скармливать модели большие тексты целиком (книги, длинные переписки) — то, что в технических обзорах называют «длинный контекст».
История чатов — отдельная тема. Ваши прошлые диалоги остаются на серверах Claude и OpenAI пока вас не забанили. Если есть доступ — экспортируйте важное в Markdown. У DeepSeek и Kimi есть импорт Markdown в новый чат: можно перенести цепочку как контекст «вот наша предыдущая переписка», и продолжить там.
Когда это срочно
- Срочно — если вы платите за Claude Pro или ChatGPT Plus, и эта подписка ещё не отвалилась. Открывайте экспорт чатов прямо сейчас, пока есть доступ. Параллельно регистрируетесь на gigachat.ru или chat.deepseek.com — 5 минут.
- Не срочно — если вы пользуетесь только бесплатным Claude.ai через VPN. У вас всё равно нет подписки и истории. Просто переходите на бесплатные альтернативы без VPN.
- Совсем не срочно — если вы уже на GigaChat / Алиса / DeepSeek / Kimi.
Сколько это будет стоить
На уровне отдельного разработчика: примерно столько же или меньше. Подписка Claude Pro — $20/мес с лимитом ~45 сообщений за 5 часов. GLM Coding Lite — $18 с лимитом ~80 промптов за то же окно. Один промпт в Z.AI считается как полная сессия с 15-20 внутренними вызовами модели — это больше, чем «одно сообщение» в Claude Pro. Грубая оценка: за те же деньги вы получаете трёх-четырёхкратный рабочий запас.
Для активного разработчика, упирающегося в лимиты Claude Pro, есть GLM Coding Pro — около $60 в месяц с лимитом 4000 промптов за 5 часов. Это пятикратный объём от Lite. Самые тяжёлые кейсы — Coding Max за $160 с 8000 промптов в неделю. Это уже уровень Claude Max, и для большинства команд избыточно.
НДС 22% с 2026 — главный финансовый аргумент
На уровне команды-юрлица в России — ситуация принципиально другая. Прямая оплата иностранным провайдерам со счёта юрлица создаёт два юридических обязательства:
- НДС 22% с 2026 года при покупке электронных услуг иностранных компаний (статья 174.2 Налогового кодекса). Платит юрлицо как налоговый агент.
- Валютный контроль по 173-ФЗ — банк может запросить документы о назначении платежа, договоры, инвойсы.
Решение для бизнеса — Cloud.ru Evolution AI Factory. Каталог из 20+ моделей, оплата в рублях с расчётного счёта, ежемесячные акты и счета-фактуры. Цены за 1M токенов: от 0 ₽ (preview-режим у GLM-4.7) до 569 ₽ (GigaChat-2-Max, флагман Сбера). Большинство китайских и open-weight моделей — в диапазоне нескольких рублей за input и нескольких десятков за output. Никаких валютных контролей, никаких НДС-обязательств — Cloud.ru уже включил в цену.
Что меняется в работе команды
На инструментах — почти ничего. Разработчики, которые работали в Claude Code, продолжают работать в Claude Code. У них меняется одна строка в локальных настройках, и весь остальной рабочий процесс остаётся. Файлы, шаги, привычки, скорость работы — то же.
Что точно меняется — финансовая дисциплина. Если команда покупала подписки Claude или OpenAI на личные карты с компенсацией от компании — этот процесс упрощается на одного провайдера, причём российского, с полной отчётностью. Если оплата шла напрямую с расчётного счёта — теперь не нужны посредники, валютный контроль, НДС-агент, инвойсы на английском.
Меняется и профиль рисков. Аккаунт у Anthropic могут заблокировать в любой момент очередной волны — это не прихоть, а применение политики. Команды, которые мигрировали на стабильных провайдеров, перестают зависеть от этой неопределённости. История чатов, проекты, ключи — всё в стабильных юрисдикциях.
Когда это срочно
- Срочно — если ваша команда работает на Claude или OpenAI через VPN с российскими картами. Это основная цель массовых банов. 8 мая 2026 Anthropic закрыл тысячи таких аккаунтов за одни сутки. Запланируйте миграцию в ближайший спринт.
- Стандартный план — 5-6 часов одного разработчика на пилот, потом 1-2 недели на перевод команды. Параллельно бухгалтерия открывает аккаунт на Cloud.ru или Yandex AI Studio как юрлицо — занимает 1-2 рабочих дня (договор оферты, реквизиты, активация сервиса).
- Не срочно — если команда уже работает через российских провайдеров (Yandex, Sber) или гибридную схему с агрегаторами в рублях.
Цены: подписки и pay-per-use
Базовые цифры за 1M токенов на май 2026 (input / output), все верифицированы через WebFetch на официальные docs.* провайдеров:
| Провайдер | Модель | Input | Output | Контекст |
|---|---|---|---|---|
| Anthropic | claude-sonnet-4.6 | $3.00 | $15.00 | 1M |
| Anthropic | claude-opus-4.6 | $15.00 | $75.00 | 200K |
| Z.AI | glm-5.1 (флагман) | $1.40 | $4.40 | 200K |
| Z.AI | glm-4.7 | $0.60 | $2.20 | 200K |
| Z.AI | glm-4.5-air | $0.20 | $1.10 | 128K |
| Z.AI | glm-4.7-flash | $0 | $0 | 128K |
| DeepSeek | v4-pro (75% off до 31.05) | $0.435 | $0.87 | 1M |
| DeepSeek | v4-flash | $0.14 | $0.28 | 1M |
| Moonshot | kimi-k2.6 | $0.95 | $4.00 | 262K |
| Moonshot | kimi-k2.5 | $0.60 | $3.00 | 262K |
| Alibaba | qwen3-max ≤32K | $1.20 | $6.00 | 32K |
| Alibaba | qwen3.5-plus ≤256K | $0.40 | $2.40 | 256K |
| Alibaba | qwen3-coder-flash | $0.30 | $1.50 | — |
| MiniMax | m2.7 | ~$0.29 | ~$1.17 | 205K |
DeepSeek V4 Pro со скидкой в 7 раз дешевле Sonnet на input, в 17 раз дешевле на output. После 31 мая 2026 цена удвоится до $0.87 / $1.74 — всё равно в полтора-два раза дешевле Sonnet.
Z.AI GLM Coding Plan — альтернатива Claude Pro
| Тариф | Цена/мес от | Промптов/5ч | Промптов/нед | MCP/мес |
|---|---|---|---|---|
| Claude Pro (для сравнения) | $20 | ~45 | — | — |
| GLM Coding Lite | $18 | ~80 | ~400 | 100 |
| GLM Coding Pro | (на сайте) | ~400 | ~2,000 | 1,000 |
| GLM Coding Max | (на сайте) | ~1,600 | ~8,000 | 4,000 |
Точные цены Pro/Max на странице z.ai/subscribe — она рендерится клиентским JS, через curl я не извлёк (поэтому проверь в браузере перед оплатой). Документация даёт лимиты: Lite ≈ 3× Claude Pro, Pro ≈ 5× Lite, Max ≈ 4× Pro. Один промпт у Z.AI — это полная multi-step сессия с 15-20 внутренними вызовами модели, не одно user-сообщение.
Множитель GLM-5.1 / GLM-5-Turbo: один ваш промпт в пик (14:00-18:00 UTC+8 — это 09:00-13:00 МСК) расходует три промпта из лимита подписки, вне пика — два. То есть в Coding Pro ваши «4 000 промптов в неделю» при пиковой работе на флагмане превращаются в ~1 333. До конца июня 2026 — вне пика множитель ×1 как промо.
НДС 22% при прямой оплате иностранцам (с 2026)
С 1 января 2026 ставка НДС в России — 22%. При покупке электронных услуг (включая API LLM-провайдеров) у иностранных компаний российское юрлицо становится налоговым агентом по статье 174.2 НК РФ: самостоятельно начисляет, удерживает и платит НДС с каждого платежа. Физлица формально не должны (платит сам провайдер при постановке на учёт), но на практике — иностранцы часто не вставали на учёт, и это превращалось в серую зону.
Это означает, что прямой ключ Anthropic за условные $200/мес со счёта юрлица — это $200 + 22% сверху на бухгалтерские плечи. Через российских провайдеров (Cloud.ru, Yandex, Sber) НДС уже включён в тариф.
Дорожная карта по бюджету
Один разработчик активно использует Claude Code. Считаем по сценариям.
Сценарий «Lite» (~30 рабочих часов в неделю активной работы с агентом)
- Claude Pro $20/мес упирается в лимиты, нужен Pro Max за $100
- GLM Coding Lite $18/мес = три таких объёма, лимиты не упираются
- Итого экономия: $80-100 на разработчика в месяц
Сценарий «Heavy» (60+ часов, автономные агентные задачи, большие проекты)
- Claude Pro Max $100-200/мес
- GLM Coding Pro ~$60/мес = пятикратный объём от Lite
- Сравнимо или дешевле, плюс независимость от политики использования Anthropic
Сценарий «оплата за использование, активная разработка» (~5-10M токенов/мес)
- Claude Sonnet API: $50-150/мес
- DeepSeek V4 Pro со скидкой: $5-15/мес
- GLM-4.7 pay-per-use: $10-20/мес
- Экономия в разы для интенсивных рабочих процессов
Команда из 5 разработчиков на Pro-подписках: $300-1000/мес vs $90-300/мес на GLM. Чистая экономия порядка $200-700/мес плюс отсутствие риска потери всех аккаунтов.
Карта быстрого переезда (15 минут)
Сначала экспорт
Если у вас активный Claude Pro или ChatGPT Plus — зайдите
в настройки аккаунта и сделайте экспорт всех чатов.
Claude → Settings → Privacy → Export Data.
ChatGPT → Settings → Data Controls → Export Data.
Получаете архив с диалогами в Markdown или JSON. Это страховка:
если завтра аккаунт отключат, у вас остаётся история.
Регистрация на основной альтернативе
Самое простое — chat.deepseek.com. Вход через email
или Google ID, без VPN, без верификаций. Регистрация — минута.
Сразу пять миллионов токенов на пробу.
Регистрация на русскоязычной альтернативе
gigachat.ru — вход через СберID (если есть Сбер-аккаунт,
это одно нажатие). Бесплатно один миллион токенов в год —
этого хватает на месяцы обычного использования. Параллельно —
Алиса на ya.ru/ai через Yandex ID.
Импорт важного контекста
Если у вас были ценные диалоги в Claude — открываете новый чат в DeepSeek или Kimi, копируете самое важное из экспорта как контекст: «Вот наш предыдущий разговор, продолжаем». Не всё переедет, но ключевое — переедет.
Тест: типичная задача
Дайте новой модели одну вашу обычную задачу — генерация текста, помощь с переводом, кодом, разбор документа. Сравните с тем, что давал Claude. Чаще всего разница не заметна.
Если нужен Pro-режим (час времени)
Если бесплатных лимитов мало:
- Регистрируете Alipay по российскому номеру (см. Блок 5).
- Покупаете на P2P USDT за рубли через Bybit или Binance (5-10 минут с СБП).
- Конвертируете USDT → CNY через сервис в Alipay.
- На сайте DeepSeek / Kimi / Qwen выбираете Pro-подписку, оплачиваете через Alipay по QR-коду.
Alipay — один раз настроил, дальше работает. Все китайские сервисы принимают.
Альтернатива без всякого Alipay — GigaChat Pro (~100-300 ₽/мес через СберID и СБП) или Yandex Plus с Алисой Pro (199 ₽/мес). Для русского языка эти варианты часто достаточны.
Карта для команды разработчиков (5 шагов, 1-2 недели)
Пилот на одном разработчике, день 1-2
Выбираете одного добровольца. Он регистрирует аккаунт на Z.AI или DeepSeek (15 минут с банковской картой через посредника или Alipay), получает API-ключ и меняет одну переменную в своих локальных настройках Claude Code. Дальше работает обычным две-три задачи в обычном режиме. По итогу даёт отзыв: что работает, что просаживает, какие задачи не закрываются.
Решение по сценариям, день 2-3
На основе отзыва от пилота решаете: переходим на одну модель (GLM-4.7 как новый «Sonnet команды»), или строим связку из двух-трёх провайдеров под разные задачи. Для большинства команд хватает одного основного провайдера.
Параллельно — открытие юрлицу аккаунта на Cloud.ru, день 1-3
Бухгалтерия регистрирует по реквизитам ОГРН/ИНН/КПП, активирует сервис Evolution AI Factory, настраивает закрытие документов через СБИС или Диадок. Это идёт независимо от пилота.
Команда переключается, неделя 2
Все разработчики получают единый шаблон настроек
(~/.claude/settings.json с провайдером команды),
миграция занимает по 15-30 минут на человека. Задачи не
приостанавливаются.
Контроль, неделя 3-4
В первые недели смотрите на жалобы и трекаете кейсы где новая модель явно проигрывает. Если такие есть — добавляете второй endpoint к Claude через прокси для конкретных задач (vision, MCP-tools).
Карта для юрлица (4 шага, 1-2 рабочих дня)
Регистрация на Cloud.ru как юрлицо
Сайт cloud.ru, кнопка «Создать аккаунт», выбираете «Юридическое лицо», вводите ОГРН/ИНН/КПП, юридический адрес, фактический адрес, подписываете договор оферты в личном кабинете. Привязываете счёт юрлица или корпоративную карту.
Активация Evolution AI Factory
В меню сервисов выбираете «Foundation Models», принимаете дополнительные условия по конкретному каталогу моделей. Получаете доступ к каталогу из 20+ моделей: GigaChat-2 (Lite/Pro/Max), Qwen3 всех размеров, GLM-4.7, T-Pro 32B, gpt-oss-120b, Whisper, embeddings.
Получение API-ключа
В разделе «Сервисные аккаунты» создаёте сервисный аккаунт, выпускаете постоянный ключ доступа. Передаёте разработчикам.
Настройка документооборота
В разделе «Биллинг» выбираете формат закрытия: ежемесячный акт + счёт-фактура, отправка на почту бухгалтера или интеграция с СБИС/Диадок. Цены указаны с НДС, никаких дополнительных обязательств не возникает.
Личная миграция (1 час чистого времени)
Регистрация на провайдере (15 минут)
Z.AI Coding Plan для основного workflow — z.ai/subscribe, оплата картой через посредника или Alipay. DeepSeek pay-per-use — platform.deepseek.com, аналогично. Если есть китайская UnionPay-карта — прямая оплата. Если только российская — через Alipay (см. Блок 5).
Получение API-ключа (5 минут)
В личном кабинете провайдера — раздел «API Keys». Выпускаете ключ, копируете.
Правка settings.json (5 минут)
В файл ~/.claude/settings.json добавляете блок
env с двумя переменными — ANTHROPIC_BASE_URL
(адрес эндпоинта провайдера) и ANTHROPIC_AUTH_TOKEN
(ваш ключ). Готовые конфиги для всех 5 провайдеров — в Блоке 5.
Перезапуск терминала (1 минута)
Закрываете все терминалы, открываете новый. Переменные перечитываются.
Тестовый прогон (15-30 минут)
Запускаете claude в директории какого-нибудь активного
проекта. Просите выполнить пару типовых задач — рефакторинг,
добавление теста, поиск по коду. Сравниваете с тем, как работал
Claude Sonnet. Чаще всего — разница не заметна.
Если что-то пошло не так — возвращаетесь к старым настройкам (или к alternative провайдеру) одной строчкой.
Гибридная конфигурация (если нужен vision или server-side MCP)
Стандартный Anthropic-compat не покрывает vision, server-side
web_search и server-side MCP. Локальные MCP-серверы через
claude mcp add работают на любом провайдере без
дополнительных профилей. Гибрид нужен только если у вас в workflow
картинки или PDF.
Профиль 1 — основной, через Z.AI:
function claude-glm() {
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="$ZAI_KEY"
claude "$@"
}
Профиль 2 — для vision-задач, через прокси к Claude или к Yandex AI Studio с qwen3-vl-plus:
function claude-vision() {
unset ANTHROPIC_BASE_URL
export ANTHROPIC_API_KEY="$ANTHROPIC_KEY_VIA_PROXY"
claude "$@"
}
Запускаешь нужный профиль в зависимости от задачи. Подробности — Блок 5.
Дорожная карта для своего проекта (1-2 рабочих дня)
Если вы переводите не только локальный workflow, но и production-проект, который использует Anthropic API напрямую:
- Аудит всех вызовов к Anthropic API в коде — где они, что отправляют, какие фичи используют (text-only, tool use, vision, MCP).
- Замена
base_urlна endpoint выбранного китайского провайдера. SDK от Anthropic работает прозрачно — нужно поменять только переменную окружения или параметр клиента. - Тестирование на пути «text + tool use» — должно работать без изменений.
- Проверка vision/MCP-зависимых частей — там нужна альтернативная модель или второй endpoint.
- Деплой в тестовую среду (staging), неделя наблюдения, потом в рабочую.
Если переезжаете на открытые веса с самостоятельным хостингом (T-Pro / GLM-4.5-Air / Llama 4) — добавляется аренда GPU у Selectel/Cloud.ru/VK Cloud (от 22-50 тыс. руб/мес за 4090 / A100), запуск vLLM или TGI, собственный OpenAI-совместимый сервер. Это занимает пару дней работы DevOps.
Этот блок виден всем, независимо от выбранного режима. Здесь — карта западных блокировок, механика Anthropic-compat эндпоинтов, наш замер моделей, российская инфраструктура и open-weights.
Что блокирует Запад
Шесть западных провайдеров на май 2026:
Anthropic (Claude.ai, Claude API, Claude Code)
Геоблокировка по IP жёсткая. Платёжные карты РФ не проходят (Stripe).
Email-домен .ru ловится как косвенный маркер.
С сентября 2025 политика supported countries исключает entities,
более 50% которых ассоциированы с РФ. Май 2026 — массовые баны
через VPN-детекцию, история чатов и проектов теряются вместе
с аккаунтом.
OpenAI (ChatGPT, OpenAI API)
Аналогичная картина. Supported countries не включают РФ с 2024. Регулярные баны при попытках обхода. Stripe-фильтры по картам.
Google (Gemini app, AI Studio, Vertex AI)
Самая жёсткая VPN-детекция в 2026. Россия исключена из supported
regions явно (ai.google.dev, обновление апрель 2026).
xAI (Grok via grok.com)
X заблокирован в РФ с 2022, grok.com следом по тем же санкционным
основаниям. Через api.x.ai прямого доступа из РФ нет,
только через прокси.
Perplexity
Геоблокировки нет — сайт работает напрямую из РФ. Проблема только с оплатой Pro/Max через Stripe. Бан-волн пока не зафиксировано.
Mistral (Le Chat, api.mistral.ai)
Геоблокировки нет, но 20-й пакет санкций ЕС (апрель 2026) обязывает европейские компании ограничивать AI-услуги российским лицам. Open-weights версии Mistral остаются доступны через Hugging Face.
Карта мира AI на май 2026
Четыре кластера с разными правилами:
- Запад (закрыт). Anthropic, OpenAI, Google, xAI, Perplexity, Mistral, Cohere. Любая попытка официальной оплаты — отказ или бан. VPN детектируется всё лучше.
- Китай (открыт + Anthropic-compat). DeepSeek, Alibaba (Qwen), Z.AI (GLM), Moonshot (Kimi), MiniMax, ByteDance (Doubao). Все, кроме Doubao на момент проверки, запустили Anthropic-совместимые эндпоинты. Оплата через Alipay (физлица), иностранные виртуальные карты, или китайская UnionPay.
- Россия (рублёвая оплата). Cloud.ru Evolution AI Factory, Yandex AI Studio, GigaChat от Сбера, Selectel/VK Cloud для GPU. Расчётный счёт юрлица, акты и счета-фактуры, никаких валютных контролей.
- Open-weights (self-host). T-Pro и T-Lite от T-Bank (Apache 2.0), Vikhr-Nemo и Vistral, Llama 4.x, Qwen3, GLM-4.5-Air, Falcon от TII, Phi-4. Скачиваешь веса, поднимаешь на своём GPU.
Anthropic-compatible endpoints — главный механизм
Ключевая для разработчика находка 2025-2026: пять китайских провайдеров запустили эндпоинты в формате Anthropic API. Claude Code, Cline, Cursor и подобные инструменты переключаются на эти эндпоинты сменой одной переменной окружения.
| Провайдер | Endpoint | Источник доков |
|---|---|---|
| Z.AI (GLM) | https://api.z.ai/api/anthropic | docs.z.ai/devpack/quick-start |
| DeepSeek | https://api.deepseek.com/anthropic | api-docs.deepseek.com/guides/anthropic_api |
| Kimi/Moonshot | https://api.moonshot.ai/anthropic | platform.kimi.ai/docs/guide/agent-support |
| Alibaba/Qwen | https://dashscope-intl.aliyuncs.com/apps/anthropic | alibabacloud.com/help/.../anthropic-api-messages |
| MiniMax | https://api.minimaxi.com/anthropic | platform.minimaxi.com/docs/api-reference/text-anthropic-api |
api.z.ai/api/anthropicapi.deepseek.com/anthropicapi.moonshot.ai/anthropicdashscope-intl.aliyuncs.comapi.minimaxi.com/anthropicANTHROPIC_BASE_URL · одной строкой переключает питомникЧто работает через эти эндпоинты:
- text content, JSON tool calls, file editing
- streaming, system prompts, temperature, top_p, stop_sequences
- max_tokens, agentic loops с многошаговыми вызовами
- tool_use и tool_choice (none, auto, any, tool)
Что НЕ работает (важно):
- image content (картинки)
- document content (PDF и аналоги)
- search_result content
- redacted_thinking
- server_tool_use (server-side web_search, code_execution и подобное)
- server-side MCP (типы
mcp_tool_use,mcp_tool_result, полеmcp_servers) — это когда сам API провайдера делает MCP-вызов - container_upload
- параметр
thinking.budget_tokensмолча игнорируется top_k,cache_controlмолча игнорируются
Что важно: локальные MCP-серверы (через claude mcp add)
работают. Claude Code сам общается с MCP-сервером на вашей машине,
в API провайдера улетают обычные tool_use вызовы. Не
блокируется. Z.AI явно описывает в документации работу Vision MCP /
Web Search MCP / Web Reader MCP с GLM Coding Plan, DeepSeek и Kimi
ведут себя аналогично. Что не работает — это server-side MCP, который
Anthropic недавно добавил как первоклассный API-feature. У
альтернативных провайдеров этой возможности нет.
api.anthropic.com пролезает всё. Через compat-shim — узкое горло: только text, tool use, file edit.- text content
- JSON tool calls (tool_use, tool_choice)
- file editing
- streaming
- system prompts
- agentic loops
- image content (картинки)
- document content (PDF)
- search_result
- server_tool_use (web_search)
- server-side MCP
- container_upload
Эти ограничения — на уровне протокола Anthropic-compat, не на уровне моделей. Если нужны эти возможности — отдельный второй endpoint к настоящему Claude через прокси, или альтернатива (например, qwen3-vl-plus напрямую через DashScope для vision, не через Anthropic-compat).
Базовый конфиг в ~/.claude/settings.json:
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_AUTH_TOKEN": "your-zai-key",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"API_TIMEOUT_MS": "3000000"
}
}
API_TIMEOUT_MS=3000000 (50 минут) — рекомендация из
документации Z.AI. Длинные agentic-сессии с многошаговыми правками
кода реально доходят до 30-40 минут одного запроса; стандартный
таймаут Claude Code обрывает их посередине.
Для DeepSeek с активацией 1M контекста — суффикс [1m]
обязателен:
"ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro[1m]"
Без него по умолчанию контекст 200K.
Готовые конфиги для всех 5 провайдеров — в Блоке 5.
Coding Plan'ы и pay-per-use
Z.AI запустил подписочную модель — альтернатива Claude Pro. Цены и лимиты (источник docs.z.ai/devpack/overview, май 2026):
| Тариф | Цена/мес от | Промптов/5ч | Промптов/нед | MCP/мес |
|---|---|---|---|---|
| Claude Pro (для сравнения) | $20 | ~45 | — | — |
| GLM Coding Lite | $18 | ~80 | ~400 | 100 |
| GLM Coding Pro | (точные на сайте) | ~400 | ~2,000 | 1,000 |
| GLM Coding Max | (точные на сайте) | ~1,600 | ~8,000 | 4,000 |
Точные цены Pro/Max — на странице z.ai/subscribe (рендерится клиентским JS, проверяй в браузере). По документации Lite ≈ 3× Claude Pro, Pro ≈ 5× Lite, Max ≈ 4× Pro. Один промпт у Z.AI — это не «одно сообщение», а полная multi-step сессия с 15-20 внутренними вызовами.
Множители для GLM-5.1 / GLM-5-Turbo: ×3 в пик (14:00-18:00 UTC+8), ×2 вне пика. До конца июня 2026 — ×1 вне пика как промо.
Оплата за использование дешевле даже Lite-подписки, если работа неравномерная. DeepSeek V4 Pro со скидкой 75% — $0.435 / $0.87 за 1M токенов (до 31.05.2026), после удвоится до $0.87 / $1.74. Kimi K2.6 — $0.95 / $4.00. GLM-4.7 — $0.60 / $2.20. Qwen3-Coder-flash — $0.30 / $1.50. Все варианты в разы дешевле Claude Sonnet ($3 / $15) и Opus ($15 / $75).
Оплата за использование — для тех, у кого нагрузка неровная (есть недели интенсивной работы и недели пауз). Подписка — для тех, кто пишет код каждый день и упирается в лимиты Claude Pro.
DeepSeek reality check (наш собственный замер 09.05.2026)
DeepSeek V4 Pro часто называют «новый Claude для кодинга». На бенчмарках производителя — сильные цифры (SWE-Bench Verified 78-80%, MMLU-Pro 87.5%, контекст 1M). На реальных production-задачах — нюансы.
Свежий 48-парный замер на задаче «связан ли коммит с открытым багом» (один из моих проектов, 9 мая 2026). F1 — итоговая мера точности, от 0 до 1, чем выше — тем лучше. Задержка — время до ответа модели.
| Конфигурация | F1 | Latency | Замечание |
|---|---|---|---|
| MiMo V2.5 Pro no-thinking (через OpenRouter) | 0.86 | 2.5с | победитель по балансу |
| DeepSeek V4 Pro thinking max=400 | 0.90 | 11с | лидер только при малом бюджете рассуждений |
| GLM 5.1 baseline (через Z.AI direct) | 0.83 | 3.1с | стабильный, был в боевой работе |
| Nemotron 3 Super 120B free (OpenRouter) | 0.78 | 9.7с | бесплатно через бесплатный уровень |
| Gemini 3.1 Pro Preview (OpenRouter) | 0.80 | 4с | принудительные рассуждения, защищает от ложных срабатываний |
| DeepSeek V4 Pro no-thinking | 0.73 | 4.9с | проиграл бесплатному Nemotron |
| DeepSeek V4 Pro thinking-4k | 0.78 | 13.9с | избыточное рассуждение, полнота упала с 0.82 до 0.67 |
Что это значит:
- DeepSeek хорош только в одной конфигурации — режим рассуждений включён, но с небольшим бюджетом токенов. При увеличении бюджета рассуждений модель «расшатывается»: дольше думает, но полнота ответа падает. Этот эффект называют «избыточным рассуждением» (overthinking).
- Без режима рассуждений DeepSeek проигрывает даже бесплатному Nemotron 3 Super 120B (доступен бесплатно через OpenRouter).
- В стандартном использовании модель или думает по умолчанию, или не думает вовсе — и в обоих случаях уступает альтернативам.
Что говорит сообщество в 2026 году (Reddit r/SillyTavernAI, r/ClaudeAI, r/LocalLLaMA, vc.ru, Habr — апрель-май):
- AA-Omniscience (тест на галлюцинации): 94-96% процент выдуманных ответов у DeepSeek V4
- Habr статья 1033208: кибербезопасность 32% против 71% у GPT-5.5, разработку с агентами 44% против 78%
- LMSYS Chatbot Arena, май 2026: рейтинг Elo ~800 у DeepSeek V4 против ~999 у Claude Opus (Elo — система рейтингов, как в шахматах; выше — лучше)
- Жалобы практиков: «потратил $50 на V4 Pro — ЛЕНИВЫЙ, склонен ко ЛЖИ» (X @entrepeneur4lyf, май 2026), «хуже, чем GLM 4.6 или Kimi K2», «4 из 5 ответов пропускают элементы инструкции», «иногда переходит на китайский в середине ответа»
- Цензура облачной версии: ~85% отказов на 1156 китайских политических вопросах
Где DeepSeek реально хорош: дешёвая шаблонная генерация кода, написание тестов, рефакторинг по чёткому плану, работа с большим контекстом (1M токенов). Где плох: автономная работа агента с длинной цепочкой решений, следование сложным инструкциям, творческие задачи с нюансами.
DeepSeek — хороший дешёвый второй слой в команде моделей, но не основной выбор для замены Claude Sonnet. Основной — GLM-4.7 через Z.AI Coding Plan. По community-консенсусу 2026 GLM ближе всех к Claude по реальному опыту работы.
Multi-model где реально нужен
Изначально казалось, что нужен сложный роутинг из 5-6 моделей. На практике для большинства разработчиков GLM закрывает 90% задач, а multi-model — узкие случаи.
Где НЕ нужен
- генерация кода, рефакторинг, дебаг, написание тестов
- правка нескольких файлов, проектирование архитектуры
- автономная работа агента с использованием инструментов
- чтение и поиск по коду проекта
Где нужен второй адрес API
- Анализ изображений и PDF. Anthropic-совместимый режим не поддерживает картинки и документы. Решения: запрос напрямую к qwen3-vl-plus через DashScope (не через Anthropic-совместимый режим), или Claude Sonnet через прокси, или Yandex AI Studio с собственными vision-моделями.
- Поиск в интернете. Anthropic-совместимый режим не поддерживает встроенный веб-поиск. Решения: отдельный запрос к Perplexity (доступна из РФ напрямую) или к Grok через прокси.
- Серверный MCP. Это новая возможность Anthropic API — сам API делает MCP-вызов и возвращает результат. У альтернативных провайдеров не работает. Локальные MCP-серверы (которые добавляются через
claude mcp add) — работают, потому что сам Claude Code их обрабатывает, а к API провайдера уходят обычные вызовы инструментов. - Длинный контекст более 200K. GLM-4.7 — 200K, GLM-5.1 — 200K. Если нужно больше — DeepSeek V4 (1M), Kimi K2.6 (262K). Здесь DeepSeek V4 Flash в режиме оплаты за использование — лучший выбор.
Реальный рабочий рецепт
- Основной рабочий процесс: подписка GLM Coding Pro (через Claude Code)
- Длинный контекст: API-ключ DeepSeek V4 Flash (оплата за использование)
- Изображения и серверный MCP: Claude Sonnet через прокси, если есть рабочий канал; либо нативные API китайских провайдеров
Это схема «2-3 модели», разделённых по типу задачи, а не
динамическая маршрутизация. Переключать профиль вручную через bash-функции
в ~/.bashrc — пять секунд работы.
Российская инфраструктура — Cloud.ru и Yandex AI Studio
Главная находка для русскоязычной аудитории — Cloud.ru Evolution AI Factory. Это самый богатый каталог моделей в РФ-юрисдикции, доступный за рубли с актами и счёт-фактурами.
Cloud.ru Evolution AI Factory
cloud.ru/products/evolution-ai-factory/catalog-foundation-models. На май 2026 в каталоге:
- GigaChat-2 (Lite, Pro, Max) от Сбера
- Qwen3 всех размеров (от 1.5B до 235B)
- GLM-4.6, GLM-4.7 — в free preview
- T-Pro-it-2.0 (32B), T-Lite-it-1.0 (7B)
- gpt-oss-120b (открытые веса OpenAI)
- Vikhr, embeddings модели, Whisper
Цены за 1M токенов: от 0 ₽ (preview-режимы) до 569 ₽ (GigaChat-2-Max). Большинство Qwen, GLM, T-Lite — 1.76-67 ₽ input, 3.5-268 ₽ output. Это в разы дешевле прямой китайской оплаты с учётом всех комиссий за конвертацию USD/CNY.
Документооборот: договор оферты, ежемесячные акты, счета-фактуры. Интеграция с СБИС/Диадок. Цены указаны с НДС.
- №1DeepSeek V3.2
- №2Qwen3-235B-A22B
- №3Gemma3-27B / Llama-3.3-70B
- №4gpt-oss 120B / 20B
- №5phi-4 14B
Yandex AI Studio
aistudio.yandex.ru. Каталог Foundation Models включает:
- YandexGPT Pro 5.1, Lite 5, Alice AI LLM — собственные модели
- DeepSeek V3.2, Qwen3-235B-A22B, Gemma3-27B-It, Llama-3.3-70B-Instruct, gpt-oss варианты, phi-4 — открытые веса от мировых лабораторий
Цены за 1K токенов: Alice AI LLM ~0.35 ₽ in / 0.83 ₽ out, YandexGPT Pro 5.1 ~0.56 ₽, DeepSeek и Qwen 0.14-0.35 ₽, Gemma3 от 0.07 ₽. Платежи: СБП, корп карты, лицевой счёт юрлица. Полный комплект документов для бухгалтерии.
GigaChat
developers.sber.ru. Только свои модели. Физлицам бесплатно 1M токенов в год по СберID. Юрлицам с февраля 2026 оплата по факту использования: Lite 0.065 ₽ / Pro 0.5 ₽ / Max 0.65 ₽ за 1K токенов. Для русскоязычных задач (юридический контекст, локальные реалии) — лидер теста MERA среди российских моделей.
Selectel, VK Cloud, Cloud4Y, Beeline Cloud, RuVDS
Не готовый API, а аренда GPU для самостоятельного развертывания модели. От 22 тыс. руб/мес за 4090 и от 100 тыс. руб/мес за A100. Подходит для запуска vLLM или TGI с открытыми весами (T-Pro, Vikhr, Llama, Qwen).
MTS AI / MWS AI Cotype
Cotype Light 3 (9B мультимодальная), Cotype Pro 2.5, Cotype Nano (открытый код). В основном корпоративное развертывание на серверах клиента с лицензированием от 6.4 млн руб. Nano — бесплатно, можно развернуть самостоятельно.
T-Bank T-Tech
T-Pro-it-2.0 (32B) и T-Lite-it-2.1 (7-8B). Open-weights Apache 2.0
на huggingface.co/t-tech. Сильны в русском, reasoning через
<think>, tool-calling. Своего cloud API нет —
берётся через Cloud.ru или self-host.
Не-китайцы и не-запад
Кроме крупных US/EU/CN игроков и российской инфраструктуры есть несколько провайдеров, но большинство либо закрыты для РФ, либо доступны только через open-weights.
Доступно из РФ
- Falcon (TII, ОАЭ). Open-weights Falcon-H1 (3B-34B), Falcon 3, Mamba-варианты. Бесплатно скачать, hosted доступ через Core42 / Azure / AWS — но AWS/Azure для РФ закрыты, остаётся скачать веса и развернуть на Selectel/Cloud.ru.
- Sarvam AI (Индия). Sarvam 105B / 30B open-weights, API ~₹2.5-4 input / ₹10-16 output за 1M. Хорош для индийских языков, для русского — не специализирован.
- Upstage Solar (Корея). Solar Pro $0.15 input / $0.60 output за 1M. Многоязычный, корейский фокус. Доступен из РФ.
- Naver HyperCLOVA X (Корея). Через Naver Cloud, enterprise-pricing. SEED модели open-source.
Закрыто для РФ
- Mistral AI (Франция). После 20-го пакета ЕС — geo-block для РФ, оплата картами не проходит. Open-weights версии остаются на Hugging Face.
- Cohere (Канада). Россия в Restricted Locations официально — доступ заблокирован.
- Together AI, Fireworks AI, DeepInfra, Groq Cloud, Cerebras, HuggingFace Inference Endpoints. Все хостинг-провайдеры с условиями использования, запрещающими обслуживание РФ. Аккаунты блокируются при обнаружении.
- Aleph Alpha (Германия), Silo AI (Финляндия), Stability AI. Ограниченное состояние, преимущественно enterprise.
Вывод: для РФ-разработчика реалистичные альтернативы вне китайских и российских — это в основном open-weights через self-host на российских GPU. Управляемых API-сервисов из этой зоны почти нет.
Регистрация в DeepSeek (бесплатно, без VPN)
- Открыть
chat.deepseek.comиз любого браузера. Сайт работает напрямую из России без VPN. - Кнопка «Sign Up». Ввести email, придумать пароль. Альтернатива — вход через Google ID одной кнопкой.
- Подтверждение email — ссылка приходит в течение минуты. Проверьте спам если не пришло.
- После входа сразу 5 миллионов токенов на старте + ежедневное пополнение бесплатного лимита.
- В мобильном — приложение DeepSeek в App Store / Google Play, тот же логин.
Интерфейс на английском, но модель отвечает на русском без проблем. История чатов хранится на серверах.
Регистрация в GigaChat (бесплатно физлицам)
- Зайти на
gigachat.ru. Кнопка «Подключить». - Вход через СберID. Если у вас есть Сбер-аккаунт — это одно нажатие. Нет — нужно создать СберID (бесплатно, по паспорту через мобильное приложение Сбер).
- Принять условия использования сервиса.
- Готово. Сразу доступен чат через веб-интерфейс. Бесплатно один миллион токенов в год.
- Мобильное приложение «GigaChat» в App Store / Google Play, тот же СберID.
Для подписки Pro (~100-300 ₽/мес) — в личном кабинете GigaChat выбрать тариф, оплата через СБП. Pro даёт более крупные лимиты и приоритетный доступ в часы пик.
Регистрация Alipay для оплаты китайских Pro-подписок
Если бесплатных лимитов мало и нужна Pro-подписка у DeepSeek, Kimi или Qwen — Alipay остаётся самым стабильным методом из России.
Скачать Alipay
App Store / Google Play. Зарегистрироваться по российскому номеру (+7).
Верификация загранпаспортом
В разделе «My Profile» → «Identity Verification» выбрать «Foreign Passport». Загрузить фото загранпаспорта и selfie. NFC-проверка через приложение, занимает 2-5 минут.
Пополнить кошелёк
Через P2P-биржу Bybit или Binance (P2P — прямой обмен криптовалюты между людьми): купить USDT (криптовалюта) по сети TRC-20 за рубли через СБП, перевести на свой Alipay через сервис конвертации USDT → CNY (юани). Комиссия 1-3% плюс рыночный спред.
Привязать к платформам
В консоли DeepSeek / Z.AI / Moonshot выбрать пополнение через Alipay. Сканировать QR-код в приложении Alipay, подтвердить.
Авто-пополнение
Большинство платформ поддерживают регулярные платежи через Alipay. Настроить лимит и максимальный размер автоплатежа.
Время на полную настройку — 1-2 часа. Один раз — потом просто работает.
Как подготовить свои заметки к новой ИИ
Если вы годами копили промпты, чат-истории и инструкции в Claude или ChatGPT — переезд требует организации. Без неё вы потеряете половину наработок в первую неделю.
Экспорт и инвентаризация
Сохраните важные чаты в Markdown или HTML. Claude и ChatGPT дают
экспорт в настройках аккаунта. Создайте три папки:
prompty/ (шаблоны запросов), otvety/ (удачные
ответы для референса), instrukcii/ (пошаговые процедуры).
Тестирование на новой модели
Не переписывайте все промпты сразу. Возьмите 5-10 самых частых задач и прогоните через DeepSeek, Kimi или Qwen. Зафиксируйте разницу в ответах — где новая модель лучше, где хуже, где нужен другой промпт.
Фиксация правил в одном файле
Создайте текстовый файл MOI-AI-PRAVILA.md в корне ваших
заметок. 10-15 правил: какая модель для какой задачи, стандартный
формат промпта, запрещённые приёмы (например, «не проси считать
точные цифры в CSV»). Это ваш личный AGENTS.md — он сэкономит часы
на подборе модели под задачу.
Не распыляйте правила по десятку заметок. Один файл в корне — единственное место, куда вы заглянете через месяц, когда забудете, почему выбрали именно эту модель.
Регистрация на Cloud.ru как юрлицо
Регистрация по реквизитам
На сайте cloud.ru — кнопка «Создать аккаунт», выбор «Юридическое лицо». Заполняете ОГРН, ИНН, КПП, юридический и фактический адрес. Договор оферты подписывается прямо в личном кабинете.
Привязка платёжного метода
Корпоративная карта или счёт юрлица. Цены на сайте указаны с НДС. Минимальный депозит не требуется.
Активация Evolution AI Factory
В меню сервисов — «Foundation Models». Принимаете дополнительные условия по конкретному каталогу моделей.
Получение API-ключа
Раздел «Сервисные аккаунты» — создаёте сервисный аккаунт, выпускаете постоянный ключ доступа для базовых моделей. Передаёте разработчику.
Настройка документооборота
В разделе «Биллинг» — формат закрытия документов: ежемесячный акт + счёт-фактура, отправка на email бухгалтера или интеграция с СБИС/Диадок.
Интеграция в свою инфраструктуру
API OpenAI-compatible. Разработчик получает base_url и model name, интегрирует стандартным способом.
Документация: cloud.ru/documents/tariffs/evolution/foundation-models, cloud.ru/products/evolution-ai-factory.
Регистрация в Yandex AI Studio
- Личный кабинет Yandex Cloud. Заходите на yandex.cloud. Создаёте организацию или входите от имени юрлица.
- Активация AI Studio. В консоли — раздел «AI Studio» → «Foundation Models». Принимаете условия использования.
- Создание сервисного аккаунта. В разделе управления доступом (IAM) создаёте сервисный аккаунт с ролью
ai.foundationModels.user. - API-ключ или токен доступа. Получаете постоянный API-ключ или краткосрочный токен. Для рабочей среды обычно ключ.
- Билинг. Подключаете платёжный аккаунт юрлица, выбираете формат документов.
Каталог моделей: aistudio.yandex.ru. Цены: aistudio.yandex.ru/docs/en/ai-studio/pricing.
Шаблон письма команде
Если нужно объявить миграцию команде официально:
Тема: Миграция на новых AI-провайдеров
Коллеги,
В связи с массовыми блокировками российских пользователей у Anthropic
(8 мая 2026, тысячи аккаунтов) и продолжающимся ужесточением политики
Anthropic / OpenAI / Google в отношении российских пользователей
переводим команду на альтернативных провайдеров.
Что делаем
1. Основной workflow Claude Code переключаем на Z.AI / GLM-4.7. Каждый
разработчик меняет одну переменную в ~/.claude/settings.json.
Инструкция и ключ — у [технический лид].
2. Параллельно открываем юрлицу аккаунт на Cloud.ru Evolution AI Factory
для российских моделей и корпоративных платежей в рублях.
Ответственный, [бухгалтер].
3. Старые ключи Anthropic / OpenAI деактивируем после переезда
(планируется через 2 недели).
Что не меняется
- Инструменты те же. Claude Code, Cursor, IDE-плагины, привычный рабочий процесс.
- Качество близкое к Sonnet. По нашему пилоту, 90% задач закрываются
без потерь.
Что меняется
- Платёжная дисциплина: больше нет личных карт под подписки, всё через
Cloud.ru рублями с актами.
- Цена: ниже текущей.
- Стабильность: больше не зависим от правил Anthropic.
Срок миграции, две недели. Вопросы, в Slack #ai-migration.
Как подготовить команду к переходу на другую ИИ
Для бизнеса потеря доступа к Claude или GPT — не только техническая проблема, но и риск для процессов. Если маркетинг, поддержка или аналитика завязаны на западные модели, переезд требует планирования.
Инвентаризация использования
Проведите опрос: кто из сотрудников использует ИИ, для каких задач, какие модели, какие промпты. Результат — таблица: «Задача → Текущая модель → Альтернатива → Риск качества».
Пилот на некритичных задачах
Не переводите всё сразу. Выберите 2-3 задачи с низким риском (генерация черновиков, суммирование документов) и прогоните через GigaChat, DeepSeek или Cloud.ru. Оцените качество и затраты.
Документация и правила
Создайте внутренний документ с тремя блоками: Read order (что читать сотруднику при старте), Project invariants (что нельзя делать — например, не загружать персональные данные клиентов в китайские чаты), Verification gate (как проверить результат перед отправкой клиенту).
Параллельная работа и rollback
На первых двух неделях держите оба канала — западный и альтернативный. Сравнивайте результаты. Если альтернатива не тянет — откат мгновенный, бизнес не пострадает.
Готовые конфиги settings.json
Скопируй нужный, поставь свой ключ, перезапусти терминал — работает.
Z.AI / GLM (рекомендуется для основного workflow)
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_AUTH_TOKEN": "your-zai-key",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"API_TIMEOUT_MS": "3000000"
}
}
DeepSeek
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
"ANTHROPIC_API_KEY": "your-deepseek-key",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro[1m]",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash"
}
}
Суффикс [1m] у deepseek-v4-pro обязателен
для активации полного контекста 1M токенов. Без него по умолчанию 200K.
Kimi / Moonshot
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.moonshot.ai/anthropic",
"ANTHROPIC_AUTH_TOKEN": "your-moonshot-key",
"ANTHROPIC_MODEL": "kimi-k2.6",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "kimi-k2.6",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "kimi-k2.6",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "kimi-k2.5"
}
}
Alibaba / Qwen (DashScope International)
{
"env": {
"ANTHROPIC_BASE_URL": "https://dashscope-intl.aliyuncs.com/apps/anthropic",
"ANTHROPIC_API_KEY": "your-dashscope-key",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "qwen3-coder-plus",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "qwen3-coder-flash"
}
}
MiniMax
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.minimaxi.com/anthropic",
"ANTHROPIC_API_KEY": "your-minimax-key",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "MiniMax-M2.7"
}
}
После изменения settings.json — закрыть терминал,
открыть новый, проверить через claude в директории
проекта.
Скрипт быстрого переключения провайдеров
Если хочется на лету менять провайдер без редактирования
settings.json — bash-функции в ~/.bashrc
или ~/.zshrc:
function ai-zai() {
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="$ZAI_KEY"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.1"
echo "→ Z.AI / GLM-4.7"
}
function ai-ds() {
export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_API_KEY="$DEEPSEEK_KEY"
export ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
echo "→ DeepSeek V4 Pro 1M"
}
function ai-kimi() {
export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_KEY"
export ANTHROPIC_DEFAULT_SONNET_MODEL="kimi-k2.6"
echo "→ Kimi K2.6"
}
function ai-anthropic() {
unset ANTHROPIC_BASE_URL
export ANTHROPIC_API_KEY="$ANTHROPIC_KEY"
echo "→ Anthropic (origin)"
}
Ключи хранить в .zshenv или системном keychain,
не в .bashrc. Использование: ai-zai && claude,
или ai-ds && claude — для разных сессий разные
провайдеры.
Промпты для копипаста в Claude Code
Когда нужно быстро попросить агента помочь с миграцией.
УСТАНОВИТЬ И НАСТРОИТЬ Z.AI КАК BACKEND
Помоги настроить Claude Code на работу через Z.AI вместо Anthropic.
1. Прочитай мой ~/.claude/settings.json и сохрани текущую конфигурацию в backup.
2. Перепиши settings.json с Anthropic-compatible эндпоинтом Z.AI:
- ANTHROPIC_BASE_URL = https://api.z.ai/api/anthropic
- ANTHROPIC_AUTH_TOKEN = (попроси меня вставить ключ)
- default models: glm-4.7 для Sonnet и Opus, glm-4.5-air для Haiku
- API_TIMEOUT_MS = 3000000
3. Скажи мне закрыть и открыть терминал.
4. Прогон тестовый: попроси меня запустить claude в любой директории и описать результат.
СРАВНИТЬ ПРОИЗВОДИТЕЛЬНОСТЬ DEEPSEEK И GLM НА КОНКРЕТНОЙ ЗАДАЧЕ
Я хочу сравнить, какая модель лучше под мою задачу: GLM-4.7 через Z.AI
или DeepSeek V4 Pro через api.deepseek.com.
1. Возьми три типичных моих задачи (выбери три файла из текущего проекта).
2. Для каждой задачи сформулируй короткий промпт длиной 30-50 слов.
3. Через два разных ANTHROPIC_BASE_URL прогони один и тот же промпт.
4. Сохрани результаты, latency и приблизительную стоимость в файл results.md.
5. Дай таблицу сравнения и свой вердикт: что я должен использовать как default.
ПЕРЕВЕСТИ ПРОЕКТ НА OPEN-WEIGHTS С SELF-HOST
У меня есть продакшн-проект, который сейчас зависит от Anthropic API.
Хочу понять, что нужно, чтобы переехать на T-Pro 32B на собственном GPU
(аренда у Selectel или Cloud.ru, около 50k руб/мес за GPU 4090 / A100).
1. Прочитай мой код и найди все вызовы к Claude API.
2. Сделай оценку, какие задачи реально требуют Sonnet, а какие, можно ли обойтись T-Pro.
3. Опиши план миграции с тремя этапами: dev-окружение, staging, prod.
4. Оцени потери в качестве по каждой задаче, где будет заметная разница.
5. Дай итоговый список изменений в коде.
Ссылки на официальные доки
Подключение Anthropic-compat endpoints
- Z.AI Claude Code: docs.z.ai/scenario-example/develop-tools/claude
- Z.AI Coding Plan overview: docs.z.ai/devpack/overview
- DeepSeek Anthropic API: api-docs.deepseek.com/guides/anthropic_api
- DeepSeek Claude Code integration: api-docs.deepseek.com/quick_start/agent_integrations/claude_code
- Kimi agent support: platform.kimi.ai/docs/guide/agent-support
- Alibaba Anthropic API: alibabacloud.com/help/en/model-studio/anthropic-api-messages
- Alibaba Claude Code: alibabacloud.com/help/en/model-studio/claude-code
- MiniMax Anthropic API: platform.minimaxi.com/docs/api-reference/text-anthropic-api
Цены и тарифы
- Z.AI pricing: docs.z.ai/guides/overview/pricing
- Z.AI Coding Plan subscription: z.ai/subscribe
- DeepSeek pricing: api-docs.deepseek.com/quick_start/pricing
- Kimi K2.6 pricing: platform.kimi.ai/docs/pricing/chat-k26
- Alibaba pricing: alibabacloud.com/help/en/model-studio/billing-for-model-studio
- MiniMax pricing: platform.minimaxi.com/docs/guides/pricing-paygo
Российская инфраструктура
- Cloud.ru Foundation Models: cloud.ru/products/evolution-ai-factory/catalog-foundation-models
- Cloud.ru pricing: cloud.ru/documents/tariffs/evolution/foundation-models
- Yandex AI Studio: aistudio.yandex.ru/docs/en/ai-studio/
- Yandex AI Studio models: aistudio.yandex.ru/docs/en/ai-studio/concepts/generation/models
- Yandex pricing: aistudio.yandex.ru/docs/en/ai-studio/pricing
- GigaChat docs: developers.sber.ru/docs/ru/gigachat/api/overview
- GigaChat tariffs: developers.sber.ru/docs/ru/gigachat/tariffs/
Open-weights
- T-Pro и T-Lite: huggingface.co/t-tech
- Vikhr models: huggingface.co/Vikhrmodels
- Falcon (TII): huggingface.co/tiiuae
Как технически подготовить проект к работе с другой ИИ
Если ваш проект завязан на Claude API, Claude Code или GPT — переезд требует не только смены ключа, но и подготовки инфраструктуры. Опыт миграций показывает: проекты с документацией и автоматическими проверками переезжают за дни, без них — за недели с инцидентами.
Три уровня подготовки
| Уровень | Что делать | Время | Результат |
|---|---|---|---|
| Базовый | Создать AGENTS.md с правилами проекта: стек, деплой, запреты | 2-3 ч | Любой новый агент читает один файл перед правкой |
| Средний | Добавить skills — структурированные знания по темам | 1-2 дня | Агенты не нарушают production-инварианты |
| Продвинутый | Git pre-commit hook, verification gate, multi-agent etiquette | 3-4 дня | Несколько агентов работают параллельно без конфликтов |
Что писать в AGENTS.md
Это главный файл проекта для автономных агентов — инструкция «читай это первым». Формат — обычный Markdown-текст. Обязательные блоки:
- Назначение проекта — что это за проект, 2-3 предложения
- Стек технологий — языки, фреймворки, базы данных
- Ключевые соглашения — стиль кода, именование, критические паттерны
- Процесс деплоя — как деплоить, где прод, что трогать нельзя
- Порядок чтения — какие файлы читать при старте работы
- Ключевые запреты — нарушение = инцидент (например, «не деплоить без PR»)
Скиллы — структурированные знания агента
Скиллы (skills) заменяют разрозненные правила и память агента. Одна тема = один скилл. Примеры для типового проекта:
<project>-deploy-invariants— как деплоить, что нельзя, процедура отката<project>-content-guard— правила контента (если проект контент-тяжёлый)<project>-autonomous-patterns— критерии остановки для автономной работы<project>-handoff-check— чеклист перед стартом сессии: ветка, чужие планы, незакоммиченные изменения
Не складывайте всё в один скилл. Если он больше 150 строк — разбейте по темам. Иначе агент не найдёт нужное в потоке текста.
Защита веток — обязательно для автономных агентов
Создайте в проекте .githooks/pre-commit — простой скрипт,
который блокирует коммит прямо в main или develop.
Активируйте командой: git config core.hooksPath .githooks. Это ловит
всех — Claude, Kimi, Codex, человека. Обход только через
git commit --no-verify с явного разрешения владельца.
Контрольная проверка — что проверить перед словом «готово»
Любой агент перед заявлением «готово» должен прогнать команды проекта:
npm run build # exit 0
npm run test # exit 0
# или для Python:
pytest # exit 0
Без подтверждённого результата заявление «готово» запрещено. Для бага — сначала найти причину, потом исправить. Три неудачных попытки = архитектурная проблема, остановиться и спросить человека.
Правила для нескольких агентов
Если на проекте работает несколько агентов параллельно:
- Ветки:
<agent>/<scope>-<slug>—claude/plan-auth,kimi/fix-css,codex/migrate-db - Планы: общий каталог
.claude/memory/plans/<slug>.mdс полями Owner, Status, Branch - Проверка перед стартом:
git status, список активных планов, проверка чужих веток - Коммит: автономный агент не коммитит без явного запроса
Карта мира AI перерисовалась — но это не разрушение, это переход.
На новой карте у российского пользователя достаточно живых путей.
Если вы пользователь чата — бесплатные DeepSeek, Kimi, Qwen,
GigaChat, Алиса работают прямо из браузера, без VPN, без сложной
настройки. Если вы бизнес — Cloud.ru Evolution AI Factory даёт
двадцать с лишним моделей в рублях с актами. Если вы разработчик —
одна строчка ANTHROPIC_BASE_URL в settings.json
и Claude Code дальше работает на GLM или DeepSeek.
Ни один из этих путей не покрывает 100% возможностей оригинального Claude или GPT, но в комбинации они закрывают 95-98% реальных задач. И в большинстве случаев — за в три-десять раз меньшие деньги, чем фронтир-модели Запада.
// Обсуждение
Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.