Модуль p.2 · Урок 1
Урок 1: Шесть контуров обработки данных — где живут ваши запросы и ответы
Содержание
- Чему вы научитесь
- Шесть контуров: карта без маркетинга
- Decision tree: как выбрать контур за пять вопросов
- Где граница между соседними контурами
- 1 и 2: consumer public против public API
- 2 и 3: public API против enterprise cloud
- 3 и 4: enterprise cloud против private VPC
- 5 и 6: on-prem против air-gap
- Матрица «какой контур для какого класса задачи»
- Практический алгоритм выбора контура
- Что обычно выбирают зрелые команды
- Итоги
Чему вы научитесь
- Различать шесть контуров AI-системы: от личного чата в браузере до полностью изолированного air-gap
- Быстро определять, где физически и юридически живут ваши запросы, файлы, логи и ответы модели
- Отделять «удобный пилот» от контура, который можно законно и стабильно эксплуатировать на предприятии
- Подбирать контур под класс задачи: черновик письма, RAG по регламентам, анализ ПД, помощник оператора, КИИ
- Ставить интегратору правильный вопрос не «какую модель вы возьмёте», а «в каком контуре она будет жить и кто за него отвечает»
Первый вопрос любого AI-проекта — не «какая модель умнее». Первый вопрос — куда уходят данные и кто владеет контуром. На одном конце шкалы — личный ChatGPT Plus в браузере: быстро, дёшево, удобно. На другом — air-gapped контур в закрытом сегменте завода: дорого, медленно в обновлении, но управляемо. Между ними — ещё четыре варианта, и именно они определяют, можно ли проект запускать без конфликта с ИБ, 152-ФЗ и требованиями КИИ.
Логика модуля p.2 простая: сначала выбираем контур, потом класс модели, потом железо. Если сделать наоборот, получится типичный промышленный анти-паттерн: команда купила дорогую модель, а юрист и CISO через месяц объяснили, что отправлять туда данные нельзя. Для темы персональных данных возвращайтесь к уроку p.3/01. Для значимых объектов КИИ — к уроку p.3/02. Для санкционной доступности западных сервисов — к уроку p.3/05.
Шесть контуров: карта без маркетинга
| Контур | Где живут запросы и ответы | Обучается ли провайдер на данных | SLA / DPA / админ-контроль | Профиль задержки | Профиль цены | Когда уместен |
|---|---|---|---|---|---|---|
| 1. Consumer Public | В публичном потребительском сервисе провайдера: веб-чат или мобильное приложение | Часто да или опционально. У ChatGPT в personal workspace обучение для Free/Plus/Pro включено по умолчанию, но можно выключить; Temporary Chat хранится до 30 дней и не используется для обучения (OpenAI Data Controls FAQ; OpenAI FAQ про personal workspace). У Claude Pro/Max пользователь сам выбирает режим использования данных; при отказе от model improvement Anthropic пишет о хранении до 30 дней, при согласии — до 5 лет (Anthropic Data usage) | Корпоративного DPA и нормального централизованного администрирования обычно нет. Это аккаунт человека, а не промышленный контур | Для одного пользователя обычно быстро, но без договорной гарантии и без предсказуемости | Обычно подписка «за человека»: ChatGPT Plus — $20 в месяц (OpenAI Help); Claude Pro — $20 в месяц (Anthropic Help) | Личный ресёрч, черновики, обучение команды на синтетике |
| 2. Public API | Запросы уходят в облачный API провайдера по каждому вызову | Для коммерческих API-контуров обычно нет обучения по умолчанию, но хранение и служебная обработка зависят от поставщика. OpenAI пишет, что не обучает модели на данных API-платформы по умолчанию (OpenAI business data); Google для Vertex AI прямо запрещает обучение и fine-tuning без разрешения клиента (Google Vertex AI zero data retention); Anthropic для коммерческих API пишет, что не обучает generative models на prompts/code без opt-in (Anthropic Data usage) | DPA обычно есть, но сеть остаётся внешней. Админ-контроль есть в консоли, однако физический контур — у провайдера | Обычно быстрее consumer при хорошей интеграции, но всё равно зависит от региона, нагрузки и длины ответа | Плата за токены. Примеры на апрель 2026, тарифы надо перепроверять перед закупкой: OpenAI GPT-5.4 — ~$2.50 за 1M input tokens и ~$15 за 1M output tokens (варьируется по версии и caching, проверять на дату закупки) (OpenAI API pricing); Claude Sonnet 4 — $3 за 1M input tokens и $15 за 1M output tokens (Anthropic pricing); YandexGPT Pro 5.1 — $0.0067 за 1 000 входных и $0.0067 за 1 000 выходных токенов в synchronous mode (Yandex AI Studio pricing); GigaChat 2 Pro и GigaChat 2 Max для юрлиц — с февраля 2026 пакетные тарифы снижены, а pay-as-you-go ориентиры составляют ~0,5 ₽ за 1 000 токенов для GigaChat 2 Pro и ~0,65 ₽ за 1 000 токенов для GigaChat 2 Max; пакетная цена может быть ниже, проверяйте актуальные тарифы (GigaChat API тарифы для юрлиц) | Продуктовые интеграции вне КИИ, когда нужен API и нет требования держать всё внутри |
| 3. Enterprise Cloud | Данные живут в корпоративном облачном контуре провайдера: enterprise workspace, enterprise region, корпоративная учётка | Обычно нет обучения по умолчанию. OpenAI пишет, что не обучает модели на данных ChatGPT Enterprise / Business / API и даёт data residency (OpenAI business data). Для Gemini Business / Enterprise Google пишет: «You own your data» и данные не используются для обучения моделей Google или других клиентов (Google Workspace Admin Help) | Есть договор, SSO, админ-консоль, аудит, обычно DPA. Это уже не «аккаунт сотрудника», а корпоративная услуга | Более предсказуемо, чем consumer, но всё ещё зависимо от региона и общей архитектуры провайдера | Цена обычно seat-based или contract-based. У Anthropic Team опубликована цена $25 за пользователя в месяц при annual или $30 monthly, минимум 5 пользователей (Anthropic pricing); у ChatGPT Enterprise цена публично не раскрыта — нужна проверка | Корпоративный knowledge assistant, рабочие чаты, обработка внутренних документов без КИИ и без жёсткого суверенного требования |
| 4. Private VPC / dedicated tenant | Данные живут в вашем облачном аккаунте, отдельной VPC, приватных подсетях или выделенном tenancy | На модели и запросы провайдер обычно не обучается по контракту; риск ниже, чем у общего SaaS, но инфраструктура всё ещё облачная | Есть DPA, IAM, private networking, VPN/Direct Connect. Это переходный вариант между публичным облаком и on-prem | Предсказуемее shared cloud. Yandex для dedicated instance прямо пишет про guaranteed performance parameters и оплату не за токены, а за время работы инстанса (Yandex AI Studio dedicated instances) | Чаще всего платите за закреплённый инстанс, GPU-VM или managed endpoint по часам; точная цена зависит от модели и конфигурации — нужна проверка на момент закупки | RAG по внутренним регламентам, приватный inference в облаке, пилот enterprise-класса до выхода в собственный ЦОД |
| 5. On-prem / self-hosted | Данные живут в вашем ЦОД, серверной или заводском контуре; модель крутится на вашем железе | Провайдер модели не обучается на ваших данных, если вы разворачиваете open-weight или лицензированную локальную модель внутри своего контура | DPA нужен уже не с AI-SaaS, а с интегратором, поставщиком железа и, возможно, вендором модели. Полный контроль — у вас, но и ответственность тоже | Самый предсказуемый рабочий контур после air-gap: сеть локальная, джиттер низкий, но задержка уже зависит от вашего GPU и квантизации | Не токены, а CAPEX + электроэнергия + эксплуатация. Детально считаем в уроках p.2/03 и p.2/06 | КТ, чувствительные внутренние данные, подготовка к КИИ, устойчивый производственный контур |
| 6. Air-gapped | Данные и модель живут в физически изолированном сегменте без интернета или с односторонним переносом артефактов | Внешний провайдер не обучается, потому что онлайн-провайдера в рабочем пути нет | SLA внешний почти не нужен; нужны жёсткие внутренние регламенты обновлений, поставки весов, сканирование артефактов, офлайн-мониторинг | Сеть внутри сегмента может быть очень быстрой, но обновление модели и базы знаний — самое медленное из всех контуров | Самый дорогой контур по эксплуатации: отдельное железо, офлайн-процедуры обновления, персонал, резервирование. Точная цена всегда проектная — нужна проверка | Значимые объекты КИИ, особо чувствительные технологические процессы, закрытые НИОКР, сегменты с гостайной |
Decision tree: как выбрать контур за пять вопросов
flowchart TD
A[Есть ли в задаче данные из значимого объекта КИИ?] -->|Да| B[Смотрите только On-prem или Air-gap]
A -->|Нет| C[Есть ли ПД, КТ или чувствительные внутренние документы?]
C -->|Да| D[Нужен корпоративный договор и управляемый контур]
C -->|Нет| E[Это личный эксперимент или обучение команды?]
E -->|Да| F[Consumer Public или Public API на синтетике]
E -->|Нет| G[Нужна интеграция в продукт или бизнес-процесс?]
G -->|Да| H[Public API, Enterprise Cloud или Private VPC]
G -->|Нет| I[Consumer Public достаточно]
D --> J[Нужна ли сетевая изоляция и приватная маршрутизация?]
J -->|Да| K[Private VPC или On-prem]
J -->|Нет| L[Enterprise Cloud]Это дерево специально жёсткое. Оно отсекает ложную экономию. Если задача заходит в КИИ, спор о «лучшем API» заканчивается: остаются контуры 5 и 6. Это прямое следствие урока p.3/02. Если задача включает персональные данные, сначала вспоминаете урок p.3/01, а уже потом спорите о модели. Если сервис западный и вы строите на нём постоянный бизнес-процесс, возвращайтесь к уроку p.3/05 и задайте вопрос о санкционной устойчивости до подписания договора.
Где граница между соседними контурами
1 и 2: consumer public против public API
Разница не в качестве модели. Разница в форме ответственности.
Consumer Public — это «человек разговаривает с сервисом». Public API — это «система компании вызывает модель программно». Во втором случае вы хотя бы можете управлять ключами, лимитами, журналированием, политикой ретраев и интеграцией в свой gateway. В первом вы покупаете удобство. Во втором — строительный материал для продукта.
Поэтому правило простое: как только сценарий должен жить дольше одного пилота, уходите из consumer в API или enterprise-контур. Consumer хорош для изучения возможностей, сравнения промптов и быстрых черновиков. Для этого, кстати, уместен и arckep.ru: безопасно прогонять синтетические примеры, смотреть разницу между моделями, платить рублями и не привязывать западные карты. Но arckep.ru, как и любой другой внешний сервис, не легализует ПД и не заменяет корпоративный контур.
2 и 3: public API против enterprise cloud
Здесь граница проходит по слову управляемость.
Public API подходит, когда вам нужен вызов модели и вы готовы сами строить вокруг него почти всё остальное: авторизацию, логи, маскирование ПД, DLP, ограничение функций, мониторинг стоимости. Enterprise Cloud имеет смысл, когда компании нужен не просто API, а полноценный управляемый сервис: SSO, роли, workspace, data residency, admin console, централизованное отключение функций, журнал аудита.
Проще: API — это кирпич. Enterprise Cloud — это уже часть здания.
3 и 4: enterprise cloud против private VPC
На бумаге оба варианта «корпоративные». Но enterprise cloud — это всё ещё shared service провайдера. Private VPC / dedicated tenant — это уже попытка взять плюсы облака и одновременно сократить поверхность риска.
Именно на этом слое обычно живут решения, где:
- нельзя отправлять данные в общий multi-tenant SaaS;
- нужен private endpoint, VPN или direct interconnect;
- нужен предсказуемый throughput;
- предприятие ещё не готово тащить всё в собственный ЦОД.
Для многих промышленных компаний это самый практичный переходный шаг: сначала dedicated tenant в облаке, потом — при росте нагрузки и ужесточении требований — on-prem.
5 и 6: on-prem против air-gap
On-prem — это «всё у меня в контуре, но сеть наружу в принципе существует». Air-gap — это «рабочего канала наружу нет». Разница огромная и по ИБ, и по операционке.
On-prem подходит большинству предприятий, которым нужны локальность, контроль и санкционная устойчивость. Air-gap нужен там, где сам факт сетевого выхода уже неприемлем. Цена за это — тяжёлая эксплуатация: обновление весов, перенос пакетов, проверка артефактов, отдельные процедуры CI/CD, отдельный backup-процесс.
Матрица «какой контур для какого класса задачи»
| Класс задачи | Пример на предприятии | Рекомендуемый контур | Почему именно он |
|---|---|---|---|
| Личный ресёрч и обучение команды | Сотрудник сравнивает модели, чтобы понять разницу в стиле и цене | 1 или 2 | Данных предприятия ещё нет; важна скорость обучения, а не промышленная эксплуатация |
| Быстрый черновик для человека | Подготовить проект письма поставщику или структуру презентации | 1, 2 или 3 | Ошибка не критична, человек всё равно перепроверяет |
| Внутренний FAQ без ПД и без КИИ | Помощник по общим корпоративным регламентам | 3 или 4 | Нужен договор, роли, журналирование, но не обязательно свой сервер |
| RAG по 500+ внутренним документам | Поиск по техрегламентам, чек-листам ремонта, стандартам HSE | 4 или 5 | Уже важны приватность, стабильность и управляемый ingress документов |
| Обработка ПД или чувствительных обращений | Разбор претензий клиентов, кадровые кейсы, сервис-деск с ФИО и телефонами | 4 или 5 | Сначала правовой контур из урока p.3/01, затем ограничение контуров до корпоративных и локальных |
| Помощник для технолога или оператора | Подсказка по аварийной диагностике, маршруту обхода, режиму оборудования | 5 или 6 | Любая рекомендация рядом с производственным решением должна жить внутри контролируемого контура |
| КИИ / значимый объект | AI в АСУ ТП, инженерный copilot в производственной сети | 5 или 6 | Внешний иностранный SaaS в значимом контуре не рассматриваем; см. p.3/02 |
После этой таблицы должно остаться одно ощущение: контур выбирают не по удобству менеджера, а по цене ошибки и по режиму данных.
Практический алгоритм выбора контура
Опишите данные до выбора модели. Не «будем подключать LLM», а «у нас есть PDF регламенты, журналы ремонтов, фото дефектов, ФИО сотрудников, телеметрия линии».
Определите правовую границу. Есть ли ПД, коммерческая тайна, КИИ, санкционный риск поставщика. Если да — отсеките лишние контуры сразу.
Определите цену ошибки. Черновик для человека терпит consumer и public API. Подсказка оператору — уже нет.
Проверьте, нужен ли вам договорной контур. Если нужен SSO, журнал аудита, роли и ответственность поставщика, consumer отпадает автоматически.
Поймите, что важнее: скорость старта или суверенность. Быстрее всего стартуют 1-3. Лучше всего контролируются 5-6.
Зафиксируйте решение письменно. В карточке проекта должно быть указано: какой контур выбран, почему остальные отклонены и что станет триггером миграции в более жёсткий контур.
Что обычно выбирают зрелые команды
Зрелая команда почти никогда не живёт в одном контуре навсегда. Нормальная траектория выглядит так:
- обучение команды и сравнение моделей — контуры 1 или 2 на синтетике;
- первый корпоративный помощник по внутренним знаниям — контуры 3 или 4;
- рабочий контур для чувствительных данных — контуры 4 или 5;
- всё, что касается значимых объектов КИИ, диспетчеризации, технологических режимов и закрытых сегментов — контуры 5 или 6.
То есть вопрос не «какой контур правильный вообще». Правильный вопрос — какой контур правильный для этой задачи на этом этапе зрелости. Но и здесь есть жёсткая оговорка: некоторые задачи сразу перепрыгивают через ранние стадии. КИИ, ПД, чувствительная КТ и санкционно нестабильный стек — как раз такие случаи.