Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль md.4 · Урок 1

Зачем offline-модель: приватность, PHI и 152-ФЗ

40 мин
md.4 / Урок 1 из 2

Чему вы научитесь

  • Объяснять, почему отправка медданных во внешний API — серьёзный риск
  • Связывать выбор offline-модели с требованиями 152-ФЗ и врачебной тайны
  • Понимать идею privacy-by-design на примере Meissa-4B
  • Взвешивать компромисс: приватность против мощности модели

Где живут данные — главный вопрос медицины

В большинстве доменов вопрос «куда уходят данные» технический. В медицине он юридический. Медицинские данные — особая категория персональных данных по 152-ФЗ, и они же составляют врачебную тайну. Отправка таких данных (PHI — protected health information) во внешний LLM-API создаёт прямой риск утечки и нарушения закона.

Отсюда учебный акцент трека: где это возможно — локальные, offline-модели, которые не отправляют данные вовне. Это не идеология, а способ снизить юридический и репутационный риск.

flowchart LR
    subgraph Внешний API
      P1["Данные пациента"] --> NET["Интернет"] --> API["LLM-провайдер"]
    end
    subgraph Offline
      P2["Данные пациента"] --> LM["Локальная модель\n(на своём железе)"]
    end
    style NET fill:#fee2e2,stroke:#DC2626
    style LM fill:#ecfdf5,stroke:#059669

Что даёт offline и чего стоит

Локальная модель не отправляет текст наружу, но платит за это мощностью и удобством. Это осознанный компромисс.

АспектOffline-модельВнешний API
Данные покидают периметрНетДа
Соответствие 152-ФЗПроще обеспечитьСложно, нужны гарантии
Мощность моделиОбычно нижеОбычно выше
СтоимостьЖелезо разовоОплата за токены
Доступность из РФНе зависит от внешних сервисовЗависит, возможны блокировки

Кейс Meissa-4B

Meissa-4B (репозиторий Schuture) — лёгкая мультимодальная медицинская модель, которая специально сделана как offline-агент: её можно запустить локально без отправки данных вовне. База — Qwen3-VL-4B, дообучение через LoRA, инференс на vLLM, лицензия Apache 2.0 (веса — с дополнительными условиями Qwen).

Это удобный учебный кейс privacy-by-design. Но важна честная оговорка: авторы прямо помечают модель как «research prototype, NOT intended for clinical use».

Если для отдельных неконфиденциальных задач всё же используется облако, на рынке РФ доступны рублями российские модели (например, GigaChat, YandexGPT), а из зарубежных флагманов актуальны Claude Opus 4.8/4.7, GPT-5.5 и GPT-5.5 Pro, Gemini 3.1 Pro — но любые данные пациентов через них не пропускаем.


Что дальше

Следующий урок — как такие модели дообучают под медицину: SFT и GRPO на высоком уровне. md.4/02.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.