Модуль md.4 · Урок 1
Зачем offline-модель: приватность, PHI и 152-ФЗ
Чему вы научитесь
- Объяснять, почему отправка медданных во внешний API — серьёзный риск
- Связывать выбор offline-модели с требованиями 152-ФЗ и врачебной тайны
- Понимать идею privacy-by-design на примере Meissa-4B
- Взвешивать компромисс: приватность против мощности модели
Где живут данные — главный вопрос медицины
В большинстве доменов вопрос «куда уходят данные» технический. В медицине он юридический. Медицинские данные — особая категория персональных данных по 152-ФЗ, и они же составляют врачебную тайну. Отправка таких данных (PHI — protected health information) во внешний LLM-API создаёт прямой риск утечки и нарушения закона.
Отсюда учебный акцент трека: где это возможно — локальные, offline-модели, которые не отправляют данные вовне. Это не идеология, а способ снизить юридический и репутационный риск.
flowchart LR
subgraph Внешний API
P1["Данные пациента"] --> NET["Интернет"] --> API["LLM-провайдер"]
end
subgraph Offline
P2["Данные пациента"] --> LM["Локальная модель\n(на своём железе)"]
end
style NET fill:#fee2e2,stroke:#DC2626
style LM fill:#ecfdf5,stroke:#059669
Что даёт offline и чего стоит
Локальная модель не отправляет текст наружу, но платит за это мощностью и удобством. Это осознанный компромисс.
| Аспект | Offline-модель | Внешний API |
|---|---|---|
| Данные покидают периметр | Нет | Да |
| Соответствие 152-ФЗ | Проще обеспечить | Сложно, нужны гарантии |
| Мощность модели | Обычно ниже | Обычно выше |
| Стоимость | Железо разово | Оплата за токены |
| Доступность из РФ | Не зависит от внешних сервисов | Зависит, возможны блокировки |
Кейс Meissa-4B
Meissa-4B (репозиторий Schuture) — лёгкая мультимодальная медицинская модель, которая специально сделана как offline-агент: её можно запустить локально без отправки данных вовне. База — Qwen3-VL-4B, дообучение через LoRA, инференс на vLLM, лицензия Apache 2.0 (веса — с дополнительными условиями Qwen).
Это удобный учебный кейс privacy-by-design. Но важна честная оговорка: авторы прямо помечают модель как «research prototype, NOT intended for clinical use».
Если для отдельных неконфиденциальных задач всё же используется облако, на рынке РФ доступны рублями российские модели (например, GigaChat, YandexGPT), а из зарубежных флагманов актуальны Claude Opus 4.8/4.7, GPT-5.5 и GPT-5.5 Pro, Gemini 3.1 Pro — но любые данные пациентов через них не пропускаем.
Что дальше
Следующий урок — как такие модели дообучают под медицину: SFT и GRPO на высоком уровне. md.4/02.