Обзор модуля
Предыдущие модули учили работать с литературой и гипотезами. Здесь начинается самая техническая часть трека: агент берёт ваш датасет, пишет код, исполняет его и возвращает таблицы и графики. Это та стадия научного цикла, где выигрыш во времени самый большой, а риски — самые неочевидные.
Модуль строится вокруг трёх вопросов. Как заставить агента сделать воспроизводимый анализ, а не одноразовый ответ. Почему сгенерированный код нельзя запускать на своей машине без изоляции. И как собрать полноценный доменный пайплайн — от сырых данных до интерпретируемого результата.
Сквозная установка трека остаётся прежней: вывод агента — это черновик-гипотеза. Здесь она получает конкретное техническое выражение — каждый график и каждое число должны воспроизводиться из кода, который вы можете прочитать и перезапустить.
Чему вы научитесь
- Запускать первый воспроизводимый анализ данных силами агента: загрузка датасета, описательная статистика, графики publication-quality.
- Подключать к агенту научный инструментарий — Scientific Agent Skills с 70+ Python-пакетами (scikit-learn, Scanpy, RDKit) и analysis-агента BioAgents.
- Понимать, почему код агента опасно запускать без песочницы: prompt-injection, эксфильтрация данных.
- Настраивать изоляцию по образцу песочницы Kosmos: Docker с
--cap-drop=ALL,--network=none, read-only FS и лимитами ресурсов. - Собирать сквозной доменный пайплайн в своей области: биоинформатика, хемоинформатика или интерпретация вариантов.
Уроки модуля
Анализ данных агентом— первый воспроизводимый анализ: датасет, статистика, графики, инструментарий Scientific Agent Skills и BioAgents.Безопасное исполнение кода ИИ— почему код агента нельзя запускать как есть и как изолировать его в Docker-песочнице на примере Kosmos.Доменные пайплайны— один сквозной кейс в вашей области: single-cell RNA-seq, drug discovery или интерпретация вариантов.
Как проходить
- Начните с первого урока: соберите минимальный воспроизводимый анализ на любом своём датасете.
- Перед тем как дать агенту исполнять код локально, пройдите второй урок — это вопрос безопасности, а не удобства.
- На третьем уроке выберите пайплайн из своей области и пройдите его от сырых данных до результата.
После модуля
После модуля у вас должна быть рабочая привычка: любой анализ агента сопровождается кодом, который вы можете прочитать, перезапустить и проверить, а исполнение этого кода всегда происходит в изолированном окружении.
Дальше трек переходит к многоагентным системам — как несколько агентов делят между собой роли planner, research, code и write.