Обзор модуля

Предыдущие модули учили работать с литературой и гипотезами. Здесь начинается самая техническая часть трека: агент берёт ваш датасет, пишет код, исполняет его и возвращает таблицы и графики. Это та стадия научного цикла, где выигрыш во времени самый большой, а риски — самые неочевидные.

Модуль строится вокруг трёх вопросов. Как заставить агента сделать воспроизводимый анализ, а не одноразовый ответ. Почему сгенерированный код нельзя запускать на своей машине без изоляции. И как собрать полноценный доменный пайплайн — от сырых данных до интерпретируемого результата.

Сквозная установка трека остаётся прежней: вывод агента — это черновик-гипотеза. Здесь она получает конкретное техническое выражение — каждый график и каждое число должны воспроизводиться из кода, который вы можете прочитать и перезапустить.

Чему вы научитесь

Запускать первый воспроизводимый анализ данных силами агента: загрузка датасета, описательная статистика, графики publication-quality.
Подключать к агенту научный инструментарий — Scientific Agent Skills с 70+ Python-пакетами (scikit-learn, Scanpy, RDKit) и analysis-агента BioAgents.
Понимать, почему код агента опасно запускать без песочницы: prompt-injection, эксфильтрация данных.
Настраивать изоляцию по образцу песочницы Kosmos: Docker с --cap-drop=ALL, --network=none, read-only FS и лимитами ресурсов.
Собирать сквозной доменный пайплайн в своей области: биоинформатика, хемоинформатика или интерпретация вариантов.

Уроки модуля

Анализ данных агентом — первый воспроизводимый анализ: датасет, статистика, графики, инструментарий Scientific Agent Skills и BioAgents.
Безопасное исполнение кода ИИ — почему код агента нельзя запускать как есть и как изолировать его в Docker-песочнице на примере Kosmos.
Доменные пайплайны — один сквозной кейс в вашей области: single-cell RNA-seq, drug discovery или интерпретация вариантов.

Как проходить

Начните с первого урока: соберите минимальный воспроизводимый анализ на любом своём датасете.
Перед тем как дать агенту исполнять код локально, пройдите второй урок — это вопрос безопасности, а не удобства.
На третьем уроке выберите пайплайн из своей области и пройдите его от сырых данных до результата.

После модуля

После модуля у вас должна быть рабочая привычка: любой анализ агента сопровождается кодом, который вы можете прочитать, перезапустить и проверить, а исполнение этого кода всегда происходит в изолированном окружении.

Дальше трек переходит к многоагентным системам — как несколько агентов делят между собой роли planner, research, code и write.

Данные, код и эксперимент

Уроки

Обзор модуля

Чему вы научитесь

Уроки модуля

Как проходить

После модуля

// Обсуждение