Модуль s.5 · Урок 1
Урок 1: Архитектура multi-agent — роли субагентов
Чему вы научитесь
- Понимать, зачем сильный агент-исследователь разбивается на несколько специализированных субагентов
- Называть и различать шесть базовых ролей: planner, research, code, debug, analyze, write
- Читать архитектуру EvoScientist как пример само-эволюционирующей мульти-провайдерной системы
- Объяснять автономный цикл Kosmos и роль графа знаний (Neo4j) как общей памяти команды
- Видеть, где в любой такой архитектуре стоит человек (human-on-the-loop)
Почему один агент — это мало
Соблазнительно думать, что достаточно дать одной мощной модели большой промпт и все инструменты. На практике так получается агент, который путается: держит в одной «голове» и план, и поиск, и код, и проверку — и роняет качество на каждом переключении.
Решение, к которому пришли почти все рабочие системы 2026 года, — разделение труда. Задачу ведёт оркестратор, а исполняют её узкие субагенты, у каждого своя роль, свой системный промпт и свой набор инструментов. Это та же логика, что в реальной лаборатории: научрук, аналитик данных, программист, рецензент.
Шесть ролей: словарь модуля
Система EvoScientist выделяет шесть субагентов, и это удобный канонический словарь для всего модуля (EvoScientist на GitHub).
| Роль | Субагент | За что отвечает |
|---|---|---|
| Планирование | planner | Разбивает цель на шаги, ведёт стратегию, решает, кого звать дальше |
| Поиск | research | Литература, научные базы, сбор фактов с цитатами |
| Код | code | Пишет код анализа, эксперименты, обработку данных |
| Отладка | debug | Чинит ошибки исполнения, итерирует, пока код не запустится |
| Анализ | analyze | Интерпретирует результаты, считает статистику, ищет закономерности |
| Текст | write | Собирает выводы в отчёт или черновик статьи с цитированием |
Закономерность простая: чем чище разделены роли, тем легче проверять и отлаживать систему — видно, какой именно субагент ошибся.
Архитектура в одной диаграмме
flowchart TB
H[Человек: цель и контроль] --> O[Оркестратор / planner]
O --> R[research: поиск литературы]
O --> C[code: код эксперимента]
O --> D[debug: отладка кода]
O --> A[analyze: интерпретация]
O --> W[write: отчёт с цитатами]
R --> M[(Общая память:<br/>граф знаний / контекст)]
C --> M
A --> M
M --> O
W --> V{Человек проверяет}
V -- галлюцинации, ошибки --> O
V -- принято как черновик --> OUT[Проверяемый артефакт]
style H fill:#0891b2,color:#fff,stroke:#0e7490
style O fill:#4400ff,color:#fff,stroke:#3300cc
style V fill:#f59e0b,color:#fff,stroke:#d97706
style OUT fill:#059669,color:#fff,stroke:#047857
Ключевое здесь — две вещи. Во-первых, оркестратор не делает работу сам, а распределяет её и собирает результаты. Во-вторых, субагенты общаются не напрямую, а через общую память — иначе они теряют контекст друг друга.
EvoScientist: само-эволюция и мульти-провайдер
EvoScientist — молодая система (дебют 13.03.2026), построенная на фреймворке DeepAgents/LangChain (GitHub). У неё три свойства, важных для архитектуры.
- Само-эволюция. Система может уточнять свои промпты и стратегию между шагами, опираясь на персистентную память о прошлых прогонах.
- Мульти-провайдер. Субагенты могут работать на разных бэкендах (Anthropic, OpenAI, Google, MiniMax, NVIDIA) — для РФ это способ не зависеть от одного закрытого API.
- Каналы и расширения. Управление через Telegram/Slack/Feishu, подключение инструментов через MCP и навыков через Agent Skills (об этом — урок 2).
Kosmos: автономный цикл и граф знаний
Kosmos (open-source реимплементация jimmc414) показывает другой акцент — автономный цикл открытия (GitHub, статья arXiv 2511.02824). Агент сам крутит петлю: гипотезы из литературы и данных, эксперименты, исполнение кода в Docker-песочнице, и затем валидация находок по 8-мерной рубрике ScholarEval.
Особенность Kosmos — граф знаний на Neo4j как общая память команды. Вместо того чтобы пересылать друг другу сырой текст, субагенты пишут факты и связи в граф, а потом извлекают нужное. Это и есть способ не утонуть в тысячах статей — подробно разберём в уроке 3.
Два акцента — одна логика
| Свойство | EvoScientist | Kosmos |
|---|---|---|
| Главный акцент | Команда субагентов + само-эволюция | Автономный цикл открытия |
| Общая память | Персистентная память между прогонами | Граф знаний Neo4j |
| Провайдеры | Мульти-провайдер (5+) | Мульти-LLM через LiteLLM |
| Зрелость | Молодой, активный, 3.2k звёзд | Alpha v0.2.0, 525 звёзд |
Звёзды и версии меняются ежедневно — это снимок на момент ресёрча (май 2026), проверяйте актуальные значения на дату работы. Важнее цифр — общий принцип: и там, и там работа разделена на роли, а связывает их общая память и оркестратор над петлёй, под контролем человека.
Следующий урок
Урок 2: Навыки (Agent Skills) и MCP — как научить агента вашей методике через SKILL.md и подключить инструменты через MCP.