Модуль s.1 · Урок 1
Урок 1: Что такое AI Scientist и чем он не является
Чему вы научитесь
- Понимать, что такое AI Scientist (агент-исследователь) и чем он отличается от обычного чат-бота
- Различать ключевых игроков рынка 2026: коммерческие платформы, системы DeepMind, автономные генераторы статей и open-source
- Объяснять принцип human-on-the-loop и почему он сейчас доминирует
- Видеть, где проходит граница между «ассистент ускоряет работу» и «агент придумывает результаты»
- Формулировать реалистичные ожидания, прежде чем тратить кредиты и часы на инструмент
Коротко: что это вообще такое
AI Scientist (его ещё называют agent-исследователь или AI co-scientist) — это система, где языковая модель берёт на себя операции научного цикла: поиск и разбор литературы, формулировку гипотез, написание и запуск кода для анализа данных, интерпретацию результатов и оформление выводов с цитатами.
Ключевое отличие от привычного чат-бота — не «умнее модель», а архитектура. Это многоагентная оркестрация и автономный цикл «гипотеза → эксперимент → проверка → синтез», часто с песочницей для исполнения кода и доступом к научным базам (PubMed, arXiv, ChEMBL, UniProt).
Ландшафт мая 2026
За 2025–2026 направление перешло из демонстраций в рабочие продукты. Полезно держать в голове четыре разных класса систем — они решают разные задачи и по-разному рискованны.
| Класс | Примеры | Что делает | Степень автономии |
|---|---|---|---|
| Веб-ассистенты по литературе | Elicit, Consensus, Scite | Поиск, QA с цитатами, обзоры | Низкая, человек ведёт |
| Многоагентные платформы | FutureHouse, Google AI co-scientist | Литобзор, турнир гипотез | Средняя |
| Автономные генераторы | Sakana AI Scientist-v2 | Пишет статью целиком | Высокая, рискованно |
| Open-source фреймворки | EvoScientist, Kosmos, BioAgents | Сборка своего пайплайна | Настраиваемая |
Под капотом всех этих систем работают современные модели: Claude Opus 4.8 и 4.7, GPT-5.5 и GPT-5.5 Pro, Gemini 3.1 Pro, а в open-source-связках часто GLM 5.1 и Kimi K2.6. Сами по себе модели стали сильнее, но проблему достоверности это не сняло.
Почему сейчас — это не просто хайп
Использование ИИ исследователями за год выросло скачком, и это уже не ранние энтузиасты, а массовая практика. Цифры ниже — из отраслевых опросов 2025 года.
Источники: Wiley newsroom, 2025, Nature d41586-025-01123-x, Nature d41586-025-04066-5.
Чем AI Scientist НЕ является
Здесь самое важное место урока. Маркетинг продаёт автономного учёного. Но даже статья системы Sakana AI Scientist-v2, формально прошедшая peer-review на воркшопе ICLR 2025, при внешней проверке содержала галлюцинации, сфабрикованные результаты, переоценку новизны и ошибки цитирования (например, неверную атрибуцию авторства LSTM).
Отсюда и доминирующая рабочая модель — human-on-the-loop. Человек не уходит из процесса, он стоит над петлёй: ставит задачу, проверяет ключевые развилки, отбраковывает выдуманное и отвечает за финальный вывод.
flowchart LR
H[Человек: задача и контроль] --> A[Агент: цикл работы]
A --> L[Поиск литературы]
L --> Hy[Гипотезы]
Hy --> E[Эксперимент в песочнице]
E --> S[Синтез и отчёт]
S --> V{Человек проверяет}
V -- Ошибки, галлюцинации --> A
V -- Принято как черновик --> OUT[Проверяемый артефакт]
style H fill:#0891b2,color:#fff,stroke:#0e7490
style V fill:#f59e0b,color:#fff,stroke:#d97706
style OUT fill:#059669,color:#fff,stroke:#047857
Что это значит для вас на практике
Перед тем как открыть любой инструмент из трека, держите в голове три установки.
- Агент хорош там, где результат легко проверить: код, который запускается; цитата, которую можно открыть; таблица, которую видно глазами.
- Агент опасен там, где проверка дорогая: «обзор показал, что эффект значим», «новизна высокая», «это согласуется с литературой» — всё это требует ручной перепроверки.
- Экономьте доверие, а не время. Сэкономленные на рутине часы тратьте на проверку, а не на новые запросы.
Следующий урок
Урок 2: Научный цикл и где в нём место агента — разложим исследование на стадии и поймём, что стоит делегировать, а что нельзя.