Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль s.1 · Урок 1

Урок 1: Что такое AI Scientist и чем он не является

20 мин
s.1 / Урок 1 из 3

Чему вы научитесь

  • Понимать, что такое AI Scientist (агент-исследователь) и чем он отличается от обычного чат-бота
  • Различать ключевых игроков рынка 2026: коммерческие платформы, системы DeepMind, автономные генераторы статей и open-source
  • Объяснять принцип human-on-the-loop и почему он сейчас доминирует
  • Видеть, где проходит граница между «ассистент ускоряет работу» и «агент придумывает результаты»
  • Формулировать реалистичные ожидания, прежде чем тратить кредиты и часы на инструмент

Коротко: что это вообще такое

AI Scientist (его ещё называют agent-исследователь или AI co-scientist) — это система, где языковая модель берёт на себя операции научного цикла: поиск и разбор литературы, формулировку гипотез, написание и запуск кода для анализа данных, интерпретацию результатов и оформление выводов с цитатами.

Ключевое отличие от привычного чат-бота — не «умнее модель», а архитектура. Это многоагентная оркестрация и автономный цикл «гипотеза → эксперимент → проверка → синтез», часто с песочницей для исполнения кода и доступом к научным базам (PubMed, arXiv, ChEMBL, UniProt).

Ландшафт мая 2026

За 2025–2026 направление перешло из демонстраций в рабочие продукты. Полезно держать в голове четыре разных класса систем — они решают разные задачи и по-разному рискованны.

КлассПримерыЧто делаетСтепень автономии
Веб-ассистенты по литературеElicit, Consensus, SciteПоиск, QA с цитатами, обзорыНизкая, человек ведёт
Многоагентные платформыFutureHouse, Google AI co-scientistЛитобзор, турнир гипотезСредняя
Автономные генераторыSakana AI Scientist-v2Пишет статью целикомВысокая, рискованно
Open-source фреймворкиEvoScientist, Kosmos, BioAgentsСборка своего пайплайнаНастраиваемая

Под капотом всех этих систем работают современные модели: Claude Opus 4.8 и 4.7, GPT-5.5 и GPT-5.5 Pro, Gemini 3.1 Pro, а в open-source-связках часто GLM 5.1 и Kimi K2.6. Сами по себе модели стали сильнее, но проблему достоверности это не сняло.

Почему сейчас — это не просто хайп

Использование ИИ исследователями за год выросло скачком, и это уже не ранние энтузиасты, а массовая практика. Цифры ниже — из отраслевых опросов 2025 года.

исследователей используют ИИ-инструменты (Wiley, 2025; было 57% в 2024) 84%
учёных обращались к ИИ за помощью в написании текстов (Nature) 57%
рецензентов из 111 стран применяли ИИ при рецензировании (Frontiers/Nature) >50%

Источники: Wiley newsroom, 2025, Nature d41586-025-01123-x, Nature d41586-025-04066-5.

Чем AI Scientist НЕ является

Здесь самое важное место урока. Маркетинг продаёт автономного учёного. Но даже статья системы Sakana AI Scientist-v2, формально прошедшая peer-review на воркшопе ICLR 2025, при внешней проверке содержала галлюцинации, сфабрикованные результаты, переоценку новизны и ошибки цитирования (например, неверную атрибуцию авторства LSTM).

Отсюда и доминирующая рабочая модель — human-on-the-loop. Человек не уходит из процесса, он стоит над петлёй: ставит задачу, проверяет ключевые развилки, отбраковывает выдуманное и отвечает за финальный вывод.

flowchart LR
    H[Человек: задача и контроль] --> A[Агент: цикл работы]
    A --> L[Поиск литературы]
    L --> Hy[Гипотезы]
    Hy --> E[Эксперимент в песочнице]
    E --> S[Синтез и отчёт]
    S --> V{Человек проверяет}
    V -- Ошибки, галлюцинации --> A
    V -- Принято как черновик --> OUT[Проверяемый артефакт]

    style H fill:#0891b2,color:#fff,stroke:#0e7490
    style V fill:#f59e0b,color:#fff,stroke:#d97706
    style OUT fill:#059669,color:#fff,stroke:#047857

Что это значит для вас на практике

Перед тем как открыть любой инструмент из трека, держите в голове три установки.

  • Агент хорош там, где результат легко проверить: код, который запускается; цитата, которую можно открыть; таблица, которую видно глазами.
  • Агент опасен там, где проверка дорогая: «обзор показал, что эффект значим», «новизна высокая», «это согласуется с литературой» — всё это требует ручной перепроверки.
  • Экономьте доверие, а не время. Сэкономленные на рутине часы тратьте на проверку, а не на новые запросы.

Следующий урок

Урок 2: Научный цикл и где в нём место агента — разложим исследование на стадии и поймём, что стоит делегировать, а что нельзя.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.