Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль s.3 · Урок 1

Урок 1: Генерация и ранжирование гипотез

20 мин
s.3 / Урок 1 из 2

Чему вы научитесь

  • Формулировать запрос так, чтобы агент выдавал тестируемые гипотезы, а не общие рассуждения
  • Понимать архитектуру «турнира» Google AI co-scientist: роли Generation, Proximity, Reflection, Ranking, Evolution
  • Отличать тестируемую гипотезу с предсказанием от красивой, но непроверяемой формулировки
  • Отбирать сильнейшие гипотезы по критериям проверяемости, новизны и осуществимости
  • Использовать навык hypothesis-generation из Scientific Agent Skills как рабочий инструмент

Зачем агенту целый турнир

Если попросить чат-бота «предложи гипотезу», он обычно выдаёт одну гладкую формулировку — и она звучит убедительно независимо от того, верна ли. Это плохой режим для науки: одна идея без конкуренции не проверена ничем, кроме красноречия модели.

Google DeepMind в системе AI co-scientist подошёл иначе. Гипотезы не пишутся по одной, а проходят турнир: несколько специализированных агентов на базе Gemini генерируют множество кандидатов, сравнивают их попарно, критикуют и улучшают победителей. Выживают не самые красноречивые, а самые устойчивые к критике (DeepMind, AI co-scientist).

Роли агентов в турнире

В co-scientist разделение труда между агентами устроено вокруг одной цели — не сгенерировать побольше, а отобрать сильнейшее. Пять ролей работают как конвейер (DeepMind, AI co-scientist).

АгентЧто делаетЗачем это вам
GenerationПорождает много гипотез из вопроса и литературыШирокий пул идей вместо одной
ProximityГруппирует похожие, убирает дублиНе тонуть в перефразировках одной мысли
ReflectionКритикует: проверяемость, согласие с фактамиРанний отсев слабых формулировок
RankingСравнивает попарно, ведёт «турнирную таблицу»Порядок предпочтения, а не плоский список
EvolutionУлучшает и скрещивает сильнейшие гипотезыИдея становится острее от итерации к итерации

Важно, что это не линейный проход. Reflection и Ranking возвращают слабые гипотезы на доработку в Evolution, и цикл повторяется, пока качество кандидатов не перестаёт расти.

flowchart LR
    Q[Исследовательский вопрос] --> G[Generation: пул гипотез]
    G --> P[Proximity: убрать дубли]
    P --> R[Reflection: критика]
    R --> RK[Ranking: попарный турнир]
    RK --> E[Evolution: улучшить лидеров]
    E -. новый раунд .-> R
    RK --> OUT[Ранжированный список гипотез]

    style Q fill:#0891b2,color:#fff,stroke:#0e7490
    style R fill:#f59e0b,color:#fff,stroke:#d97706
    style OUT fill:#059669,color:#fff,stroke:#047857

Что делает гипотезу тестируемой

Турнир отбирает кандидатов, но критерий отбора задаёте вы. Главный из них — тестируемость. Гипотеза без предсказания и без способа её опровергнуть не гипотеза, а мнение.

Непроверяемая формулировкаТестируемая гипотеза
«ИИ полезен для образования»«Внедрение X повысит метрику Y на группе Z по сравнению с контролем»
«Этот белок важен для процесса»«Нокаут гена A снизит экспрессию B на ≥30% в клетках линии C»
«Метод даёт лучшие результаты»«Метод M снизит ошибку на датасете D ниже порога P при условиях U»

Хорошая гипотеза содержит три элемента: переменные (что меняем и что измеряем), направление и величину предсказания и условия проверки. Если хотя бы одного нет, отправляйте её обратно агенту на доработку.

Как сформулировать запрос

Сила турнира зависит от того, насколько точно вы задали вопрос и ограничения. Расплывчатый запрос даёт расплывчатый пул. Соберите промпт по шагам.

  1. Дайте вопрос и контекст. Чётко: область, известные факты, доступные вам данные и методы.
  2. Потребуйте формат. Для каждой гипотезы: формулировка, предсказание, как проверить, чем можно опровергнуть.
  3. Задайте число и разнообразие. Например, 8-12 гипотез, явно непохожих друг на друга по механизму.
  4. Включите самокритику. Попросите для каждой гипотезы указать слабое место и необходимое допущение.
  5. Задайте критерии ранжирования. Проверяемость, новизна, осуществимость в ваших условиях.

Тот же конвейер можно запустить без облачной платформы. В Scientific Agent Skills есть навык hypothesis-generation — часть библиотеки из 140 навыков по стандарту Agent Skills, которая превращает обычного агента (Claude Code, Cursor, Gemini CLI) в инструмент для научной работы (Scientific Agent Skills).

Роль: ты помогаешь сформулировать тестируемые гипотезы.
Вопрос: <ваш исследовательский вопрос>
Контекст: известные факты, доступные данные и методы.

Сгенерируй 10 гипотез, явно различающихся по механизму. Для каждой укажи:
1. формулировку одним предложением,
2. конкретное предсказание (направление и величину),
3. как проверить за доступные ресурсы,
4. чем гипотезу можно опровергнуть,
5. главное слабое место и ключевое допущение.

Затем сравни их попарно и выдай ранжированный список по критериям:
проверяемость, новизна, осуществимость. Кратко объясни порядок.

Как отбирать сильнейшие

На выходе у вас ранжированный список. Не берите верхнюю строчку автоматически — агент ранжирует по своим внутренним оценкам, а решение за вами.

  • Проверяемость прежде всего: гипотезу без чёткого способа опровержения отбраковывайте, даже если она интересна.
  • Осуществимость в ваших условиях: можно ли это реально проверить с вашими данными, временем и оборудованием.
  • Разнообразие механизмов: оставьте 2-3 гипотезы с разной логикой, а не три варианта одной мысли.
  • Дешёвая первая проверка: при прочих равных вперёд идёт та, у которой первый эксперимент проще и быстрее.

Следующий урок

Урок 2: Критическое мышление и devil’s advocate — как научить агента и себя оспаривать собственные выводы, искать конфаундеры и альтернативные объяснения.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.