Модуль s.3 · Урок 1
Урок 1: Генерация и ранжирование гипотез
Чему вы научитесь
- Формулировать запрос так, чтобы агент выдавал тестируемые гипотезы, а не общие рассуждения
- Понимать архитектуру «турнира» Google AI co-scientist: роли Generation, Proximity, Reflection, Ranking, Evolution
- Отличать тестируемую гипотезу с предсказанием от красивой, но непроверяемой формулировки
- Отбирать сильнейшие гипотезы по критериям проверяемости, новизны и осуществимости
- Использовать навык hypothesis-generation из Scientific Agent Skills как рабочий инструмент
Зачем агенту целый турнир
Если попросить чат-бота «предложи гипотезу», он обычно выдаёт одну гладкую формулировку — и она звучит убедительно независимо от того, верна ли. Это плохой режим для науки: одна идея без конкуренции не проверена ничем, кроме красноречия модели.
Google DeepMind в системе AI co-scientist подошёл иначе. Гипотезы не пишутся по одной, а проходят турнир: несколько специализированных агентов на базе Gemini генерируют множество кандидатов, сравнивают их попарно, критикуют и улучшают победителей. Выживают не самые красноречивые, а самые устойчивые к критике (DeepMind, AI co-scientist).
Роли агентов в турнире
В co-scientist разделение труда между агентами устроено вокруг одной цели — не сгенерировать побольше, а отобрать сильнейшее. Пять ролей работают как конвейер (DeepMind, AI co-scientist).
| Агент | Что делает | Зачем это вам |
|---|---|---|
| Generation | Порождает много гипотез из вопроса и литературы | Широкий пул идей вместо одной |
| Proximity | Группирует похожие, убирает дубли | Не тонуть в перефразировках одной мысли |
| Reflection | Критикует: проверяемость, согласие с фактами | Ранний отсев слабых формулировок |
| Ranking | Сравнивает попарно, ведёт «турнирную таблицу» | Порядок предпочтения, а не плоский список |
| Evolution | Улучшает и скрещивает сильнейшие гипотезы | Идея становится острее от итерации к итерации |
Важно, что это не линейный проход. Reflection и Ranking возвращают слабые гипотезы на доработку в Evolution, и цикл повторяется, пока качество кандидатов не перестаёт расти.
flowchart LR
Q[Исследовательский вопрос] --> G[Generation: пул гипотез]
G --> P[Proximity: убрать дубли]
P --> R[Reflection: критика]
R --> RK[Ranking: попарный турнир]
RK --> E[Evolution: улучшить лидеров]
E -. новый раунд .-> R
RK --> OUT[Ранжированный список гипотез]
style Q fill:#0891b2,color:#fff,stroke:#0e7490
style R fill:#f59e0b,color:#fff,stroke:#d97706
style OUT fill:#059669,color:#fff,stroke:#047857
Что делает гипотезу тестируемой
Турнир отбирает кандидатов, но критерий отбора задаёте вы. Главный из них — тестируемость. Гипотеза без предсказания и без способа её опровергнуть не гипотеза, а мнение.
| Непроверяемая формулировка | Тестируемая гипотеза |
|---|---|
| «ИИ полезен для образования» | «Внедрение X повысит метрику Y на группе Z по сравнению с контролем» |
| «Этот белок важен для процесса» | «Нокаут гена A снизит экспрессию B на ≥30% в клетках линии C» |
| «Метод даёт лучшие результаты» | «Метод M снизит ошибку на датасете D ниже порога P при условиях U» |
Хорошая гипотеза содержит три элемента: переменные (что меняем и что измеряем), направление и величину предсказания и условия проверки. Если хотя бы одного нет, отправляйте её обратно агенту на доработку.
Как сформулировать запрос
Сила турнира зависит от того, насколько точно вы задали вопрос и ограничения. Расплывчатый запрос даёт расплывчатый пул. Соберите промпт по шагам.
- Дайте вопрос и контекст. Чётко: область, известные факты, доступные вам данные и методы.
- Потребуйте формат. Для каждой гипотезы: формулировка, предсказание, как проверить, чем можно опровергнуть.
- Задайте число и разнообразие. Например, 8-12 гипотез, явно непохожих друг на друга по механизму.
- Включите самокритику. Попросите для каждой гипотезы указать слабое место и необходимое допущение.
- Задайте критерии ранжирования. Проверяемость, новизна, осуществимость в ваших условиях.
Тот же конвейер можно запустить без облачной платформы. В Scientific Agent Skills есть навык hypothesis-generation — часть библиотеки из 140 навыков по стандарту Agent Skills, которая превращает обычного агента (Claude Code, Cursor, Gemini CLI) в инструмент для научной работы (Scientific Agent Skills).
Роль: ты помогаешь сформулировать тестируемые гипотезы.
Вопрос: <ваш исследовательский вопрос>
Контекст: известные факты, доступные данные и методы.
Сгенерируй 10 гипотез, явно различающихся по механизму. Для каждой укажи:
1. формулировку одним предложением,
2. конкретное предсказание (направление и величину),
3. как проверить за доступные ресурсы,
4. чем гипотезу можно опровергнуть,
5. главное слабое место и ключевое допущение.
Затем сравни их попарно и выдай ранжированный список по критериям:
проверяемость, новизна, осуществимость. Кратко объясни порядок.
Как отбирать сильнейшие
На выходе у вас ранжированный список. Не берите верхнюю строчку автоматически — агент ранжирует по своим внутренним оценкам, а решение за вами.
- Проверяемость прежде всего: гипотезу без чёткого способа опровержения отбраковывайте, даже если она интересна.
- Осуществимость в ваших условиях: можно ли это реально проверить с вашими данными, временем и оборудованием.
- Разнообразие механизмов: оставьте 2-3 гипотезы с разной логикой, а не три варианта одной мысли.
- Дешёвая первая проверка: при прочих равных вперёд идёт та, у которой первый эксперимент проще и быстрее.
Следующий урок
Урок 2: Критическое мышление и devil’s advocate — как научить агента и себя оспаривать собственные выводы, искать конфаундеры и альтернативные объяснения.