Модуль s.3 · Урок 1

Урок 1: Генерация и ранжирование гипотез

20 мин

Содержание

Чему вы научитесь
Зачем агенту целый турнир
Роли агентов в турнире
Что делает гипотезу тестируемой
Как сформулировать запрос
Как отбирать сильнейшие
Следующий урок

s.3 / Урок 1 из 2

Чему вы научитесь

Формулировать запрос так, чтобы агент выдавал тестируемые гипотезы, а не общие рассуждения
Понимать архитектуру «турнира» Google AI co-scientist: роли Generation, Proximity, Reflection, Ranking, Evolution
Отличать тестируемую гипотезу с предсказанием от красивой, но непроверяемой формулировки
Отбирать сильнейшие гипотезы по критериям проверяемости, новизны и осуществимости
Использовать навык hypothesis-generation из Scientific Agent Skills как рабочий инструмент

Зачем агенту целый турнир

Если попросить чат-бота «предложи гипотезу», он обычно выдаёт одну гладкую формулировку — и она звучит убедительно независимо от того, верна ли. Это плохой режим для науки: одна идея без конкуренции не проверена ничем, кроме красноречия модели.

Google DeepMind в системе AI co-scientist подошёл иначе. Гипотезы не пишутся по одной, а проходят турнир: несколько специализированных агентов на базе Gemini генерируют множество кандидатов, сравнивают их попарно, критикуют и улучшают победителей. Выживают не самые красноречивые, а самые устойчивые к критике (DeepMind, AI co-scientist).

Роли агентов в турнире

В co-scientist разделение труда между агентами устроено вокруг одной цели — не сгенерировать побольше, а отобрать сильнейшее. Пять ролей работают как конвейер (DeepMind, AI co-scientist).

Агент	Что делает	Зачем это вам
Generation	Порождает много гипотез из вопроса и литературы	Широкий пул идей вместо одной
Proximity	Группирует похожие, убирает дубли	Не тонуть в перефразировках одной мысли
Reflection	Критикует: проверяемость, согласие с фактами	Ранний отсев слабых формулировок
Ranking	Сравнивает попарно, ведёт «турнирную таблицу»	Порядок предпочтения, а не плоский список
Evolution	Улучшает и скрещивает сильнейшие гипотезы	Идея становится острее от итерации к итерации

Важно, что это не линейный проход. Reflection и Ranking возвращают слабые гипотезы на доработку в Evolution, и цикл повторяется, пока качество кандидатов не перестаёт расти.

flowchart LR
    Q[Исследовательский вопрос] --> G[Generation: пул гипотез]
    G --> P[Proximity: убрать дубли]
    P --> R[Reflection: критика]
    R --> RK[Ranking: попарный турнир]
    RK --> E[Evolution: улучшить лидеров]
    E -. новый раунд .-> R
    RK --> OUT[Ранжированный список гипотез]

    style Q fill:#0891b2,color:#fff,stroke:#0e7490
    style R fill:#f59e0b,color:#fff,stroke:#d97706
    style OUT fill:#059669,color:#fff,stroke:#047857

Что делает гипотезу тестируемой

Турнир отбирает кандидатов, но критерий отбора задаёте вы. Главный из них — тестируемость. Гипотеза без предсказания и без способа её опровергнуть не гипотеза, а мнение.

Непроверяемая формулировка	Тестируемая гипотеза
«ИИ полезен для образования»	«Внедрение X повысит метрику Y на группе Z по сравнению с контролем»
«Этот белок важен для процесса»	«Нокаут гена A снизит экспрессию B на ≥30% в клетках линии C»
«Метод даёт лучшие результаты»	«Метод M снизит ошибку на датасете D ниже порога P при условиях U»

Хорошая гипотеза содержит три элемента: переменные (что меняем и что измеряем), направление и величину предсказания и условия проверки. Если хотя бы одного нет, отправляйте её обратно агенту на доработку.

Как сформулировать запрос

Сила турнира зависит от того, насколько точно вы задали вопрос и ограничения. Расплывчатый запрос даёт расплывчатый пул. Соберите промпт по шагам.

Дайте вопрос и контекст. Чётко: область, известные факты, доступные вам данные и методы.
Потребуйте формат. Для каждой гипотезы: формулировка, предсказание, как проверить, чем можно опровергнуть.
Задайте число и разнообразие. Например, 8-12 гипотез, явно непохожих друг на друга по механизму.
Включите самокритику. Попросите для каждой гипотезы указать слабое место и необходимое допущение.
Задайте критерии ранжирования. Проверяемость, новизна, осуществимость в ваших условиях.

Тот же конвейер можно запустить без облачной платформы. В Scientific Agent Skills есть навык hypothesis-generation — часть библиотеки из 140 навыков по стандарту Agent Skills, которая превращает обычного агента (Claude Code, Cursor, Gemini CLI) в инструмент для научной работы (Scientific Agent Skills).

Роль: ты помогаешь сформулировать тестируемые гипотезы.
Вопрос: <ваш исследовательский вопрос>
Контекст: известные факты, доступные данные и методы.

Сгенерируй 10 гипотез, явно различающихся по механизму. Для каждой укажи:
1. формулировку одним предложением,
2. конкретное предсказание (направление и величину),
3. как проверить за доступные ресурсы,
4. чем гипотезу можно опровергнуть,
5. главное слабое место и ключевое допущение.

Затем сравни их попарно и выдай ранжированный список по критериям:
проверяемость, новизна, осуществимость. Кратко объясни порядок.

Как отбирать сильнейшие

На выходе у вас ранжированный список. Не берите верхнюю строчку автоматически — агент ранжирует по своим внутренним оценкам, а решение за вами.

Проверяемость прежде всего: гипотезу без чёткого способа опровержения отбраковывайте, даже если она интересна.
Осуществимость в ваших условиях: можно ли это реально проверить с вашими данными, временем и оборудованием.
Разнообразие механизмов: оставьте 2-3 гипотезы с разной логикой, а не три варианта одной мысли.
Дешёвая первая проверка: при прочих равных вперёд идёт та, у которой первый эксперимент проще и быстрее.

Ключевые выводы

Просить «одну гипотезу» — плохой режим: одиночная идея не проверена ничем, кроме красноречия модели.
Google AI co-scientist строит турнир гипотез на Gemini: роли Generation, Proximity, Reflection, Ranking, Evolution.
Турнир нелинеен: Reflection и Ranking возвращают слабых кандидатов в Evolution, цикл повторяется.
Тестируемая гипотеза содержит переменные, предсказание с направлением и величиной и условия проверки.
Навык hypothesis-generation из Scientific Agent Skills запускает тот же конвейер на обычном агенте.
Отбирайте по проверяемости, осуществимости и разнообразию механизмов; верхняя строчка списка — не приговор.

Следующий урок

Урок 2: Критическое мышление и devil’s advocate — как научить агента и себя оспаривать собственные выводы, искать конфаундеры и альтернативные объяснения.

Мы размещаем рекламу, так как это позволяет нам готовить для вас свежие материалы и покрывать наши расходы. Рекламодателей выбираем адекватных.