Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль s.7 · Урок 1

Урок 1: Капстоун — свой мини-проект от вопроса до отчёта

20 мин
s.7 / Урок 1 из 1

Чему вы научитесь

  • Связывать в один пайплайн всё из трека: литобзор (S.2), гипотезы (S.3), анализ данных (S.4), оркестрацию (S.5) и валидацию с оформлением (S.6).
  • Доводить мини-«open-ended» проект от научного вопроса до отчёта с инлайн-цитатами.
  • Применять критерии приёмки и чек-лист обязательной ручной проверки: цитаты, воспроизводимость кода, отсутствие галлюцинаций.
  • Осознанно проводить границу автономии агента и оставлять интерпретацию за собой.
  • Понимать, что результат капстоуна — черновик-гипотеза, а не готовое открытие.

Что вы собираете

Капстоун не приносит нового материала. Вы берёте навыки из пяти предыдущих модулей и прогоняете их через один маленький проект на понятном вам датасете.

Задача — пройти полный цикл своими руками: увидеть, где агент реально ускоряет работу, а где начинает уверенно выдумывать. Масштаб намеренно маленький: один вопрос, один датасет, один отчёт на 2–4 страницы.

Пошаговый план

План связывает модули S.2–S.6 в один проход. На каждом шаге заранее назначена точка приёмки — что именно вы проверите, прежде чем идти дальше.

  1. Шаг 0. Вопрос и датасет. Сформулируйте один научный вопрос одним предложением и возьмите небольшой датасет (CSV/Excel/таблица), который понимаете и можете проверить глазами. Приёмка: вопрос тестируем, данные открываются.
  2. Шаг 1. Литобзор (S.2). Соберите 10–20 релевантных статей, извлеките «метод, выборка, эффект» в таблицу, получите черновик обзора с инлайн-цитатами. Приёмка: каждую цитату открыли и сверили с текстом.
  3. Шаг 2. Гипотеза (S.3). Сгенерируйте 2–3 конкурирующие тестируемые гипотезы с предсказаниями, прогоните их через devil’s advocate. Приёмка: выбрана одна гипотеза с явным предсказанием, которое можно опровергнуть.
  4. Шаг 3. Анализ данных в песочнице (S.4). Агент пишет и исполняет код в изолированной песочнице: описательная статистика, проверка гипотезы, графики. Приёмка: код перезапускается с нуля и даёт те же числа.
  5. Шаг 4. Оркестрация (S.5). Если шагов много, разнесите роли (поиск, код, анализ, текст) и зафиксируйте, что куда передаётся. Приёмка: понятно, какой агент за какой артефакт отвечает.
  6. Шаг 5. Валидация по ScholarEval (S.6). Оцените находку по рубрике: rigor, reproducibility, novelty, limitations. Приёмка: честно проставлены ограничения, новизна не завышена.
  7. Шаг 6. Оформление (S.6). Соберите отчёт: вопрос, данные, метод, результат, ограничения, библиография. Приёмка: пройден чек-лист ручной проверки ниже.

Диаграмма пайплайна

Весь проект на одной картинке. Обратите внимание: человек стоит над петлёй и проверяет каждый артефакт перед переходом к следующему шагу.

flowchart TB
    Q[Шаг 0. Вопрос и датасет] --> L[Шаг 1. Литобзор · S.2]
    L --> Hy[Шаг 2. Гипотеза · S.3]
    Hy --> An[Шаг 3. Анализ в песочнице · S.4]
    An --> Or[Шаг 4. Оркестрация ролей · S.5]
    Or --> Val[Шаг 5. Валидация ScholarEval · S.6]
    Val --> Rep[Шаг 6. Отчёт с цитатами · S.6]
    Rep --> Check{Чек-лист ручной проверки}
    Check -- Битые цитаты, код не воспроизводится, галлюцинации --> L
    Check -- Принято как черновик-гипотеза --> Out[Проверяемый артефакт]

    style Q fill:#0891b2,color:#fff,stroke:#0e7490
    style Check fill:#f59e0b,color:#fff,stroke:#d97706
    style Out fill:#059669,color:#fff,stroke:#047857

Стрелка обратной связи — не формальность. Если на проверке всплыла битая цитата или невоспроизводимый код, вы возвращаетесь назад, а не «принимаете как есть, потому что в целом похоже на правду».

Критерии приёмки

Проект считается сданным, только когда выполнены все четыре блока. Это минимальная планка, а не пожелание.

КритерийЧто значит «принято»Как проверить
ЦитатыКаждая ссылка открывается и подтверждает утверждениеОткрыть источник, найти в нём конкретное место
ВоспроизводимостьКод запускается с нуля и даёт те же числаПерезапуск в чистой песочнице
Отсутствие галлюцинацийНет фактов, цифр и ссылок «из воздуха»Сверка каждого числа с данными или источником
ОграниченияЯвно названо, чего проект НЕ доказываетРаздел «ограничения» в отчёте непустой

Чек-лист ручной проверки

Пройдите его построчно перед тем, как считать проект готовым. Это не автоматизируемая часть — именно здесь работает человек.

  • Открыл каждую цитату и убедился, что она реальна и говорит то, что приписано.
  • Отличил «поддерживающую» цитату от «упоминающей» — источник действительно подтверждает тезис.
  • Перезапустил код анализа с нуля; числа в отчёте совпадают с выводом кода.
  • Проверил каждое число в тексте: оно либо из кода, либо из источника, не «округлено по памяти».
  • Убедился, что код исполнялся в песочнице, а не на основной машине с доступом к данным.
  • Проверил, что новизна и значимость не завышены: формулировки осторожные.
  • Заполнил раздел «ограничения»: что не учтено, на какой выборке, какие допущения.
  • Указал, какие шаги делал агент и какие модели использовались (раскрытие использования ИИ).

Идеи мини-проектов под разные аудитории

Выберите близкую область. Везде масштаб одинаковый: один вопрос, маленький датасет, отчёт на 2–4 страницы.

АудиторияВопрос-примерДатасетНа что смотреть при проверке
БиомедСвязан ли маркёр X с исходом Y в публичных данных?Открытый клинический CSV или single-cell выборкаСтатистика не путает корреляцию с причиной, выборка мала
Data scienceКакой признак сильнее объясняет отток в открытом датасете?Public Kaggle/UCI CSVУтечка данных в фичах, переобучение, метрика честная
ГуманитарииКак менялась частота темы X в корпусе текстов за период?Корпус статей или открытых текстовОчистка текста корректна, тренд не артефакт выборки

Поздравляем

Вы прошли трек целиком: от реалистичных ожиданий и техники безопасности до сквозного проекта своими руками. Главный вынос — не список инструментов, а привычка относиться к любому выводу агента как к черновику для проверки. Это и есть human-on-the-loop на практике.

Что дальше

Если хотите углубиться в смежные темы платформы:

Удачи в ваших исследованиях. Пусть агент ускоряет рутину, а выводы остаются за вами.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.