Модуль s.6 · Урок 2

Урок 2: Этика и риски — чек-лист ответственного использования

20 мин

Содержание

Чему вы научитесь
Кейс, с которого стоит начать
Четыре типа ошибок, которые надо ловить
Воспроизводимость: скепсис к метрикам
Политики журналов и раскрытие ИИ
Конфиденциальность данных
Чек-лист ответственного использования
Следующий урок

s.6 / Урок 2 из 3

Чему вы научитесь

Понимать главный риск ИИ в науке на конкретном кейсе, прошедшем peer-review
Различать галлюцинации, фабрикации, переоценку новизны и ошибки цитирования
Объяснять, почему скепсис к маркетинговым метрикам — это гигиена, а не цинизм
Знать, что требуют политики журналов по раскрытию использования ИИ
Применять явный чек-лист ответственного использования перед публикацией результата

Кейс, с которого стоит начать

В 2025 году система Sakana AI Scientist-v2 стала первой, чья полностью сгенерированная ИИ статья прошла peer-review на воркшопе ICLR 2025 с оценками 6/7/6 (Sakana paper). Звучит как победа автономной науки. На деле это лучший учебный пример рисков.

При внешней проверке статья содержала галлюцинации, сфабрикованные результаты, переоценку собственной новизны и ошибки цитирования — в том числе неверную атрибуцию авторства LSTM (byteiota). Рецензенты поставили проходные баллы, но достоверность от этого не появилась.

Четыре типа ошибок, которые надо ловить

Полезно держать в голове, какие именно дефекты прячутся за уверенным тоном.

Тип дефекта	Как проявляется	Как ловить
Галлюцинация	Уверенное утверждение без основания в данных	Требовать ссылку на источник и открывать её
Фабрикация результата	Числа и таблицы, которых нет в реальном анализе	Перезапускать код, сверять с сырыми данными
Переоценка новизны	«Впервые показано», хотя работа уже есть	Искать похожие публикации руками
Ошибка цитирования	Неверная атрибуция, несуществующая статья	Проверять DOI и авторство каждой ссылки

Все четыре дефекта присутствовали в кейсе Sakana одновременно. Это не редкость и не злой умысел — так устроены языковые модели, и поэтому проверка обязательна.

Воспроизводимость: скепсис к метрикам

Отдельный урок дают честные open-source-проекты. Реализация Kosmos (jimmc414) прямо пишет в README: заявленные в исходной статье 79.4% достоверности научных утверждений и 7 валидированных открытий в этой реализации НЕ воспроизведены — архитектура есть, а валидация результатов не проведена (README Kosmos).

Есть и системный риск: исследование в Nature указывает, что ИИ-инструменты повышают индивидуальную продуктивность, но могут сужать тематическое разнообразие науки (Nature s41586-025-09922-y). Стоит замечать, не ведёт ли агент вас по самой проторённой дорожке.

Политики журналов и раскрытие ИИ

Многие журналы либо ограничивают использование ИИ, либо требуют его явного раскрытия. При этом дисциплина хромает: больше половины рецензентов из опроса применяли ИИ при рецензировании вопреки правилам (Nature d41586-025-04066-5).

flowchart TD
    A[Использовали ИИ в работе] --> B{Что требует журнал?}
    B -- Раскрытие --> C[Указать, где и как применялся ИИ]
    B -- Запрет на часть задач --> D[Не использовать ИИ там, где нельзя]
    C --> E[Проверить факты и цитаты самим]
    D --> E
    E --> F[Подавать рукопись]

    style A fill:#0891b2,color:#fff,stroke:#0e7490
    style E fill:#f59e0b,color:#fff,stroke:#d97706
    style F fill:#059669,color:#fff,stroke:#047857

Правило простое: перед подачей открывайте актуальную политику конкретного журнала по ИИ и следуйте ей буквально. Ответственность за раскрытие — на авторе, а не на инструменте.

Конфиденциальность данных

Отправка непубличного датасета в облачную LLM фактически равна публикации этих данных третьей стороне. Для пациентских, коммерческих или иных чувствительных данных это недопустимо без явного разрешения и оценки рисков.

Если данные чувствительные — работайте на self-hosted или локальных моделях (например, связка LiteLLM с Ollama в Kosmos или локальные навыки), а не через публичные API. Эту развилку лучше решать до первого запроса, а не после.

Чек-лист ответственного использования

Пройдите его до того, как куда-либо отправлять результат.

Источники. Каждая ссылка открывается, DOI и авторство верны, цитата действительно подтверждает то, что написано.
Числа и таблицы. Все результаты воспроизведены повторным запуском кода на тех же данных, а не взяты из текста агента.
Новизна. Вы руками поискали похожие работы и не выдаёте известное за «впервые показанное».
Метрики. Маркетинговые проценты помечены как непроверенные, пока вы не воспроизвели их сами.
Раскрытие ИИ. Политика целевого журнала прочитана, использование ИИ раскрыто так, как требуется.
Данные. Чувствительные данные не уходили в облачные LLM; для них использованы локальные модели.
Ответственность. Вы готовы лично отвечать за каждое утверждение в артефакте, как если бы написали его без ИИ.

Ключевые выводы

Прохождение peer-review не гарантирует достоверность: статья Sakana с оценками 6/7/6 содержала галлюцинации, фабрикации, переоценку новизны и ошибки цитирования.
Ловить нужно четыре типа дефектов: галлюцинации, фабрикации, переоценку новизны и ошибки цитирования.
Open-source Kosmos честно не воспроизвёл заявленные 79.4% достоверности и 7 открытий — относитесь к метрикам скептически, пока не повторили их сами.
Перед подачей читайте политику журнала по раскрытию ИИ; чувствительные данные не отправляйте в облачные LLM.
Ответственность за каждое утверждение остаётся на человеке — пройдите чек-лист до отправки.

Следующий урок

Урок 3: Оформление результата — статья, постер, слайды — превратим проверенную находку в аккуратный воспроизводимый артефакт.

Мы размещаем рекламу, так как это позволяет нам готовить для вас свежие материалы и покрывать наши расходы. Рекламодателей выбираем адекватных.

Урок 2: Этика и риски — чек-лист ответственного использования

Валидация, этика и оформление

Чему вы научитесь

Кейс, с которого стоит начать

Четыре типа ошибок, которые надо ловить

Воспроизводимость: скепсис к метрикам

Политики журналов и раскрытие ИИ

Конфиденциальность данных

Чек-лист ответственного использования

Следующий урок

Рамка ответственности и кейсы санкций за выдуманные ссылки

Урок 2: Галлюцинации — не баг, а свойство

Урок 1: Почему фактчек — вопрос выживания в 2026

Рамка ответственности: AI помогает, а не заменяет врача

// Обсуждение

Чему вы научитесь

Кейс, с которого стоит начать

Четыре типа ошибок, которые надо ловить

Воспроизводимость: скепсис к метрикам

Политики журналов и раскрытие ИИ

Конфиденциальность данных

Чек-лист ответственного использования

Следующий урок

Связанные уроки

Рамка ответственности и кейсы санкций за выдуманные ссылки

Урок 2: Галлюцинации — не баг, а свойство

Урок 1: Почему фактчек — вопрос выживания в 2026

Рамка ответственности: AI помогает, а не заменяет врача

// Обсуждение