Перейти к содержимому
NEWЧат с 15 ИИ-моделями — попробуйте бесплатно / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль m.5 · Урок 3

Урок 3: Суммаризация и извлечение цитат из интервью

25 мин
m.5 / Урок 3 из 5

Чему вы научитесь

  • Получать саммари часового интервью за 2 минуты через Claude Projects или NotebookLM
  • Извлекать 10 кандидатов в цитаты с таймкодами одним промптом
  • Собирать три варианта структуры материала (новость / лонгрид / колонка) и выбирать рабочий
  • Различать, где AI заменяет рутину, а где финальный отбор обязан делать журналист
  • Встраивать сверку каждой цитаты с оригинальной записью в пайплайн — защиту от иска о клевете

Для практики используем arckep.ru — все основные модели, без VPN, оплата рублями. Вы можете использовать любые другие сервисы.

Что у нас есть после M.5.2

На входе: транскрипт часового интервью с таймкодами на уровне слова и разметкой спикеров (SPEAKER_00 → Ведущий, SPEAKER_01 → Гость). Примерно 10 000 слов. Прочитать вручную и выделить три сильных цитаты — это 2–3 часа работы.

Дальше транскрипт разбирается по трём направлениям:

  • Саммари — что главное, о чём говорил гость, какие тезисы, какие фактические утверждения
  • Структура материала — во что превращается разговор: заметка на 800 знаков, лонгрид на 7 000 знаков, колонка от первого лица
  • Кандидаты в цитаты — 5–10 реплик, которые стоит рассмотреть для включения в текст

AI хорошо делает первые две задачи и нормально подсказывает кандидатов. Финальный отбор цитат и архитектура материала остаются за журналистом. Ниже — как проходить эти этапы быстро и где ставить красные флажки.

Саммари интервью — три пути

Разные инструменты подходят под разные сценарии:

  • Claude Projects (рекомендация по умолчанию). Загружаете транскрипт в Project, один раз задаёте стиль вашей редакции через Styles, дальше любой запрос работает в этом контексте. Briefing doc на 800 слов Claude отдаёт за 1–2 минуты. Преимущество — сохраняется архив по каждому гостю, можно возвращаться через месяц и спрашивать «о чём мы говорили»
  • NotebookLM. Загружаете транскрипт одним из источников, получаете briefing doc + Audio Overview (двое AI-ведущих обсуждают интервью, 80+ языков включая русский). Плюс — каждое утверждение со ссылкой на фрагмент источника, архитектура анти-галлюцинации. Минус для русских редакций — Audio Overview на русском звучит искусственно, для работы с транскриптом это не мешает
  • GPT с анализом данных. Если нужны расчёты по транскрипту (сколько минут говорил каждый спикер, как распределены темы по времени), ChatGPT с инструментом Data Analysis считает сам. Для стандартной статьи — избыточно

Для большинства редакционных задач достаточно Claude Projects. NotebookLM подключается, когда нужен архив 30+ интервью, и вы хотите искать по всему корпусу (об этом ниже).

Извлечение кандидатов в цитаты

Это центральный блок урока. Базовый промпт, который работает:

Вот транскрипт интервью с таймкодами и разметкой спикеров.
Найди 10 самых сильных реплик гостя (SPEAKER_01) — тех,
где он делает конкретное утверждение, открывает неочевидное,
признаёт проблему, приводит число или пример, либо говорит
от первого лица с эмоцией.

Верни в формате:
- Цитата дословно
- Таймкод начала
- Почему цитата сильная (одна строка)
- Риск: может ли быть вырвана из контекста (да/нет + почему)

Не редактируй формулировки. Не сокращай. Не улучшай.

На выходе — 10 кандидатов с обоснованием. По каждому журналист принимает решение: беру, не беру, беру с расширенным контекстом (две реплики вокруг, чтобы читатель видел, как гость пришёл к этой мысли).

Второе обязательное правило: перед публикацией каждая выбранная цитата сверяется с оригинальной аудиозаписью. Не с транскриптом — с записью. Whisper иногда путает глагол на похожий (успех → успел), переставляет порядок слов в русском, пропускает частицу «не». Пять минут прослушивания сверки — стандартная защита от иска о клевете.

Структура материала из интервью

Второй большой запрос к Claude после саммари:

На основе транскрипта предложи 3 варианта структуры материала:
1. Новость (800 знаков для ленты)
2. Лонгрид (7 000 знаков для сайта)
3. Колонка от первого лица автора (3 000 знаков)

Для каждого варианта дай:
- Предполагаемый лид (первые 2 предложения)
- 3 ключевые темы в порядке подачи
- Таймкоды мест, куда врезать цитаты
- Что останется за кадром и почему

На выходе — три архитектуры. Журналист выбирает одну и корректирует. Важно: это черновик структуры, не финальная версия. Настоящий материал рождается на пересечении того, что сказал гость, и того, что хочет сказать автор. AI видит только первое.

Полезная практика — после выбора структуры загрузить её обратно в Claude с командой «покажи противоречия: где в транскрипте гость говорит вещи, которые ломают выбранную мной структуру». Это способ поймать неудобные моменты, которые легко не заметить, когда уже решил, о чём пишешь.

Третий запрос полезен на границе с фактчеком: «выпиши из транскрипта все фактические утверждения гостя — цифры, даты, имена, географию, причинно-следственные связи — с таймкодами. Отдельно помечай утверждения, которые можно перепроверить публично, и те, которые держатся только на слове спикера». Этот список дальше уходит в пайплайн M.4.6: по нему быстро видно, где нужна триангуляция через независимые источники, а где достаточно атрибуции.

Специализированные сервисы: Castmagic и аналоги

Castmagic ($79/мес на тарифе Starter — 20 часов аудио в месяц; Hobby $21/мес даёт только 5 часов, castmagic.io) — самый известный в подкастерской среде. Загружаете аудио — автоматически получаете: show notes на 2–3 тысячи слов, выделенные цитаты с таймкодами, титры и описание эпизода, 10–15 постов для соцсетей, chapter markers для YouTube. Альтернативы по похожей цене: Podsqueeze, SummarAIze.

Для кого подходит:

  • Подкастеры с регулярным графиком — каждую неделю новый эпизод, нужна обвязка одной кнопкой. Castmagic окупается с первого месяца
  • Авторские каналы про AI, технологии, бизнес — посты в соцсетях и так лёгкие, глубина там не нужна. Автогенерация работает
  • Небольшие редакции без контент-маркетолога — вся обвязка (рассылка, соцсети, блог) делается автоматом

Для кого не подходит:

  • Журналистика серьёзных тем — расследования, интервью с чиновниками, темы с юридическими рисками. Castmagic оптимизирует под вовлечённость, не под точность. Show notes могут перефразировать опасно близко к искажению
  • Редакции с собственным голосом — Castmagic пишет усреднённым подкастерским тоном. Через три выпуска ваши show notes звучат как у всех

Для журналистики рабочая связка другая: Whisper локально (M.5.2) → Claude Projects с вашим промптом и вашими стилями → ручная правка. Дольше на 20 минут, точнее в разы.

NotebookLM для архива интервью

Отдельный сценарий — когда у вас накопилось 30+ интервью за год. Загружаете все транскрипты в один NotebookLM-ноутбук (лимит — 50 источников в бесплатной версии, 300 в NotebookLM Plus). После этого доступны запросы по всему корпусу:

  • «Покажи всё, что эксперт X говорил про тему Y за последний год»
  • «Где мои гости противоречили друг другу по вопросу Z»
  • «Найди повторяющиеся фразы — о чём люди говорят одними и теми же словами»

Каждое утверждение NotebookLM даёт со ссылкой на конкретный фрагмент источника, то есть вы кликаете и видите контекст. Это разворачивает архив из пассивного хранилища в рабочий инструмент. Подробнее про NotebookLM — в уроках M.2.3 и M.3.3.

Пайплайн «от транскрипта до готового материала за 2 часа»

Сводный план работы с часовым интервью:

ШагДействиеИнструментВремя
1Саммари в briefing docClaude Projects2 мин
2Извлечение 10 кандидатов в цитатыClaude, промпт выше5 мин
3Прослушивание каждой цитаты в оригиналеПлеер + транскрипт15 мин
4Три варианта структуры материалаClaude, промпт выше5 мин
5Написание чернового материалаClaude + ручная правка40–60 мин
6Фактчек каждой цитаты по M.4.6M.4.615–30 мин
7Финальная редактураРучная15–30 мин

Итого — 2–3 часа вместо 6–8 часов без AI. Два жирных пункта — шаг 3 и шаг 6 — это не опциональные элементы. Пропустить их значит ставить свою подпись под текстом, который AI мог тихо исказить.

Обязательная сверка с M.4.6

Практический шорткат: после того как выбрали пять цитат в финал, откройте запись, поставьте таймкоды каждой цитаты в плеере, послушайте в 1.5× скорости. Пять цитат = 3–5 минут прослушивания. Этот маленький ритуал ловит 90% искажений и занимает меньше, чем вы потратите на ответ юристу.

Русский контекст

Для работы с русскими транскриптами стек выглядит так:

  • Транскрипция — Whisper локально с antony66/whisper-large-v3-russian (см. M.5.2). 6,39% WER, диаризация, приватность
  • Саммари и цитаты — Claude Projects через arckep.ru, без VPN, оплата рублями. Альтернатива — GigaChat 2 MAX (Сбер): в 2–5× дешевле Claude по input-токенам, иногда лучше понимает разговорный русский, «сжатый» язык бюрократов, региональные обороты. Для длинных транскриптов экономия заметная
  • Архив интервью — NotebookLM через тот же arckep, или Perplexity Spaces как коллективная «тетрадь» редакции
  • Чувствительные интервью (источники под угрозой, расследования) — весь пайплайн локально: Whisper локально + локальный LLM через Ollama. Ollama запускает модели уровня Llama 3.1 или Qwen на вашем ноутбуке, без интернета. Разбирать в этом уроке не будем — упоминаем как опцию, к которой возвращаемся в модуле про проекты редакции

Практическое правило: для 90% интервью достаточно Whisper локально + Claude через arckep. Локальная LLM нужна только там, где сам факт обращения к облаку может подставить источника.

Главное из урока

AI на этапе после транскрипции делает три вещи: саммари, кандидаты в цитаты, варианты структуры материала. Это рутина, которая без AI занимает половину рабочего дня, а с AI — 15–20 минут. Качественно.

Два обязательных ритуала, без которых пайплайн не работает. Первый — финальный отбор цитат и финальная архитектура материала за журналистом. AI не знает редполитики, не слышит иронию и не умеет выбирать между «важной» и «яркой» репликой. Второй — каждая цитата перед публикацией прослушивается в оригинальной записи. Это пять минут работы и единственная защита от юридических последствий.

Castmagic и аналоги — хороший инструмент для подкастеров. Для журналистики серьёзных тем — Whisper локально + Claude Projects с вашим промптом, потому что точность оказывается важнее скорости.

В следующем уроке — M.5.4 «Text-based редактура в Descript»: как после транскрипта и саммари править само аудио текстом — удалять паузы, мычания, куски, которые не должны попасть в финальную запись, без захода в Audition или Premiere.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.