Модуль m.5 · Урок 3
Урок 3: Суммаризация и извлечение цитат из интервью
Содержание
- Чему вы научитесь
- Что у нас есть после M.5.2
- Саммари интервью — три пути
- Извлечение кандидатов в цитаты
- Структура материала из интервью
- Специализированные сервисы: Castmagic и аналоги
- NotebookLM для архива интервью
- Пайплайн «от транскрипта до готового материала за 2 часа»
- Обязательная сверка с M.4.6
- Русский контекст
- Главное из урока
Чему вы научитесь
- Получать саммари часового интервью за 2 минуты через Claude Projects или NotebookLM
- Извлекать 10 кандидатов в цитаты с таймкодами одним промптом
- Собирать три варианта структуры материала (новость / лонгрид / колонка) и выбирать рабочий
- Различать, где AI заменяет рутину, а где финальный отбор обязан делать журналист
- Встраивать сверку каждой цитаты с оригинальной записью в пайплайн — защиту от иска о клевете
Для практики используем arckep.ru — все основные модели, без VPN, оплата рублями. Вы можете использовать любые другие сервисы.
Что у нас есть после M.5.2
На входе: транскрипт часового интервью с таймкодами на уровне слова и разметкой спикеров (SPEAKER_00 → Ведущий, SPEAKER_01 → Гость). Примерно 10 000 слов. Прочитать вручную и выделить три сильных цитаты — это 2–3 часа работы.
Дальше транскрипт разбирается по трём направлениям:
- Саммари — что главное, о чём говорил гость, какие тезисы, какие фактические утверждения
- Структура материала — во что превращается разговор: заметка на 800 знаков, лонгрид на 7 000 знаков, колонка от первого лица
- Кандидаты в цитаты — 5–10 реплик, которые стоит рассмотреть для включения в текст
AI хорошо делает первые две задачи и нормально подсказывает кандидатов. Финальный отбор цитат и архитектура материала остаются за журналистом. Ниже — как проходить эти этапы быстро и где ставить красные флажки.
Саммари интервью — три пути
Разные инструменты подходят под разные сценарии:
- Claude Projects (рекомендация по умолчанию). Загружаете транскрипт в Project, один раз задаёте стиль вашей редакции через Styles, дальше любой запрос работает в этом контексте. Briefing doc на 800 слов Claude отдаёт за 1–2 минуты. Преимущество — сохраняется архив по каждому гостю, можно возвращаться через месяц и спрашивать «о чём мы говорили»
- NotebookLM. Загружаете транскрипт одним из источников, получаете briefing doc + Audio Overview (двое AI-ведущих обсуждают интервью, 80+ языков включая русский). Плюс — каждое утверждение со ссылкой на фрагмент источника, архитектура анти-галлюцинации. Минус для русских редакций — Audio Overview на русском звучит искусственно, для работы с транскриптом это не мешает
- GPT с анализом данных. Если нужны расчёты по транскрипту (сколько минут говорил каждый спикер, как распределены темы по времени), ChatGPT с инструментом Data Analysis считает сам. Для стандартной статьи — избыточно
Для большинства редакционных задач достаточно Claude Projects. NotebookLM подключается, когда нужен архив 30+ интервью, и вы хотите искать по всему корпусу (об этом ниже).
Извлечение кандидатов в цитаты
Это центральный блок урока. Базовый промпт, который работает:
Вот транскрипт интервью с таймкодами и разметкой спикеров.
Найди 10 самых сильных реплик гостя (SPEAKER_01) — тех,
где он делает конкретное утверждение, открывает неочевидное,
признаёт проблему, приводит число или пример, либо говорит
от первого лица с эмоцией.
Верни в формате:
- Цитата дословно
- Таймкод начала
- Почему цитата сильная (одна строка)
- Риск: может ли быть вырвана из контекста (да/нет + почему)
Не редактируй формулировки. Не сокращай. Не улучшай.
На выходе — 10 кандидатов с обоснованием. По каждому журналист принимает решение: беру, не беру, беру с расширенным контекстом (две реплики вокруг, чтобы читатель видел, как гость пришёл к этой мысли).
Второе обязательное правило: перед публикацией каждая выбранная цитата сверяется с оригинальной аудиозаписью. Не с транскриптом — с записью. Whisper иногда путает глагол на похожий (успех → успел), переставляет порядок слов в русском, пропускает частицу «не». Пять минут прослушивания сверки — стандартная защита от иска о клевете.
Структура материала из интервью
Второй большой запрос к Claude после саммари:
На основе транскрипта предложи 3 варианта структуры материала:
1. Новость (800 знаков для ленты)
2. Лонгрид (7 000 знаков для сайта)
3. Колонка от первого лица автора (3 000 знаков)
Для каждого варианта дай:
- Предполагаемый лид (первые 2 предложения)
- 3 ключевые темы в порядке подачи
- Таймкоды мест, куда врезать цитаты
- Что останется за кадром и почему
На выходе — три архитектуры. Журналист выбирает одну и корректирует. Важно: это черновик структуры, не финальная версия. Настоящий материал рождается на пересечении того, что сказал гость, и того, что хочет сказать автор. AI видит только первое.
Полезная практика — после выбора структуры загрузить её обратно в Claude с командой «покажи противоречия: где в транскрипте гость говорит вещи, которые ломают выбранную мной структуру». Это способ поймать неудобные моменты, которые легко не заметить, когда уже решил, о чём пишешь.
Третий запрос полезен на границе с фактчеком: «выпиши из транскрипта все фактические утверждения гостя — цифры, даты, имена, географию, причинно-следственные связи — с таймкодами. Отдельно помечай утверждения, которые можно перепроверить публично, и те, которые держатся только на слове спикера». Этот список дальше уходит в пайплайн M.4.6: по нему быстро видно, где нужна триангуляция через независимые источники, а где достаточно атрибуции.
Специализированные сервисы: Castmagic и аналоги
Castmagic ($79/мес на тарифе Starter — 20 часов аудио в месяц; Hobby $21/мес даёт только 5 часов, castmagic.io) — самый известный в подкастерской среде. Загружаете аудио — автоматически получаете: show notes на 2–3 тысячи слов, выделенные цитаты с таймкодами, титры и описание эпизода, 10–15 постов для соцсетей, chapter markers для YouTube. Альтернативы по похожей цене: Podsqueeze, SummarAIze.
Для кого подходит:
- Подкастеры с регулярным графиком — каждую неделю новый эпизод, нужна обвязка одной кнопкой. Castmagic окупается с первого месяца
- Авторские каналы про AI, технологии, бизнес — посты в соцсетях и так лёгкие, глубина там не нужна. Автогенерация работает
- Небольшие редакции без контент-маркетолога — вся обвязка (рассылка, соцсети, блог) делается автоматом
Для кого не подходит:
- Журналистика серьёзных тем — расследования, интервью с чиновниками, темы с юридическими рисками. Castmagic оптимизирует под вовлечённость, не под точность. Show notes могут перефразировать опасно близко к искажению
- Редакции с собственным голосом — Castmagic пишет усреднённым подкастерским тоном. Через три выпуска ваши show notes звучат как у всех
Для журналистики рабочая связка другая: Whisper локально (M.5.2) → Claude Projects с вашим промптом и вашими стилями → ручная правка. Дольше на 20 минут, точнее в разы.
NotebookLM для архива интервью
Отдельный сценарий — когда у вас накопилось 30+ интервью за год. Загружаете все транскрипты в один NotebookLM-ноутбук (лимит — 50 источников в бесплатной версии, 300 в NotebookLM Plus). После этого доступны запросы по всему корпусу:
- «Покажи всё, что эксперт X говорил про тему Y за последний год»
- «Где мои гости противоречили друг другу по вопросу Z»
- «Найди повторяющиеся фразы — о чём люди говорят одними и теми же словами»
Каждое утверждение NotebookLM даёт со ссылкой на конкретный фрагмент источника, то есть вы кликаете и видите контекст. Это разворачивает архив из пассивного хранилища в рабочий инструмент. Подробнее про NotebookLM — в уроках M.2.3 и M.3.3.
Пайплайн «от транскрипта до готового материала за 2 часа»
Сводный план работы с часовым интервью:
| Шаг | Действие | Инструмент | Время |
|---|---|---|---|
| 1 | Саммари в briefing doc | Claude Projects | 2 мин |
| 2 | Извлечение 10 кандидатов в цитаты | Claude, промпт выше | 5 мин |
| 3 | Прослушивание каждой цитаты в оригинале | Плеер + транскрипт | 15 мин |
| 4 | Три варианта структуры материала | Claude, промпт выше | 5 мин |
| 5 | Написание чернового материала | Claude + ручная правка | 40–60 мин |
| 6 | Фактчек каждой цитаты по M.4.6 | M.4.6 | 15–30 мин |
| 7 | Финальная редактура | Ручная | 15–30 мин |
Итого — 2–3 часа вместо 6–8 часов без AI. Два жирных пункта — шаг 3 и шаг 6 — это не опциональные элементы. Пропустить их значит ставить свою подпись под текстом, который AI мог тихо исказить.
Обязательная сверка с M.4.6
Практический шорткат: после того как выбрали пять цитат в финал, откройте запись, поставьте таймкоды каждой цитаты в плеере, послушайте в 1.5× скорости. Пять цитат = 3–5 минут прослушивания. Этот маленький ритуал ловит 90% искажений и занимает меньше, чем вы потратите на ответ юристу.
Русский контекст
Для работы с русскими транскриптами стек выглядит так:
- Транскрипция — Whisper локально с antony66/whisper-large-v3-russian (см. M.5.2). 6,39% WER, диаризация, приватность
- Саммари и цитаты — Claude Projects через arckep.ru, без VPN, оплата рублями. Альтернатива — GigaChat 2 MAX (Сбер): в 2–5× дешевле Claude по input-токенам, иногда лучше понимает разговорный русский, «сжатый» язык бюрократов, региональные обороты. Для длинных транскриптов экономия заметная
- Архив интервью — NotebookLM через тот же arckep, или Perplexity Spaces как коллективная «тетрадь» редакции
- Чувствительные интервью (источники под угрозой, расследования) — весь пайплайн локально: Whisper локально + локальный LLM через Ollama. Ollama запускает модели уровня Llama 3.1 или Qwen на вашем ноутбуке, без интернета. Разбирать в этом уроке не будем — упоминаем как опцию, к которой возвращаемся в модуле про проекты редакции
Практическое правило: для 90% интервью достаточно Whisper локально + Claude через arckep. Локальная LLM нужна только там, где сам факт обращения к облаку может подставить источника.
Главное из урока
AI на этапе после транскрипции делает три вещи: саммари, кандидаты в цитаты, варианты структуры материала. Это рутина, которая без AI занимает половину рабочего дня, а с AI — 15–20 минут. Качественно.
Два обязательных ритуала, без которых пайплайн не работает. Первый — финальный отбор цитат и финальная архитектура материала за журналистом. AI не знает редполитики, не слышит иронию и не умеет выбирать между «важной» и «яркой» репликой. Второй — каждая цитата перед публикацией прослушивается в оригинальной записи. Это пять минут работы и единственная защита от юридических последствий.
Castmagic и аналоги — хороший инструмент для подкастеров. Для журналистики серьёзных тем — Whisper локально + Claude Projects с вашим промптом, потому что точность оказывается важнее скорости.
В следующем уроке — M.5.4 «Text-based редактура в Descript»: как после транскрипта и саммари править само аудио текстом — удалять паузы, мычания, куски, которые не должны попасть в финальную запись, без захода в Audition или Premiere.