Модуль m.5 · Урок 3

Урок 3: Суммаризация и извлечение цитат из интервью

25 мин

Содержание

Чему вы научитесь
Что у нас есть после M.5.2
Саммари интервью — три пути
Извлечение кандидатов в цитаты
Структура материала из интервью
Специализированные сервисы: Castmagic и аналоги
NotebookLM для архива интервью
Пайплайн «от транскрипта до готового материала за 2 часа»
Обязательная сверка с M.4.6
Русский контекст
Главное из урока

m.5 / Урок 3 из 5

Чему вы научитесь

Получать саммари часового интервью за 2 минуты через Claude Projects или NotebookLM
Извлекать 10 кандидатов в цитаты с таймкодами одним промптом
Собирать три варианта структуры материала (новость / лонгрид / колонка) и выбирать рабочий
Различать, где AI заменяет рутину, а где финальный отбор обязан делать журналист
Встраивать сверку каждой цитаты с оригинальной записью в пайплайн — защиту от иска о клевете

Для практики используем arckep.ru — все основные модели, без VPN, оплата рублями. Вы можете использовать любые другие сервисы.

Что у нас есть после M.5.2

На входе: транскрипт часового интервью с таймкодами на уровне слова и разметкой спикеров (SPEAKER_00 → Ведущий, SPEAKER_01 → Гость). Примерно 10 000 слов. Прочитать вручную и выделить три сильных цитаты — это 2–3 часа работы.

Дальше транскрипт разбирается по трём направлениям:

Саммари — что главное, о чём говорил гость, какие тезисы, какие фактические утверждения
Структура материала — во что превращается разговор: заметка на 800 знаков, лонгрид на 7 000 знаков, колонка от первого лица
Кандидаты в цитаты — 5–10 реплик, которые стоит рассмотреть для включения в текст

AI хорошо делает первые две задачи и нормально подсказывает кандидатов. Финальный отбор цитат и архитектура материала остаются за журналистом. Ниже — как проходить эти этапы быстро и где ставить красные флажки.

Саммари интервью — три пути

Разные инструменты подходят под разные сценарии:

Claude Projects (рекомендация по умолчанию). Загружаете транскрипт в Project, один раз задаёте стиль вашей редакции через Styles, дальше любой запрос работает в этом контексте. Briefing doc на 800 слов Claude отдаёт за 1–2 минуты. Преимущество — сохраняется архив по каждому гостю, можно возвращаться через месяц и спрашивать «о чём мы говорили»
NotebookLM. Загружаете транскрипт одним из источников, получаете briefing doc + Audio Overview (двое AI-ведущих обсуждают интервью, 80+ языков включая русский). Плюс — каждое утверждение со ссылкой на фрагмент источника, архитектура анти-галлюцинации. Минус для русских редакций — Audio Overview на русском звучит искусственно, для работы с транскриптом это не мешает
GPT с анализом данных. Если нужны расчёты по транскрипту (сколько минут говорил каждый спикер, как распределены темы по времени), ChatGPT с инструментом Data Analysis считает сам. Для стандартной статьи — избыточно

Для большинства редакционных задач достаточно Claude Projects. NotebookLM подключается, когда нужен архив 30+ интервью, и вы хотите искать по всему корпусу (об этом ниже).

Извлечение кандидатов в цитаты

Это центральный блок урока. Базовый промпт, который работает:

Вот транскрипт интервью с таймкодами и разметкой спикеров.
Найди 10 самых сильных реплик гостя (SPEAKER_01) — тех,
где он делает конкретное утверждение, открывает неочевидное,
признаёт проблему, приводит число или пример, либо говорит
от первого лица с эмоцией.

Верни в формате:
- Цитата дословно
- Таймкод начала
- Почему цитата сильная (одна строка)
- Риск: может ли быть вырвана из контекста (да/нет + почему)

Не редактируй формулировки. Не сокращай. Не улучшай.

На выходе — 10 кандидатов с обоснованием. По каждому журналист принимает решение: беру, не беру, беру с расширенным контекстом (две реплики вокруг, чтобы читатель видел, как гость пришёл к этой мысли).

Второе обязательное правило: перед публикацией каждая выбранная цитата сверяется с оригинальной аудиозаписью. Не с транскриптом — с записью. Whisper иногда путает глагол на похожий (успех → успел), переставляет порядок слов в русском, пропускает частицу «не». Пять минут прослушивания сверки — стандартная защита от иска о клевете.

Структура материала из интервью

Второй большой запрос к Claude после саммари:

На основе транскрипта предложи 3 варианта структуры материала:
1. Новость (800 знаков для ленты)
2. Лонгрид (7 000 знаков для сайта)
3. Колонка от первого лица автора (3 000 знаков)

Для каждого варианта дай:
- Предполагаемый лид (первые 2 предложения)
- 3 ключевые темы в порядке подачи
- Таймкоды мест, куда врезать цитаты
- Что останется за кадром и почему

На выходе — три архитектуры. Журналист выбирает одну и корректирует. Важно: это черновик структуры, не финальная версия. Настоящий материал рождается на пересечении того, что сказал гость, и того, что хочет сказать автор. AI видит только первое.

Полезная практика — после выбора структуры загрузить её обратно в Claude с командой «покажи противоречия: где в транскрипте гость говорит вещи, которые ломают выбранную мной структуру». Это способ поймать неудобные моменты, которые легко не заметить, когда уже решил, о чём пишешь.

Третий запрос полезен на границе с фактчеком: «выпиши из транскрипта все фактические утверждения гостя — цифры, даты, имена, географию, причинно-следственные связи — с таймкодами. Отдельно помечай утверждения, которые можно перепроверить публично, и те, которые держатся только на слове спикера». Этот список дальше уходит в пайплайн M.4.6: по нему быстро видно, где нужна триангуляция через независимые источники, а где достаточно атрибуции.

Специализированные сервисы: Castmagic и аналоги

Castmagic ($79/мес на тарифе Starter — 20 часов аудио в месяц; Hobby $21/мес даёт только 5 часов, castmagic.io) — самый известный в подкастерской среде. Загружаете аудио — автоматически получаете: show notes на 2–3 тысячи слов, выделенные цитаты с таймкодами, титры и описание эпизода, 10–15 постов для соцсетей, chapter markers для YouTube. Альтернативы по похожей цене: Podsqueeze, SummarAIze.

Для кого подходит:

Подкастеры с регулярным графиком — каждую неделю новый эпизод, нужна обвязка одной кнопкой. Castmagic окупается с первого месяца
Авторские каналы про AI, технологии, бизнес — посты в соцсетях и так лёгкие, глубина там не нужна. Автогенерация работает
Небольшие редакции без контент-маркетолога — вся обвязка (рассылка, соцсети, блог) делается автоматом

Для кого не подходит:

Журналистика серьёзных тем — расследования, интервью с чиновниками, темы с юридическими рисками. Castmagic оптимизирует под вовлечённость, не под точность. Show notes могут перефразировать опасно близко к искажению
Редакции с собственным голосом — Castmagic пишет усреднённым подкастерским тоном. Через три выпуска ваши show notes звучат как у всех

Для журналистики рабочая связка другая: Whisper локально (M.5.2) → Claude Projects с вашим промптом и вашими стилями → ручная правка. Дольше на 20 минут, точнее в разы.

NotebookLM для архива интервью

Отдельный сценарий — когда у вас накопилось 30+ интервью за год. Загружаете все транскрипты в один NotebookLM-ноутбук (лимит — 50 источников в бесплатной версии, 300 в NotebookLM Plus). После этого доступны запросы по всему корпусу:

«Покажи всё, что эксперт X говорил про тему Y за последний год»
«Где мои гости противоречили друг другу по вопросу Z»
«Найди повторяющиеся фразы — о чём люди говорят одними и теми же словами»

Каждое утверждение NotebookLM даёт со ссылкой на конкретный фрагмент источника, то есть вы кликаете и видите контекст. Это разворачивает архив из пассивного хранилища в рабочий инструмент. Подробнее про NotebookLM — в уроках M.2.3 и M.3.3.

Пайплайн «от транскрипта до готового материала за 2 часа»

Сводный план работы с часовым интервью:

Шаг	Действие	Инструмент	Время
1	Саммари в briefing doc	Claude Projects	2 мин
2	Извлечение 10 кандидатов в цитаты	Claude, промпт выше	5 мин
3	Прослушивание каждой цитаты в оригинале	Плеер + транскрипт	15 мин
4	Три варианта структуры материала	Claude, промпт выше	5 мин
5	Написание чернового материала	Claude + ручная правка	40–60 мин
6	Фактчек каждой цитаты по M.4.6	M.4.6	15–30 мин
7	Финальная редактура	Ручная	15–30 мин

Итого — 2–3 часа вместо 6–8 часов без AI. Два жирных пункта — шаг 3 и шаг 6 — это не опциональные элементы. Пропустить их значит ставить свою подпись под текстом, который AI мог тихо исказить.

Обязательная сверка с M.4.6

AI фабрикует цитаты даже при работе с транскриптом

На этапе извлечения кандидатов Claude или GPT иногда подменяет слово на синоним, переставляет порядок слов, «улучшает» формулировку. Разница между «я не исключаю» и «я допускаю» — один юридический иск. Перед публикацией каждая цитата физически прослушивается в оригинальной записи. Это не паранойя, это единственная защита от иска о клевете (ст. 128.1 УК РФ и гражданский иск). Подробный пайплайн проверки — в M.4.6 «Пайплайн фактчека AI-черновика».

Практический шорткат: после того как выбрали пять цитат в финал, откройте запись, поставьте таймкоды каждой цитаты в плеере, послушайте в 1.5× скорости. Пять цитат = 3–5 минут прослушивания. Этот маленький ритуал ловит 90% искажений и занимает меньше, чем вы потратите на ответ юристу.

Русский контекст

Для работы с русскими транскриптами стек выглядит так:

Транскрипция — Whisper локально с antony66/whisper-large-v3-russian (см. M.5.2). 6,39% WER, диаризация, приватность
Саммари и цитаты — Claude Projects через arckep.ru, без VPN, оплата рублями. Альтернатива — GigaChat 2 MAX (Сбер): в 2–5× дешевле Claude по input-токенам, иногда лучше понимает разговорный русский, «сжатый» язык бюрократов, региональные обороты. Для длинных транскриптов экономия заметная
Архив интервью — NotebookLM через тот же arckep, или Perplexity Spaces как коллективная «тетрадь» редакции
Чувствительные интервью (источники под угрозой, расследования) — весь пайплайн локально: Whisper локально + локальный LLM через Ollama. Ollama запускает модели уровня Llama 3.1 или Qwen на вашем ноутбуке, без интернета. Разбирать в этом уроке не будем — упоминаем как опцию, к которой возвращаемся в модуле про проекты редакции

Практическое правило: для 90% интервью достаточно Whisper локально + Claude через arckep. Локальная LLM нужна только там, где сам факт обращения к облаку может подставить источника.

Главное из урока

AI на этапе после транскрипции делает три вещи: саммари, кандидаты в цитаты, варианты структуры материала. Это рутина, которая без AI занимает половину рабочего дня, а с AI — 15–20 минут. Качественно.

Два обязательных ритуала, без которых пайплайн не работает. Первый — финальный отбор цитат и финальная архитектура материала за журналистом. AI не знает редполитики, не слышит иронию и не умеет выбирать между «важной» и «яркой» репликой. Второй — каждая цитата перед публикацией прослушивается в оригинальной записи. Это пять минут работы и единственная защита от юридических последствий.

Castmagic и аналоги — хороший инструмент для подкастеров. Для журналистики серьёзных тем — Whisper локально + Claude Projects с вашим промптом, потому что точность оказывается важнее скорости.

В следующем уроке — M.5.4 «Text-based редактура в Descript»: как после транскрипта и саммари править само аудио текстом — удалять паузы, мычания, куски, которые не должны попасть в финальную запись, без захода в Audition или Premiere.

Мы размещаем рекламу, так как это позволяет нам готовить для вас свежие материалы и покрывать наши расходы. Рекламодателей выбираем адекватных.

Урок 3: Суммаризация и извлечение цитат из интервью

Интервью и аудио

Чему вы научитесь

Что у нас есть после M.5.2

Саммари интервью — три пути

Извлечение кандидатов в цитаты

Структура материала из интервью

Специализированные сервисы: Castmagic и аналоги

NotebookLM для архива интервью

Пайплайн «от транскрипта до готового материала за 2 часа»

Обязательная сверка с M.4.6

Русский контекст

Главное из урока

Урок 1: NotebookLM — загрузи свои книги и спрашивай по ним

Урок 1: Поиск и доказательный QA по статьям с цитатами

Урок 1: ИИ прямо внутри Word, Excel и PowerPoint

Урок t.6.3: Ролевые сценарии — оппонент в дебатах и интервью с исторической личностью

// Обсуждение

Чему вы научитесь

Что у нас есть после M.5.2

Саммари интервью — три пути

Извлечение кандидатов в цитаты

Структура материала из интервью

Специализированные сервисы: Castmagic и аналоги

NotebookLM для архива интервью

Пайплайн «от транскрипта до готового материала за 2 часа»

Обязательная сверка с M.4.6

Русский контекст

Главное из урока

Связанные уроки

Урок 1: NotebookLM — загрузи свои книги и спрашивай по ним

Урок 1: Поиск и доказательный QA по статьям с цитатами

Урок 1: ИИ прямо внутри Word, Excel и PowerPoint

Урок t.6.3: Ролевые сценарии — оппонент в дебатах и интервью с исторической личностью

// Обсуждение