Модуль m.2 · Урок 3
Урок 3: Gemini Gems + NotebookLM — работа с источниками и Audio Overview
Содержание
- Чему научитесь
- Почему NotebookLM — не «ещё один чат-бот»
- Audio Overview: 10-минутный подкаст из вашего досье
- Остальной арсенал NotebookLM
- Pinpoint — отдельный инструмент Google для журналистов
- Практикум: «30 PDF в NotebookLM за 10 минут»
- Gemini Gems: кастомные помощники в Google-экосистеме
- Когда Gemini + NotebookLM — правильный выбор
- Русская специфика
- Главное из урока
Чему научитесь
- Загружать в NotebookLM до 50 источников (PDF, YouTube, аудио) и получать ответы только из них — без галлюцинаций
- Генерировать Audio Overview на русском: 10-минутный подкаст из 30 документов за несколько минут
- Выбирать правильный режим Audio Overview: Deep Dive, Brief, Critique или Debate
- Собирать Gemini Gem с инструкциями 4-блочного формата Persona → Task → Context → Format
- Решать, какой из двух инструментов Google подходит под конкретную задачу
Для практики используем arckep.ru — все основные модели, без VPN, оплата рублями. Вы можете использовать любые другие сервисы.
В М.2.1 собрали голос редакции в Claude. В М.2.2 — автоматизировали рутину в ChatGPT. Этот урок — о том, что Google делает уникально хорошо: работа с вашими источниками и их аудио-разбор.
Сразу главное: NotebookLM — это то, с чего журналисту стоит начать знакомство с AI, независимо от остального стека. Его grounded-архитектура не имеет аналогов у крупных вендоров, а Audio Overview — единственная фича, которая превращает 30 PDF судебного досье в 10-минутный подкаст для редакции. Gemini Gems — уже бонус для тех, кто живёт в Google Workspace.
Почему NotebookLM — не «ещё один чат-бот»
У ChatGPT, Claude и Gemini одна общая проблема для журналиста: они отвечают из «памяти модели». Загруженные вами документы могут повлиять на ответ — а могут не повлиять. Модель свободно смешивает ваши источники с тем, что она где-то читала.
NotebookLM устроен принципиально иначе. Это grounded AI: он отвечает только на основе загруженных в notebook источников. Спросите о Наполеоне, не загрузив статью о Наполеоне — получите отказ. Это архитектурная, а не инструкционная защита от галлюцинаций.
Как это выглядит на практике:
| Что делает NotebookLM | Как проверить |
|---|---|
| К каждому утверждению — нумерованная ссылка на фрагмент источника | Клик по номеру открывает оригинал с подсветкой цитаты |
| Нет ответа «из общих знаний» — только цитаты и суммаризация ваших файлов | Попробуйте спросить о теме, которой нет в notebook — получите «в источниках нет информации» |
| Поддержка 300 источников в Plus (50 бесплатно) | Работает с полноценными досье, а не тремя PDF |
| Форматы: PDF, Google Docs, Word, txt, URL страниц, YouTube, аудиофайлы | Расшифровка интервью и видео — частый журналистский кейс |
YouTube и аудио — две самые ценные для расследователя позиции. Загрузили 5-часовую запись пресс-конференции — получили суммаризацию, ключевые цитаты, таймкоды. То же самое с видео с YouTube: вставляете URL, система сама снимает транскрипт.
Audio Overview: 10-минутный подкаст из вашего досье
Это та фича, которая отличает NotebookLM от всего остального. Два AI-ведущих обсуждают загруженные источники — не пересказывают один документ, а ведут разговор между материалами: «смотри, тут Иванов говорит одно, а в протоколе написано другое». Результат — живой аудио-разбор, который можно слушать в метро.
Четыре режима:
| Режим | Что делает | Когда использовать |
|---|---|---|
| Deep Dive (по умолчанию) | Живой разговор двух ведущих по всему корпусу | Редакционный брифинг по теме, ввод команды в материал |
| The Brief | Один голос, до 2 минут | Быстрый саммари для себя перед звонком |
| The Critique | Двое разбирают документ критически, указывают на слабые места | Разбор собственного черновика или чужого исследования |
| The Debate | Формальные дебаты двух хостов с противоположными позициями | Сложная тема, где у экспертов разные мнения — чтобы услышать обе стороны |
Ключевые параметры:
- Языки — 50+, включая русский (доступно с апреля 2025). Качество русского пока заметно ниже английского: интонация более синтетическая, но для внутренней работы годится.
- Длительность — Shorter / Default / Longer (последние две — только английский).
- Custom prompts — можно сфокусировать разбор: «обсуди только финансовые аспекты», «объясни как для читателя без юридического образования».
- Interactive Mode (пока только английский) — можно перебивать AI-хостов голосом и задавать вопросы, они отвечают на основе источников.
- Время генерации — несколько минут на 10-минутный подкаст.
Остальной арсенал NotebookLM
Audio Overview — главная витрина, но есть ещё четыре инструмента, которые стоят времени.
- Video Overviews — AI-генерация объясняющего видео по вашим источникам. Полезно для соцсетей и внутренних презентаций.
- Mind Maps — автоматическая визуальная карта связей в корпусе. Загрузили 40 документов — увидели, кто с кем связан, какие темы пересекаются. Незаменимо на этапе, когда вы ещё не знаете, «где история».
- Studio — генерация структурированных материалов из источников: briefing doc, FAQ, timeline, study guide. Это не подкаст, а текстовые форматы для команды.
- Shareable notebooks — расшарить ноутбук коллегам с правами «только просмотр» или «добавлять источники и задавать вопросы». Удобно для отдельных расследований.
Pinpoint — отдельный инструмент Google для журналистов
Это не NotebookLM и не Gemini. Pinpoint живёт в Google Journalist Studio — отдельном хабе для СМИ. Доступ выдаётся по заявке, бесплатно.
Что умеет Pinpoint:
- Поиск по архивам из тысяч документов (NotebookLM рассчитан на десятки)
- Расшифровка аудио и видео на десятках языков
- OCR для сканов и рукописных документов
- Автоматическое распознавание имён людей, организаций, мест, дат — с кликабельной фильтрацией
Pinpoint — это когда у вас не 30 PDF, а 3000 PDF после FOIA-запроса. Для таких объёмов NotebookLM не подойдёт, а Pinpoint справится. Если вы ведёте большие расследования — подайте заявку заранее, одобрение занимает несколько дней.
Практикум: «30 PDF в NotebookLM за 10 минут»
Сценарий — журналисту пришло судебное досье из 30 документов. Нужно за день войти в тему и выдать редакции брифинг.
Шаг 1. Завести notebook и загрузить все 30 PDF. Идёте на notebooklm.google.com, жмёте «Новый notebook», перетаскиваете все файлы. Каждый PDF обрабатывается несколько секунд.
Шаг 2. Запросить структурный разбор всего корпуса. Введите запрос:
Проанализируй все загруженные документы. Выдели:
1. Ключевые даты и события в хронологическом порядке
2. Всех упомянутых лиц с их ролями
3. Денежные суммы и транзакции
4. Противоречия между документами
К каждому пункту — прямая цитата и номер источника.
Если чего-то нет в источниках — честно скажи «в источниках не найдено».
Шаг 3. Проверить одну-две цитаты кликом. Это критично. NotebookLM галлюцинирует реже других систем, но не никогда. Убедитесь, что цитата действительно есть в оригинале — кликните по номеру ссылки, подсветится фрагмент в источнике.
Шаг 4. Запустить Audio Overview в режиме Deep Dive на русском. Перейдите в Studio → Audio Overview → выберите язык «Русский» → режим Deep Dive → добавьте custom prompt: «расскажи как коллегам-журналистам, что важно для редакции». Нажмите «Сгенерировать».
Шаг 5. Через 5 минут — готовый 10-минутный файл. Скачиваете MP3, закидываете в редакционный Telegram. Коллеги слушают в метро и приходят на планёрку подготовленными.
Шаг 6. Собрать Mind Map. В меню Notebook → «Mind Map». Получаете визуальную карту связей: кто с кем упомянут вместе, какие темы пересекаются. Часто именно на этом шаге видно, «где история» — какая связь между лицами в досье неочевидна и её стоит копать.
Итог за час: у вас текстовый саммари с проверяемыми цитатами, аудио-брифинг для команды и визуальная карта связей. До появления NotebookLM такая задача занимала у журналиста 2–3 дня.
Gemini Gems: кастомные помощники в Google-экосистеме
Gems — это кастомные версии Gemini с сохранёнными инструкциями. Концептуально — то же самое, что Custom GPT у ChatGPT или Project у Claude, но с одной уникальной для Google фичей: живая интеграция с Drive. Gem читает файлы прямо из Google Drive, не требуя повторной загрузки. Обновили документ в Drive — следующий запрос к Gem увидит новую версию.
Ключевые ограничения и особенности:
- Лимит инструкций — несколько тысяч символов (Google не публикует точную цифру; на практике — порядка 4000, ощутимо меньше 8000 у Custom GPT и без жёсткого лимита у Claude). Это заставляет быть лаконичным.
- Рекомендуемая структура от Google — четыре блока: Persona → Task → Context → Format.
- Внутри создания Gem есть фича «Use Gemini to re-write instructions» — встроенный промпт-генератор, который доводит ваш черновик до рекомендуемого формата.
- Поддерживаемые форматы загрузки: PDF, DOCX, файлы из Drive.
Пример инструкций для Gem «Редактор инфостиля» (в пределах 4000 знаков):
Persona:
Ты редактор русскоязычного издания, пишущего в традиции Максима Ильяхова
и Дэвида Огилви. Приоритет — ясность, экономия слов, факты над оценками.
Task:
На вход получаешь черновик статьи. На выход выдаёшь отредактированную
версию и отдельный список правок с обоснованием каждой.
Context:
Читатели — образованные взрослые, 30–50 лет. Темы — бизнес, технологии,
общество. Запрещены канцелярит, маркетинговая лексика, эмоциональные
эпитеты без фактов. Обязательны конкретные цифры, имена, даты.
Format:
1. Отредактированный текст в исходной структуре (заголовки, списки).
2. Список правок в таблице: «было → стало → причина».
3. В конце — три предложения по дальнейшему улучшению.
Такой Gem с привязанной папкой в Drive (например, «Стайлгайд редакции», «Примеры эталонных текстов») даёт на выходе согласованную редактуру по всем вашим материалам. Тот же подход, что со Styles в Claude — но через Google Drive, без повторной загрузки при каждом обновлении.
Когда Gemini + NotebookLM — правильный выбор
Берите, если:
- У вас 30+ источников — суд, архив, досье, серия отчётов. NotebookLM незаменим.
- Нужен аудио-разбор материалов для команды или для себя (подкаст в дорогу).
- Вы живёте в Google Workspace — Gems через Drive подхватывают документы без копирования.
- Работаете с мультимодальным материалом: видео с YouTube, аудиозапись интервью, сканы документов — NotebookLM покроет все форматы.
Не берите, если:
- Нужен авторский голос и редактура черновика — это к Claude (урок М.2.1).
- Нужна ежедневная автоматизация (утренний дайджест, мониторинг) — это к ChatGPT Tasks (урок М.2.2).
- Нужен живой веб с цитатами из актуальных новостей — это к Perplexity (следующий урок М.2.4).
Четыре «кабинета» не заменяют друг друга. Журналист, выстроивший все четыре, получает рабочий день, где каждый инструмент отвечает за свою задачу — и именно поэтому результат хороший.
Русская специфика
Аудио на русском — работает, но с оговоркой: интонация синтетическая, диалог двух хостов звучит менее естественно, чем на английском. Для внутреннего брифинга годится. Для публикации в качестве подкаста — пока нет, имеет смысл использовать ElevenLabs (к нему вернёмся в трек-специфичных уроках).
Токенайзер у Gemini к русскому относится так же, как у ChatGPT и Claude — русские тексты потребляют в 2–3 раза больше токенов, чем английские. Для длинных задач по русскому контенту рассматривайте GigaChat или YandexGPT — у них нативный русский токенайзер и они лучше по цене на объёмных задачах. Сравнение моделей и сценарии — в уроке М.1.3.
Главное из урока
- NotebookLM — grounded AI: отвечает только из ваших источников, каждая фраза кликабельна до оригинала. Единственная архитектурная защита от галлюцинаций среди крупных вендоров.
- Audio Overview — 10-минутный подкаст из 30 документов за 5 минут. Четыре режима: Deep Dive (дефолт), Brief, Critique, Debate. Русский поддерживается.
- 50 источников бесплатно, 300 в Plus. YouTube и аудиофайлы — ключевое отличие от конкурентов для расследовательской работы.
- Pinpoint — отдельный инструмент Google для журналистов (по заявке). Работает на масштабах тысяч документов, когда NotebookLM недостаточно.
- Gemini Gems — кастомные ассистенты с лимитом 4000 знаков инструкций. Уникальная сила — живая интеграция с Google Drive. Формат инструкций: Persona → Task → Context → Format.
- Три инструмента, три разные задачи: NotebookLM — ваша библиотека, Gems — ваш Drive-ассистент, Pinpoint — ваш архив на тысячи документов.
В следующем уроке М.2.4 — Perplexity Spaces и Pages. Четвёртый «кабинет» замыкает модуль: коллективная тетрадь редакции с возможностью публикации готовой статьи в один клик. Там же — Deep Research с комбинацией Claude-режима и GPT-режима, и Publishers Program для СМИ.