Обзор модуля
Этот модуль задаёт общий словарь и ментальную модель для всего трека. Без него легко спутать «голосового бота из 2018 года» с современным realtime-агентом и неправильно оценить, что технология умеет сегодня.
Сначала вы разберётесь, где голосовой агент реально приносит деньги малому и среднему бизнесу, а где он бесполезен или вреден. Потом заглянете под капот звонка: из чего он собран, почему задержка важнее «ума» модели и что такое передача хода реплики.
Что внутри
Два коротких урока, которые лучше пройти подряд. Первый отвечает на вопрос «зачем», второй — на вопрос «как это вообще работает». Дальше в треке мы будем постоянно возвращаться к понятиям отсюда: латентность, turn-taking, конвейер и speech-to-speech.
Уроки модуля
Что такое realtime голосовой агент и где он приносит деньги— сценарии, боли бизнеса и границы применимостиАнатомия звонка: конвейер против speech-to-speech— STT, LLM, TTS, единые realtime-модели, латентность и порог 800 мс
Как проходить
- Идите по порядку: второй урок опирается на сценарии из первого
- После модуля вы должны уметь объяснить коллеге, чем realtime-агент отличается от обычного IVR-меню и автоответчика
- Держите в голове один свой сценарий звонков — он понадобится в финальном проекте модуля v.5