Обзор модуля
Здесь мы собираем не демо, а агента, который выдержит реальную нагрузку. Модуль построен по мотивам учебного курса The Neural Maze («колл-центр агентства недвижимости») и закрывает четыре боли продакшена.
Двусторонняя телефония, ответы по реальным данным компании, контроль качества голоса через собственные STT/TTS и, главное, наблюдаемость: вы должны измерять латентность и качество диалогов, а не оценивать их «на глаз».
Что внутри
Четыре урока, каждый закрывает один production-разрыв. Это самый инженерный модуль трека: пригодятся Python, контейнеры и понимание, что такое RAG и трейсинг.
Уроки модуля
Входящие и исходящие звонки через Twilio и FastRTC— двусторонняя телефонияRAG и поиск по данным во время разговора— агент отвечает по реальным данным компанииСвои STT и TTS, деплой на GPU— контроль качества и стоимости голосаObservability и оценка качества диалогов— измерять и улучшать, а не угадывать
Как проходить
- Этот модуль идёт после v.2 и v.3: предполагается, что вы уже понимаете realtime API и транспортный слой
- Не обязательно поднимать GPU сразу: урок про свои STT/TTS можно пройти как разбор архитектуры, а потом вернуться к практике
- Observability ставьте с самого начала, а не «когда будет время»: без метрик латентности вы не поймёте, почему агент кажется «тупым»