Модуль f.2 · Урок 3

Урок 3: Выбор LLM-провайдера — облако или локальная модель

35 мин

Содержание

Чему вы научитесь
Два пути и их компромисс
Барьер доступа из РФ
Как считать бюджет
Следующий урок

f.2 / Урок 3 из 3

Чему вы научитесь

Сравнивать облачные и локальные LLM по стоимости, качеству и доступности
Понимать, почему tool-calling критичен именно для финансового агента
Оценивать бюджет проекта до первого запроса
Знать барьеры доступа к зарубежным API из РФ и легальные альтернативы
Выбирать модель под задачу, а не «самую известную»

Два пути и их компромисс

У финансового агента есть два пути к «мозгу»: облачный API или локальная модель через Ollama. Выбор влияет на весь модуль данных и инструментов.

Облачные модели сильнее в tool-calling — а именно от него зависит, реально ли агент вызовет бэктест, а не выдумает результат. Локальные модели бесплатны в эксплуатации и не отправляют данные наружу, но в надёжном вызове инструментов обычно слабее.

Критерий	Облачный API	Локальная модель (Ollama)
Стоимость	Плата за токены	Бесплатно после установки
Качество tool-calling	Высокое	Зависит от модели, часто ниже
Приватность данных	Данные уходят провайдеру	Остаются на вашей машине
Доступность из РФ	Барьер: оплата и доступ	Без барьеров
Железо	Не требуется	Нужен GPU или мощный CPU

Барьер доступа из РФ

Для российской аудитории это ключевой практический момент. Open-source проекты ставятся локально и работают на бесплатных данных, но требуют либо ключа зарубежного LLM (оплата и доступ — барьер), либо локальной модели.

flowchart TD
    Q[Нужен LLM для агента] --> P{Данные чувствительные?}
    P -->|Да| L[Локальная модель через Ollama]
    P -->|Нет| C{Есть доступ и оплата зарубежного API?}
    C -->|Да| API[Облачный API, сильный tool-calling]
    C -->|Нет| RU[RU-сервисы или локальная модель]

Как считать бюджет

Грубая прикидка до запуска экономит деньги. Расход токенов в агентных сценариях растёт быстро: каждый шаг рассуждения и каждый вызов инструмента добавляет контекст.

Оцените, сколько шагов делает агент на один разбор (часто 5–20 вызовов инструментов).
Умножьте на средний размер контекста и на цену провайдера за токены.
Для регулярной работы сравните это с разовой стоимостью железа под локальную модель.

Если агент гоняется редко и на учебных задачах — облачный API дешевле железа. Если запросов много и данные приватные — локальная модель окупается.

Ключевые выводы

Облако сильнее в tool-calling, локальная модель бесплатнее и приватнее — это и есть компромисс.
Для финансового агента надёжность вызова инструментов важнее общих бенчмарков.
Сильные облачные модели мая 2026: Claude Opus 4.8/4.7, GPT-5.5 и GPT-5.5 Pro, Gemini 3.1 Pro, Grok 4.20; локально — GLM 5.1, Kimi K2.6.
Доступ и оплата зарубежных API из РФ — реальный барьер, проверяйте на дату работы.
Считайте бюджет по числу шагов агента: токены в агентных сценариях расходуются быстро.

Следующий урок

Модуль f.3 → Урок 1: NL→стратегия→бэктест на Vibe-Trading — первый рабочий бэктест за один промпт.

Мы размещаем рекламу, так как это позволяет нам готовить для вас свежие материалы и покрывать наши расходы. Рекламодателей выбираем адекватных.

Урок 3: Выбор LLM-провайдера — облако или локальная модель

Данные и инструменты агента

Чему вы научитесь

Два пути и их компромисс

Барьер доступа из РФ

Как считать бюджет

Следующий урок

Обнаружение новых возможностей -- когда вышла фича, а агент не знает

Урок 2: Навыки (Agent Skills) и MCP

// Обсуждение

Чему вы научитесь

Два пути и их компромисс

Барьер доступа из РФ

Как считать бюджет

Следующий урок

Связанные уроки

Обнаружение новых возможностей -- когда вышла фича, а агент не знает

Урок 2: Навыки (Agent Skills) и MCP

// Обсуждение