Модуль f.2 · Урок 3
Урок 3: Выбор LLM-провайдера — облако или локальная модель
Чему вы научитесь
- Сравнивать облачные и локальные LLM по стоимости, качеству и доступности
- Понимать, почему tool-calling критичен именно для финансового агента
- Оценивать бюджет проекта до первого запроса
- Знать барьеры доступа к зарубежным API из РФ и легальные альтернативы
- Выбирать модель под задачу, а не «самую известную»
Два пути и их компромисс
У финансового агента есть два пути к «мозгу»: облачный API или локальная модель через Ollama. Выбор влияет на весь модуль данных и инструментов.
Облачные модели сильнее в tool-calling — а именно от него зависит, реально ли агент вызовет бэктест, а не выдумает результат. Локальные модели бесплатны в эксплуатации и не отправляют данные наружу, но в надёжном вызове инструментов обычно слабее.
| Критерий | Облачный API | Локальная модель (Ollama) |
|---|---|---|
| Стоимость | Плата за токены | Бесплатно после установки |
| Качество tool-calling | Высокое | Зависит от модели, часто ниже |
| Приватность данных | Данные уходят провайдеру | Остаются на вашей машине |
| Доступность из РФ | Барьер: оплата и доступ | Без барьеров |
| Железо | Не требуется | Нужен GPU или мощный CPU |
Барьер доступа из РФ
Для российской аудитории это ключевой практический момент. Open-source проекты ставятся локально и работают на бесплатных данных, но требуют либо ключа зарубежного LLM (оплата и доступ — барьер), либо локальной модели.
flowchart TD
Q[Нужен LLM для агента] --> P{Данные чувствительные?}
P -->|Да| L[Локальная модель через Ollama]
P -->|Нет| C{Есть доступ и оплата зарубежного API?}
C -->|Да| API[Облачный API, сильный tool-calling]
C -->|Нет| RU[RU-сервисы или локальная модель]
Как считать бюджет
Грубая прикидка до запуска экономит деньги. Расход токенов в агентных сценариях растёт быстро: каждый шаг рассуждения и каждый вызов инструмента добавляет контекст.
- Оцените, сколько шагов делает агент на один разбор (часто 5–20 вызовов инструментов).
- Умножьте на средний размер контекста и на цену провайдера за токены.
- Для регулярной работы сравните это с разовой стоимостью железа под локальную модель.
Если агент гоняется редко и на учебных задачах — облачный API дешевле железа. Если запросов много и данные приватные — локальная модель окупается.
Следующий урок
Модуль f.3 → Урок 1: NL→стратегия→бэктест на Vibe-Trading — первый рабочий бэктест за один промпт.