Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль f.2 · Урок 3

Урок 3: Выбор LLM-провайдера — облако или локальная модель

35 мин
f.2 / Урок 3 из 3

Чему вы научитесь

  • Сравнивать облачные и локальные LLM по стоимости, качеству и доступности
  • Понимать, почему tool-calling критичен именно для финансового агента
  • Оценивать бюджет проекта до первого запроса
  • Знать барьеры доступа к зарубежным API из РФ и легальные альтернативы
  • Выбирать модель под задачу, а не «самую известную»

Два пути и их компромисс

У финансового агента есть два пути к «мозгу»: облачный API или локальная модель через Ollama. Выбор влияет на весь модуль данных и инструментов.

Облачные модели сильнее в tool-calling — а именно от него зависит, реально ли агент вызовет бэктест, а не выдумает результат. Локальные модели бесплатны в эксплуатации и не отправляют данные наружу, но в надёжном вызове инструментов обычно слабее.

КритерийОблачный APIЛокальная модель (Ollama)
СтоимостьПлата за токеныБесплатно после установки
Качество tool-callingВысокоеЗависит от модели, часто ниже
Приватность данныхДанные уходят провайдеруОстаются на вашей машине
Доступность из РФБарьер: оплата и доступБез барьеров
ЖелезоНе требуетсяНужен GPU или мощный CPU

Барьер доступа из РФ

Для российской аудитории это ключевой практический момент. Open-source проекты ставятся локально и работают на бесплатных данных, но требуют либо ключа зарубежного LLM (оплата и доступ — барьер), либо локальной модели.

flowchart TD
    Q[Нужен LLM для агента] --> P{Данные чувствительные?}
    P -->|Да| L[Локальная модель через Ollama]
    P -->|Нет| C{Есть доступ и оплата зарубежного API?}
    C -->|Да| API[Облачный API, сильный tool-calling]
    C -->|Нет| RU[RU-сервисы или локальная модель]

Как считать бюджет

Грубая прикидка до запуска экономит деньги. Расход токенов в агентных сценариях растёт быстро: каждый шаг рассуждения и каждый вызов инструмента добавляет контекст.

  • Оцените, сколько шагов делает агент на один разбор (часто 5–20 вызовов инструментов).
  • Умножьте на средний размер контекста и на цену провайдера за токены.
  • Для регулярной работы сравните это с разовой стоимостью железа под локальную модель.

Если агент гоняется редко и на учебных задачах — облачный API дешевле железа. Если запросов много и данные приватные — локальная модель окупается.



Следующий урок

Модуль f.3 → Урок 1: NL→стратегия→бэктест на Vibe-Trading — первый рабочий бэктест за один промпт.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.