Модуль s.1 · Урок 3
Урок 3: Доступ из России — open-source, локальные модели и легальные опции
Чему вы научитесь
- Понимать, какие коммерческие API ограничены для пользователей из РФ и почему это критично для практики
- Выбирать между тремя стратегиями доступа: облако через VPN, провайдеры без ограничений, локальные модели
- Собирать рабочую связку для агента-исследователя на май 2026 без серых зон
- Запускать локальные модели через Ollama и LiteLLM, когда данные нельзя отдавать в облако
- Не отправить непубличный датасет третьей стороне по невнимательности
Почему это отдельный урок
Большинство громких инструментов трека — облачные и завязаны на API OpenAI, Anthropic или Google. OpenAI и Anthropic ограничивают доступ для России, поэтому без рабочей стратегии доступа курс остаётся теорией.
Хорошая новость: научный стек 2026 года мультипровайдерный. Open-source-системы (EvoScientist, Kosmos, BioAgents) умеют работать с разными бэкендами, включая локальные модели. Это снимает зависимость от одного облака.
Три рабочие стратегии
У вас есть три принципиально разных пути. Они не исключают друг друга — часто комбинируются под конкретную задачу.
| Стратегия | Плюсы | Минусы | Когда выбирать |
|---|---|---|---|
| Облако через VPN | Доступ к топ-моделям Claude и GPT | Юридические нюансы, оплата, данные уходят в облако | Публичные данные, нужна максимальная сила модели |
| Провайдеры без жёстких ограничений | Проще с оплатой и доступом | Список и условия меняются, нужна проверка | Когда облако удобнее локалки, но OpenAI закрыт |
| Локальные модели | Данные не покидают машину, нет лимитов API | Нужно железо, модели слабее флагманов | Чувствительные данные, воспроизводимость, офлайн |
Для трека про науку у локального пути есть особая ценность: он одновременно решает и доступ, и приватность, и воспроизводимость.
Приватность: главный риск в науке
Отправка непубличного датасета в облачную модель — это де-факто передача данных третьей стороне. Для неопубликованных результатов, медицинских или персональных данных это может быть прямым нарушением.
Локальная связка на практике
Минимальный self-hosted стек для агента-исследователя в мае 2026 выглядит так: локальный сервер моделей плюс прокси, который даёт совместимый с OpenAI API, чтобы фреймворки подключались без переписывания кода.
# 1. Ставим Ollama и тянем открытую модель
curl -fsSL https://ollama.com/install.sh | sh
ollama pull glm-4.5 # или другую open-weight модель под ваше железо
# 2. LiteLLM как прокси с OpenAI-совместимым endpoint
pip install litellm
litellm --model ollama/glm-4.5 --port 4000
# 3. Фреймворк агента указывает на локальный endpoint
export OPENAI_API_BASE="http://localhost:4000"
export OPENAI_API_KEY="local-dummy-key"
Логика связки: Ollama держит модель и веса локально, LiteLLM превращает её в привычный для инструментов OpenAI-совместимый интерфейс, а фреймворк агента просто видит «обычный» endpoint. Данные при этом не покидают машину.
Что выбрать под вашу задачу
- Публичные статьи и открытые датасеты — можно облако (через VPN или доступного провайдера), берите модель посильнее.
- Неопубликованные результаты, медицина, персональные данные — только локально или согласованный контур.
- Учитесь и хотите воспроизводимость — локальная связка даёт стабильность и независимость от смены тарифов и политик.
Следующий модуль
Модуль S.2: Литература и доказательная база — переходим к практике и самой массовой задаче исследователя.