Обзор модуля
Юридический агент — не чёрный ящик. Под каждым «умным» разбором договора стоит чёткий конвейер: парсинг PDF, нарезка текста по пунктам, сравнение с правилами риска и поиск по прецедентной базе. Разобрав этот конвейер на составные части, вы перестанете воспринимать агента как магию и начнёте настраивать его под конкретную юрисдикцию и задачу.
Главный ориентир модуля — открытый проект Contract Review Agent (zahirnik/legal-agent): разбор договора в формате PDF, классификация 21 типа пунктов, скоринг риска от «низкого» до «критического», сравнение с рыночными бенчмарками и семантический поиск по тексту договора.
Важная оговорка с первых строк: бенчмарки этого проекта созданы под юрисдикцию Великобритании. Для работы с договорами по праву РФ правила риска нужно переписывать под ГК РФ — этому посвящён третий урок.
Чему вы научитесь
- Описывать пошаговый конвейер contract-review агента: от PDF до отчёта.
- Объяснять, почему наивное разбиение текста по токенам ломает смысл юридического пункта, и применять clause-aware chunking.
- Читать и писать risk-rules в формате YAML, задавать красные флаги и пороговые значения.
- Оценивать применимость UK-бенчмарков к договорам по праву РФ и выстраивать собственные правила под ГК РФ.
- Разграничивать задачи, которые агент выполняет автоматически, и задачи, которые требуют решения квалифицированного юриста.
Контекст: зачем разбирать агента изнутри
Большинство команд, впервые внедряющих AI-разбор договоров, останавливаются на уровне «загружаем PDF, получаем комментарии». Это работает для простых случаев, но даёт неожиданные сбои на сложных пунктах, нестандартных формулировках или редких типах условий.
Понимание архитектуры позволяет диагностировать эти сбои. Если агент пропускает пункт об ответственности — скорее всего, проблема в chunking. Если он присваивает низкий риск одностороннему индемнити — значит, risk-rules не охватывают этот сценарий. Если поиск по договору возвращает нерелевантные фрагменты — вероятно, эмбеддинговая модель плохо обрабатывает юридический регистр.
Каждый из трёх уроков даёт инструмент для конкретного слоя конвейера.
Уроки модуля
- Анатомия contract-review агента Пошаговый конвейер от PDF до отчёта: парсинг, классификация 21 типа пунктов, скоринг риска, red flags и детект недостающих условий
- RAG по юридическим документам Почему наивный chunking по токенам ломает смысл пункта договора, как устроен clause-aware chunking, эмбеддинги и ChromaDB
- Risk-rules и рыночные бенчмарки Формализация красных флагов в YAML, сравнение с рыночным стандартом и почему UK-бенчмарки нельзя применять к договорам по праву РФ
Как проходить
- Идите по урокам последовательно: архитектура конвейера → механика поиска → настройка правил риска.
- Держите рядом текст любого договора, на котором вы хотите практиковаться. Используйте только обезличенные или учебные документы — не загружайте реальные договоры с персональными данными в публичные AI-сервисы.
- В третьем уроке сразу отмечайте, какие UK-правила из примера неприменимы к вашим договорам и что нужно заменить под ГК РФ.
После модуля
После прохождения модуля у вас должна появиться не абстрактная картина «AI анализирует договоры», а рабочее понимание трёх вещей: где в конвейере возникают ошибки, как настроить правила риска под российскую практику и где граница между автоматическим анализом и работой юриста.
Нормальный результат — черновик risk_rules.yaml для типового договора из вашей практики и понимание, какие данные нельзя передавать в публичные AI-сервисы.