Модуль p.5 · Урок 3
Урок 3: CV контроль качества проката end-to-end — датасет Severstal Steel Defect, YOLO на production
Содержание
- Чему вы научитесь
- От benchmark-датасета к реальной линии
- Почему датасет Severstal стал отраслевым стандартом
- Как выглядит реальный pipeline CV-ОТК
- Какие модели действительно имеют смысл
- Сколько данных нужно на практике
- Что показывает практика металлургов
- Где тут место MES и почему без него проект недоделан
- Почему модель не переносится между заводами
- Как запускать end-to-end проект на линии
- Что делать дальше
Чему вы научитесь
- Понимать полный pipeline CV-контроля качества проката: от датасета и разметки до камер на линии и интеграции с MES
- Различать benchmark-датасет, пилотный прототип и production-grade систему ОТК
- Выбирать между supervised-детекцией и anomaly detection в зависимости от природы дефекта
- Читать кейс Severstal Steel Defect Detection как отраслевой стандарт подготовки данных, а не как Kaggle-развлечение
- Ловить главную проблему промышленного CV — распределение данных между линиями, сменами и заводами
В p.1/05 Северсталь уже выступала как российский ориентир по AI. Здесь фокус уже не на общей сумме эффекта, а на том, как устроен конкретный класс решений — surface defect detection на прокате. Это один из самых зрелых industrial AI-кейсов в металлургии, потому что здесь есть сразу всё: камеры, публичные датасеты, production-системы и понятная связь с KPI качества.
От benchmark-датасета к реальной линии
| Уровень | Что это такое | Для чего полезен | Чего не хватает |
|---|---|---|---|
| Публичный датасет | Severstal Steel Defect Detection, NEU-DET и другие наборы изображений | Дают стартовую проверку архитектур и пайплайна обучения | Не отражают все артефакты вашей линии, света, стали и камер |
| Пилот на архиве предприятия | Реальные фото одной линии, несколько типов дефектов, ручная разметка | Показывает, есть ли сигнал в ваших данных | Обычно мало негативных и редких случаев |
| Production CV | Камеры на линии, edge-инференс, триггеры в MES, подтверждение оператором | Даёт экономику и снижение рекламаций | Требует MLOps, повторной калибровки и поддержки 24/7 |
Почему датасет Severstal стал отраслевым стандартом
Kaggle competition Severstal: Steel Defect Detection вывела российский промышленный кейс в глобальный контур машинного зрения. В competition dataset — 18 074 изображения и 4 класса дефектов (Kaggle competition page). Рядом с ним обычно используют NEU Surface Defect Database с 1 800 изображениями и 6 классами поверхностных дефектов стали (Kaggle NEU dataset).
Это важно по двум причинам.
Во-первых, в металлургии появился публичный общий язык сравнения моделей. Во-вторых, стало видно, что реальные steel defects — это не игрушечная классификация на трёх классах, а задача с крайне неровным распределением, плохими границами дефекта и большим количеством «почти дефектов».
Как выглядит реальный pipeline CV-ОТК
flowchart LR
A[Камеры над линией проката] --> B[Сбор и архив кадров]
B --> C[Разметка в CVAT или Label Studio]
C --> D[Обучение Detectron2 / MMDetection / YOLO]
D --> E[Экспорт в ONNX / TensorRT / OpenVINO]
E --> F[Edge-инференс на линии]
F --> G[Событие в MES / quality system]
G --> H[Подтверждение оператора и обратная связь]
H --> I[Переобучение и drift control]Это почти один в один повторяет стек из p.9/03, только здесь добавляются металлургические ограничения:
- скорость линии;
- вибрация и пыль;
- отражения и блики на металле;
- длинные, узкие и плохо контрастные дефекты;
- высокая цена ложного пропуска и ложного брака.
Какие модели действительно имеют смысл
| Класс задачи | Что брать первым | Когда это работает | Где ломается |
|---|---|---|---|
| Явно размеченные типовые дефекты | Detectron2, MMDetection, YOLO-подобные detector-архитектуры | Когда классы дефектов известны и есть достаточно размеченных примеров | Когда дефекты слишком редкие или границы спорные |
| Редкие и плохо формализованные отклонения | Anomalib и one-class подходы | Когда проще учить «норму», чем все типы дефектов | Когда норма сама нестабильна и сильно плавает по продукту |
| Inline segmentation | U-Net / Mask-ориентированные модели | Когда важна глубина и геометрия дефекта, а не только факт его наличия | Когда слишком высокая скорость линии и ограниченный edge-budget |
В GitHub-сообществе вокруг датасета Severstal много сильных baseline-решений — от U-Net-подходов до современных detector-модификаций (TheoViel repo; khornlund repo; LZY-233 improved defect detection). Но production не начинается там, где закончился Kaggle. Он начинается там, где модель встретилась со светом, вибрацией, обрывами сети и оператором смены.
Сколько данных нужно на практике
Здесь нет честного универсального норматива. Но есть правило: прокат почти никогда не взлетает на «паре сотен картинок».
| Стадия | Реалистичный объём | Что с этим делать |
|---|---|---|
| Быстрый feasibility-check | Архив дефектов по 1–2 типам, желательно с негативными примерами | Проверить, вообще различим ли сигнал на ваших камерах |
| MVP | 5–20 тыс. изображений на одну линию — нужна проверка для конкретного участка | Настроить первый production-уровень с оператором в цикле |
| Устойчивый production | 50 тыс.+ изображений и постоянная подпитка новыми данными — нужна проверка | Закрывать drift по сменам, освещению, сортаменту и редким дефектам |
Если эти цифры кажутся большими — это не проблема AI. Это нормальная цена за систему, которая должна ловить редкий дефект на непрерывном процессе, а не сортировать котиков.
Что показывает практика металлургов
Северсталь публично говорит о внедрении AI-систем инспекции металлопроката на агрегатах перемотки рулонов (Metalinfo, 09.01.2025). По состоянию на 2025–2026 годы у компании отдельно видны контуры computer vision для контроля качества — 12 систем CV на ЧерМК, и отдельно контур безопасности — платформа СОВА (Metalinfo, 27.03.2025). Visillect в таких проектах полезнее рассматривать как внешнего CV-вендора, а не как собственный продукт Северстали.
Международный ориентир похожий: в учебных и отраслевых материалах часто приводят Voestalpine как пример снижения дефектов примерно на 20%, а ArcelorMittal Hamburg — как пример уменьшения обрези на 20%, но для точного сопоставления с конкретным переделом эти числа нужно перепроверять по первоисточнику — нужна проверка.
Полезнее всего здесь не сами проценты, а общий вывод: CV-ОТК в металлургии уже давно не пилотный экзотический кейс. Это production-класс задач, если вы готовы инвестировать в данные и сопровождение.
Где тут место MES и почему без него проект недоделан
Если результат модели заканчивается на отдельном мониторе в лаборатории, вы сделали красивый PoC. В production CV должен войти в контур качества.
Обычно это выглядит так.
- Модель присваивает событие конкретной позиции, рулону или участку полотна.
- Событие попадает в MES или quality system.
- Оператор подтверждает или отклоняет сигнал.
- Решение влияет на сортность, маршрут, доработку или отбраковку.
- Размеченный факт возвращается обратно в обучение.
Именно поэтому в металлургии CV-ОТК — это не только компьютерное зрение, но и проект интеграции с производственными системами.
Почему модель не переносится между заводами
Это главный отраслевой урок. Модель, обученная на данных одной линии, часто плохо работает на другой линии того же комбината. А перенос между заводами — ещё сложнее.
Причины банальны и очень материальны:
- другая камера и оптика;
- другая скорость и вибрация;
- иной свет и отражения;
- другой сортамент и поверхность;
- другая культура ручной разметки.
Как запускать end-to-end проект на линии
Начните с одного маршрута решения. Например: дефект найден → оператор подтвердил → рулон ушёл в отдельную развилку контроля. Не стройте весь заводской контур сразу.
Разведите типовые и редкие дефекты. Для первых лучше supervised-модель, для вторых — anomaly detection или отдельный ручной контур эскалации.
Сразу проектируйте edge-инференс. В металлургии не нужно тащить каждую картинку в удалённый облачный inference. Железо и стек для этого уже разобраны в p.2/03 и p.9/03.
Заложите процесс спорной разметки. Самые ценные кадры — не очевидные, а те, где технологи и ОТК спорят друг с другом. Именно они лучше всего улучшают production-модель.
Не забывайте про защищённый видеоконтур. Если поток чувствителен и уходит между сегментами сети, проверьте требования шифрования и защиты канала из p.3/04.
Что делать дальше
За open-source стеком для такого пайплайна идите в p.9/03. За выбором между нейросетью и специализированными не-LLM-моделями — в p.2/07. За procurement-вопросами по коммерческим CV-системам — в p.10/03.