Модуль p.5 · Урок 3

Урок 3: CV контроль качества проката end-to-end — датасет Severstal Steel Defect, YOLO на production

35 мин

Содержание

Чему вы научитесь
От benchmark-датасета к реальной линии
Почему датасет Severstal стал отраслевым стандартом
Как выглядит реальный pipeline CV-ОТК
Какие модели действительно имеют смысл
Сколько данных нужно на практике
Что показывает практика металлургов
Где тут место MES и почему без него проект недоделан
Почему модель не переносится между заводами
Как запускать end-to-end проект на линии
Что делать дальше

p.5 / Урок 3 из 8

Чему вы научитесь

Понимать полный pipeline CV-контроля качества проката: от датасета и разметки до камер на линии и интеграции с MES
Различать benchmark-датасет, пилотный прототип и production-grade систему ОТК
Выбирать между supervised-детекцией и anomaly detection в зависимости от природы дефекта
Читать кейс Severstal Steel Defect Detection как отраслевой стандарт подготовки данных, а не как Kaggle-развлечение
Ловить главную проблему промышленного CV — распределение данных между линиями, сменами и заводами

В p.1/05 Северсталь уже выступала как российский ориентир по AI. Здесь фокус уже не на общей сумме эффекта, а на том, как устроен конкретный класс решений — surface defect detection на прокате. Это один из самых зрелых industrial AI-кейсов в металлургии, потому что здесь есть сразу всё: камеры, публичные датасеты, production-системы и понятная связь с KPI качества.

От benchmark-датасета к реальной линии

Уровень	Что это такое	Для чего полезен	Чего не хватает
Публичный датасет	Severstal Steel Defect Detection, NEU-DET и другие наборы изображений	Дают стартовую проверку архитектур и пайплайна обучения	Не отражают все артефакты вашей линии, света, стали и камер
Пилот на архиве предприятия	Реальные фото одной линии, несколько типов дефектов, ручная разметка	Показывает, есть ли сигнал в ваших данных	Обычно мало негативных и редких случаев
Production CV	Камеры на линии, edge-инференс, триггеры в MES, подтверждение оператором	Даёт экономику и снижение рекламаций	Требует MLOps, повторной калибровки и поддержки 24/7

Почему датасет Severstal стал отраслевым стандартом

Kaggle competition Severstal: Steel Defect Detection вывела российский промышленный кейс в глобальный контур машинного зрения. В competition dataset — 18 074 изображения и 4 класса дефектов (Kaggle competition page). Рядом с ним обычно используют NEU Surface Defect Database с 1 800 изображениями и 6 классами поверхностных дефектов стали (Kaggle NEU dataset).

Это важно по двум причинам.

Во-первых, в металлургии появился публичный общий язык сравнения моделей. Во-вторых, стало видно, что реальные steel defects — это не игрушечная классификация на трёх классах, а задача с крайне неровным распределением, плохими границами дефекта и большим количеством «почти дефектов».

Как выглядит реальный pipeline CV-ОТК

flowchart LR
    A[Камеры над линией проката] --> B[Сбор и архив кадров]
    B --> C[Разметка в CVAT или Label Studio]
    C --> D[Обучение Detectron2 / MMDetection / YOLO]
    D --> E[Экспорт в ONNX / TensorRT / OpenVINO]
    E --> F[Edge-инференс на линии]
    F --> G[Событие в MES / quality system]
    G --> H[Подтверждение оператора и обратная связь]
    H --> I[Переобучение и drift control]

Это почти один в один повторяет стек из p.9/03, только здесь добавляются металлургические ограничения:

скорость линии;
вибрация и пыль;
отражения и блики на металле;
длинные, узкие и плохо контрастные дефекты;
высокая цена ложного пропуска и ложного брака.

Какие модели действительно имеют смысл

Класс задачи	Что брать первым	Когда это работает	Где ломается
Явно размеченные типовые дефекты	Detectron2, MMDetection, YOLO-подобные detector-архитектуры	Когда классы дефектов известны и есть достаточно размеченных примеров	Когда дефекты слишком редкие или границы спорные
Редкие и плохо формализованные отклонения	Anomalib и one-class подходы	Когда проще учить «норму», чем все типы дефектов	Когда норма сама нестабильна и сильно плавает по продукту
Inline segmentation	U-Net / Mask-ориентированные модели	Когда важна глубина и геометрия дефекта, а не только факт его наличия	Когда слишком высокая скорость линии и ограниченный edge-budget

В GitHub-сообществе вокруг датасета Severstal много сильных baseline-решений — от U-Net-подходов до современных detector-модификаций (TheoViel repo; khornlund repo; LZY-233 improved defect detection). Но production не начинается там, где закончился Kaggle. Он начинается там, где модель встретилась со светом, вибрацией, обрывами сети и оператором смены.

Сколько данных нужно на практике

Здесь нет честного универсального норматива. Но есть правило: прокат почти никогда не взлетает на «паре сотен картинок».

Стадия	Реалистичный объём	Что с этим делать
Быстрый feasibility-check	Архив дефектов по 1–2 типам, желательно с негативными примерами	Проверить, вообще различим ли сигнал на ваших камерах
MVP	`5–20 тыс.` изображений на одну линию — нужна проверка для конкретного участка	Настроить первый production-уровень с оператором в цикле
Устойчивый production	`50 тыс.+` изображений и постоянная подпитка новыми данными — нужна проверка	Закрывать drift по сменам, освещению, сортаменту и редким дефектам

Если эти цифры кажутся большими — это не проблема AI. Это нормальная цена за систему, которая должна ловить редкий дефект на непрерывном процессе, а не сортировать котиков.

Что показывает практика металлургов

Северсталь публично говорит о внедрении AI-систем инспекции металлопроката на агрегатах перемотки рулонов (Metalinfo, 09.01.2025). По состоянию на 2025–2026 годы у компании отдельно видны контуры computer vision для контроля качества — 12 систем CV на ЧерМК, и отдельно контур безопасности — платформа СОВА (Metalinfo, 27.03.2025). Visillect в таких проектах полезнее рассматривать как внешнего CV-вендора, а не как собственный продукт Северстали.

Международный ориентир похожий: в учебных и отраслевых материалах часто приводят Voestalpine как пример снижения дефектов примерно на 20%, а ArcelorMittal Hamburg — как пример уменьшения обрези на 20%, но для точного сопоставления с конкретным переделом эти числа нужно перепроверять по первоисточнику — нужна проверка.

Полезнее всего здесь не сами проценты, а общий вывод: CV-ОТК в металлургии уже давно не пилотный экзотический кейс. Это production-класс задач, если вы готовы инвестировать в данные и сопровождение.

Где тут место MES и почему без него проект недоделан

Если результат модели заканчивается на отдельном мониторе в лаборатории, вы сделали красивый PoC. В production CV должен войти в контур качества.

Обычно это выглядит так.

Модель присваивает событие конкретной позиции, рулону или участку полотна.
Событие попадает в MES или quality system.
Оператор подтверждает или отклоняет сигнал.
Решение влияет на сортность, маршрут, доработку или отбраковку.
Размеченный факт возвращается обратно в обучение.

Именно поэтому в металлургии CV-ОТК — это не только компьютерное зрение, но и проект интеграции с производственными системами.

Почему модель не переносится между заводами

Это главный отраслевой урок. Модель, обученная на данных одной линии, часто плохо работает на другой линии того же комбината. А перенос между заводами — ещё сложнее.

Причины банальны и очень материальны:

другая камера и оптика;
другая скорость и вибрация;
иной свет и отражения;
другой сортамент и поверхность;
другая культура ручной разметки.

Как запускать end-to-end проект на линии

Начните с одного маршрута решения. Например: дефект найден → оператор подтвердил → рулон ушёл в отдельную развилку контроля. Не стройте весь заводской контур сразу.
Разведите типовые и редкие дефекты. Для первых лучше supervised-модель, для вторых — anomaly detection или отдельный ручной контур эскалации.
Сразу проектируйте edge-инференс. В металлургии не нужно тащить каждую картинку в удалённый облачный inference. Железо и стек для этого уже разобраны в p.2/03 и p.9/03.
Заложите процесс спорной разметки. Самые ценные кадры — не очевидные, а те, где технологи и ОТК спорят друг с другом. Именно они лучше всего улучшают production-модель.
Не забывайте про защищённый видеоконтур. Если поток чувствителен и уходит между сегментами сети, проверьте требования шифрования и защиты канала из p.3/04.

Что делать дальше

За open-source стеком для такого пайплайна идите в p.9/03. За выбором между нейросетью и специализированными не-LLM-моделями — в p.2/07. За procurement-вопросами по коммерческим CV-системам — в p.10/03.

Ключевые выводы

Surface defect detection в металлургии — зрелый production-класс задач, но только при наличии нормального контура данных и интеграции с MES.
Датасет Severstal Steel Defect Detection стал отраслевым benchmark, потому что дал рынку общий язык для сравнения моделей.
Между пилотом и production лежат не только модели, но и камеры, разметка, edge-инференс, operator feedback и MLOps.
Для типовых дефектов нужен supervised detector, для редких и плохо формализованных — anomaly detection.
Главный риск отрасли — domain shift: модель с одной линии или с другого завода почти наверняка придётся переучивать.
Если CV не влияет на маршрут качества и не возвращается в MES, это ещё не промышленный ОТК, а лабораторный эксперимент.

Мы размещаем рекламу, так как это позволяет нам готовить для вас свежие материалы и покрывать наши расходы. Рекламодателей выбираем адекватных.

Урок 3: CV контроль качества проката end-to-end — датасет Severstal Steel Defect, YOLO на production

AI в металлургии и ГМК

Чему вы научитесь

От benchmark-датасета к реальной линии

Почему датасет Severstal стал отраслевым стандартом

Как выглядит реальный pipeline CV-ОТК

Какие модели действительно имеют смысл

Сколько данных нужно на практике

Что показывает практика металлургов

Где тут место MES и почему без него проект недоделан

Почему модель не переносится между заводами

Как запускать end-to-end проект на линии

Что делать дальше

Урок 3: CV-конвейер для ОТК — от разметки до деплоя на Jetson

Урок 3: Как выбрать CV-систему — Cognex vs Keyence vs Landing AI vs Малленом vs open-source

Урок 7: Малые специализированные модели — не всё AI это LLM

Урок 2: CV контроль качества в дискретном производстве — от MVTec AD до production

// Обсуждение

Чему вы научитесь

От benchmark-датасета к реальной линии

Почему датасет Severstal стал отраслевым стандартом

Как выглядит реальный pipeline CV-ОТК

Какие модели действительно имеют смысл

Сколько данных нужно на практике

Что показывает практика металлургов

Где тут место MES и почему без него проект недоделан

Почему модель не переносится между заводами

Как запускать end-to-end проект на линии

Что делать дальше

Связанные уроки

Урок 3: CV-конвейер для ОТК — от разметки до деплоя на Jetson

Урок 3: Как выбрать CV-систему — Cognex vs Keyence vs Landing AI vs Малленом vs open-source

Урок 7: Малые специализированные модели — не всё AI это LLM

Урок 2: CV контроль качества в дискретном производстве — от MVTec AD до production

// Обсуждение