Перейти к содержимому
NEWЧат с 15 ИИ-моделями — попробуйте бесплатно / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль p.5 · Урок 3

Урок 3: CV контроль качества проката end-to-end — датасет Severstal Steel Defect, YOLO на production

35 мин
p.5 / Урок 3 из 8

Чему вы научитесь

  • Понимать полный pipeline CV-контроля качества проката: от датасета и разметки до камер на линии и интеграции с MES
  • Различать benchmark-датасет, пилотный прототип и production-grade систему ОТК
  • Выбирать между supervised-детекцией и anomaly detection в зависимости от природы дефекта
  • Читать кейс Severstal Steel Defect Detection как отраслевой стандарт подготовки данных, а не как Kaggle-развлечение
  • Ловить главную проблему промышленного CV — распределение данных между линиями, сменами и заводами

В p.1/05 Северсталь уже выступала как российский ориентир по AI. Здесь фокус уже не на общей сумме эффекта, а на том, как устроен конкретный класс решений — surface defect detection на прокате. Это один из самых зрелых industrial AI-кейсов в металлургии, потому что здесь есть сразу всё: камеры, публичные датасеты, production-системы и понятная связь с KPI качества.

От benchmark-датасета к реальной линии

УровеньЧто это такоеДля чего полезенЧего не хватает
Публичный датасетSeverstal Steel Defect Detection, NEU-DET и другие наборы изображенийДают стартовую проверку архитектур и пайплайна обученияНе отражают все артефакты вашей линии, света, стали и камер
Пилот на архиве предприятияРеальные фото одной линии, несколько типов дефектов, ручная разметкаПоказывает, есть ли сигнал в ваших данныхОбычно мало негативных и редких случаев
Production CVКамеры на линии, edge-инференс, триггеры в MES, подтверждение операторомДаёт экономику и снижение рекламацийТребует MLOps, повторной калибровки и поддержки 24/7

Почему датасет Severstal стал отраслевым стандартом

Kaggle competition Severstal: Steel Defect Detection вывела российский промышленный кейс в глобальный контур машинного зрения. В competition dataset — 18 074 изображения и 4 класса дефектов (Kaggle competition page). Рядом с ним обычно используют NEU Surface Defect Database с 1 800 изображениями и 6 классами поверхностных дефектов стали (Kaggle NEU dataset).

Это важно по двум причинам.

Во-первых, в металлургии появился публичный общий язык сравнения моделей. Во-вторых, стало видно, что реальные steel defects — это не игрушечная классификация на трёх классах, а задача с крайне неровным распределением, плохими границами дефекта и большим количеством «почти дефектов».

Как выглядит реальный pipeline CV-ОТК

flowchart LR
    A[Камеры над линией проката] --> B[Сбор и архив кадров]
    B --> C[Разметка в CVAT или Label Studio]
    C --> D[Обучение Detectron2 / MMDetection / YOLO]
    D --> E[Экспорт в ONNX / TensorRT / OpenVINO]
    E --> F[Edge-инференс на линии]
    F --> G[Событие в MES / quality system]
    G --> H[Подтверждение оператора и обратная связь]
    H --> I[Переобучение и drift control]

Это почти один в один повторяет стек из p.9/03, только здесь добавляются металлургические ограничения:

  • скорость линии;
  • вибрация и пыль;
  • отражения и блики на металле;
  • длинные, узкие и плохо контрастные дефекты;
  • высокая цена ложного пропуска и ложного брака.

Какие модели действительно имеют смысл

Класс задачиЧто брать первымКогда это работаетГде ломается
Явно размеченные типовые дефектыDetectron2, MMDetection, YOLO-подобные detector-архитектурыКогда классы дефектов известны и есть достаточно размеченных примеровКогда дефекты слишком редкие или границы спорные
Редкие и плохо формализованные отклоненияAnomalib и one-class подходыКогда проще учить «норму», чем все типы дефектовКогда норма сама нестабильна и сильно плавает по продукту
Inline segmentationU-Net / Mask-ориентированные моделиКогда важна глубина и геометрия дефекта, а не только факт его наличияКогда слишком высокая скорость линии и ограниченный edge-budget

В GitHub-сообществе вокруг датасета Severstal много сильных baseline-решений — от U-Net-подходов до современных detector-модификаций (TheoViel repo; khornlund repo; LZY-233 improved defect detection). Но production не начинается там, где закончился Kaggle. Он начинается там, где модель встретилась со светом, вибрацией, обрывами сети и оператором смены.

Сколько данных нужно на практике

Здесь нет честного универсального норматива. Но есть правило: прокат почти никогда не взлетает на «паре сотен картинок».

СтадияРеалистичный объёмЧто с этим делать
Быстрый feasibility-checkАрхив дефектов по 1–2 типам, желательно с негативными примерамиПроверить, вообще различим ли сигнал на ваших камерах
MVP5–20 тыс. изображений на одну линию — нужна проверка для конкретного участкаНастроить первый production-уровень с оператором в цикле
Устойчивый production50 тыс.+ изображений и постоянная подпитка новыми данными — нужна проверкаЗакрывать drift по сменам, освещению, сортаменту и редким дефектам

Если эти цифры кажутся большими — это не проблема AI. Это нормальная цена за систему, которая должна ловить редкий дефект на непрерывном процессе, а не сортировать котиков.

Что показывает практика металлургов

Северсталь публично говорит о внедрении AI-систем инспекции металлопроката на агрегатах перемотки рулонов (Metalinfo, 09.01.2025). По состоянию на 2025–2026 годы у компании отдельно видны контуры computer vision для контроля качества — 12 систем CV на ЧерМК, и отдельно контур безопасности — платформа СОВА (Metalinfo, 27.03.2025). Visillect в таких проектах полезнее рассматривать как внешнего CV-вендора, а не как собственный продукт Северстали.

Международный ориентир похожий: в учебных и отраслевых материалах часто приводят Voestalpine как пример снижения дефектов примерно на 20%, а ArcelorMittal Hamburg — как пример уменьшения обрези на 20%, но для точного сопоставления с конкретным переделом эти числа нужно перепроверять по первоисточнику — нужна проверка.

Полезнее всего здесь не сами проценты, а общий вывод: CV-ОТК в металлургии уже давно не пилотный экзотический кейс. Это production-класс задач, если вы готовы инвестировать в данные и сопровождение.

Где тут место MES и почему без него проект недоделан

Если результат модели заканчивается на отдельном мониторе в лаборатории, вы сделали красивый PoC. В production CV должен войти в контур качества.

Обычно это выглядит так.

  • Модель присваивает событие конкретной позиции, рулону или участку полотна.
  • Событие попадает в MES или quality system.
  • Оператор подтверждает или отклоняет сигнал.
  • Решение влияет на сортность, маршрут, доработку или отбраковку.
  • Размеченный факт возвращается обратно в обучение.

Именно поэтому в металлургии CV-ОТК — это не только компьютерное зрение, но и проект интеграции с производственными системами.

Почему модель не переносится между заводами

Это главный отраслевой урок. Модель, обученная на данных одной линии, часто плохо работает на другой линии того же комбината. А перенос между заводами — ещё сложнее.

Причины банальны и очень материальны:

  • другая камера и оптика;
  • другая скорость и вибрация;
  • иной свет и отражения;
  • другой сортамент и поверхность;
  • другая культура ручной разметки.

Как запускать end-to-end проект на линии

  1. Начните с одного маршрута решения. Например: дефект найден → оператор подтвердил → рулон ушёл в отдельную развилку контроля. Не стройте весь заводской контур сразу.

  2. Разведите типовые и редкие дефекты. Для первых лучше supervised-модель, для вторых — anomaly detection или отдельный ручной контур эскалации.

  3. Сразу проектируйте edge-инференс. В металлургии не нужно тащить каждую картинку в удалённый облачный inference. Железо и стек для этого уже разобраны в p.2/03 и p.9/03.

  4. Заложите процесс спорной разметки. Самые ценные кадры — не очевидные, а те, где технологи и ОТК спорят друг с другом. Именно они лучше всего улучшают production-модель.

  5. Не забывайте про защищённый видеоконтур. Если поток чувствителен и уходит между сегментами сети, проверьте требования шифрования и защиты канала из p.3/04.

Что делать дальше

За open-source стеком для такого пайплайна идите в p.9/03. За выбором между нейросетью и специализированными не-LLM-моделями — в p.2/07. За procurement-вопросами по коммерческим CV-системам — в p.10/03.

Скачать урок

Есть идея или нашли ошибку?

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.