«Формат кода» 30 января 2024

Нейросеть занимается охраной труда на производстве

Рассказываем о проекте по созданию ИИ-системы для контроля безопасности на промышленном производстве

Задача

Используя уже существующие на объектах заказчика CCTV-камеры, внедрить искусственный интеллект, который будет захватывать видеопоток с камер, выделять в стриме зоны производства, людей, элементы защиты и определять, нарушены ли правила техники безопасности или соблюдены.

Причина

Руководство приняло решение передать рутинные функции производственного контроля и выполнение персоналом правил безопасности системе на основе искусственного интеллекта.

Процесс

Наши инженеры создали сверточную нейронную сеть и научили ее распознавать на потоковом видео людей, детали экипировки (каски, жилеты, тросы) и выявлять типы производственных зон. В пилотной версии система фиксирует и дает реакцию на три наиболее распространенных сценария поведения персонала:

Носит ли сотрудник защитную каску на голове — является обязательным условием на производстве;
Надел ли сотрудник капюшон от рабочей куртки поверх каски — это строго запрещено;
Пристегнут ли сотрудник тросом — является обязательным условием при проведении высотных работ.

Нейросеть занимается охраной труда на производстве

Дата-сет

Частая проблема проектов с машинным обучением в промышленности — недостаток наборов исходных шаблонов для тренировки нейросети ввиду новизны темы и единичности внедрений. Нам пришлось с нуля разработать и разметить референсный датасет, в состав которого вошли 56 последовательностей, покрывающих позитивные и негативные сценарии поведения персонала на производстве.

Распознавание объектов

Обработка видеопотока происходит в три этапа. Сначала отфильтровываются кадры, на которых отсутствуют люди. Затем части видео, на которых система распознала людей, передаются сверточной нейронной сети. Сеть определяет человека по разметке и идентифицирует элементы страховки: каску на голове или трос на туловище. Затем алгоритм, использующий метод опорных векторов, сопоставляет изображение объекта по базе с шаблонами. Если кадр содержит нарушения, система направляет уведомление в соответствии с прописанными требованиями.

Технологии

Для сегментации изображений использовали Mask R-CNN (платформа Detectron). Этот фреймворк справляется с задачей обнаружения всех указанных классов объектов, а также выделяет объекты в рамки. Тренировка нейросети выполнялась с помощью скрипта переобучения Transfer Learning, оптимальной при работе с ограниченным датасетом, когда нет задачи собирать статистику по работам (сколько сотрудников на объекте, сотрудники каких подразделений, в каких местах они проводят больше времени).

Результат

В финальном варианте удалось достигнуть стабильной аналитики видеопотока с распознаванием объектов и классификацией поведения. Диапазон точности составляет 77-100%. Проект показал отличные результаты на этапе тестирования.