Каким направлениям бизнеса может помочь ИИ и машинное обучение
Компьютерное зрение, машинное обучение. Что скрывается за этими формулировками? Эксперт ИТ-компании SimbirSoft объясняет на реальных примерахСпикер конференций HighLoad++, DUMP, Стачка, ТехноРеволюция, Российская неделя высоких технологий. Более 20 лет опыта работы в ИТ.
В конце апреля СМИ сообщили, что ИИ вышел за пределы Солнечной системы. Для доказательства существования экзопланеты ученые использовали инструменты машинного обучения (machine learning, ML), чтобы провести анализ протопланетных дисков вокруг новорожденных звезд.
Но и на Земле еще остается множество областей человеческой деятельности, которые можно улучшить с помощью инструментов ML. Да, это приземленные задачи, но они могут облегчить работу людей и повысить их комфорт. В статье пойдет речь о проектах компании SimbirSoft, которая создает виртуальных помощников для разных направлений бизнеса.
Часть проектов нашей компании основаны на технологиях компьютерного зрения и машинного обучения.
- Компьютерное зрение — область искусственного интеллекта, которая занимается анализом и обработкой изображений или видео, сегментированием, классификацией и поиском данных, пониманием смысла и анализом движений.
- Машинное обучение — часть искусственного интеллекта для создания систем, которые обучаются и развиваются на основе получаемых данных.
Что скрывается за этими формулировками, расскажу на кейсах, в которых применялись модели machine learning.
Любезный шлагбаум
Как работает простой шлагбаум? Водителю при подъезде надо позвонить на номер, «привязанный» к шлагбауму, либо остановиться и приложить ключ или карточку. Но технологии ИИ позволили водителю отказаться от лишних манипуляций.
В SimbirSoft в качестве инструментов компьютерного зрения использовали нейронные сети чтобы захватить изображения автомобиля и его номера, перевода картинки с номером в текст и определения, въезжает машина или наоборот, выезжает.
ML-инженеры провели обучение модели по фотографиям с той же камеры, что стоит у шлагбаума. Всего одна секунда проходит от фотографирования авто до распознавания номера.
Шлагбаум, который стал исполнительным органом системы с компьютерным зрением и ML, теперь работает так: когда автомобиль подъезжает к шлагбауму, камера считывает его госномер, а система сопоставляет его с базой «белых» номеров. И если он есть в базе данных, шлагбаум заранее открывается.
Где еще можно использовать?
Также связку компьютерного зрения и ML можно применять:
- Для отслеживания автотранспорта и организации дорожного движения
- Для контроля доступа людей к объектам
- Для подсчета посетителей например торгового центра с ведением статистики по времени, популярным местам присутствия и так далее.
ML и компьютерное зрение применяют в:
- Медицине — для постановки диагноза по рентгеновским снимкам или фотографиям тестов
- Машиностроении, аэрокосмической, автомобильной и пищевой промышленности — для контроля качества
- Робототехнике — для компьютерного зрения беспилотных аппаратов
Эти технологии используют для:
- Видеонаблюдения
- Компьютерной графики
- Мониторинга окружающей среды
Найти корни
К нам обратился заказчик, который предоставляет редкие B2C-сервисы — они помогают клиентам восстановить родственные связи и построить генеалогические деревья. Перед командой SimbirSoft стояли задачи по автоматизации сбора данных из бумажных носителей. Буквально:
- Распознавание отсканированных газетных страниц XIX века и рукописных листов переписи населения
- Сегментация, извлечение из газет объявлений о свадьбах и похоронах
- Семантический анализ текста и извлечение сущностей и атрибутов: имена, даты, локации, родственные связи
- Наполнение базы для сервиса построения генеалогического древа
Для машинного обучения мы использовали более 1 млн отсканированных газетных страниц, часть из которых были в плохом состоянии. В листах переписи встречался неразборчивый почерк. Но наши разработчики и искусственный интеллект справились, мы обучили модель выполнять все функции.
Где еще можно использовать?
Эту технологию можно использовать для оцифровки любых архивных данных, их распознавания и сегментации по темам.
Например, собрать газетные публикации об экспозиции России на Всемирной выставке 1867 года в Париже. Или собрать статистику об упоминании инженера и изобретателя Владимира Шухова к 170-летию со дня рождения этого автора ажурных стальных башен и стеклянных куполов.
Жив ли сервер?
В этом кейсе нет составляющей с компьютерным зрением, здесь использовались только технологии машинного обучения. У заказчика — более 600 облачных сервисов. Перед нами стояла цель — оповещать администраторов о надвигающемся падении любого из серверов на основе определенных сигналов в ИТ-системе. Таким образом, можно предотвратить сбой сервисов и избежать разочарования пользователей.
Для создания ML-модели разработчики выполнили следующие задачи:
- Сбор и агрегирование системных логов в базу данных
- Анализ данных, обучение ML-модели на примере известных инцидентов и построение паттерна поведения системы
- Детектирование аномалий
Для обучения использовали 100 млн записей логов. Мы научили систему сообщать администраторам заказчика, что через 10-15 минут с сервером случится что-то неприятное. Это позволяет им успеть предпринять действия и не допустить отказ и разочарования.
Где еще можно использовать?
Подход можно адаптировать для детектирования аномального поведения любой системы. Подобные решения применяются в распределенных системах на основе микросервисов и часто называются «Anomaly Detection».
Нейросеть для бизнеса
Большие языковые модели (Large Language Models, LLM) сегодня набирают популярность. Обучение LLM можно проводить индивидуально на данных компании и с учетом ее особенностей. Такой ИИ-ассистент будет давать полные и точные ответы на вопросы, связанные с бизнесом заказчика.
«Нанять« на работу свою нейросеть могут компании, ведущие B2B и B2C бизнес, от цифровых экосистем до малого розничного или производственного бизнеса.
Где еще можно использовать?
Нейронному ассистенту на основе LLM можно доверить:
- Обслуживание клиентов через чат-боты
- Быстрый и точный языковой перевод
- Анализ больших данных — определение закономерностей и тенденций, генерации инсайтов
- Предоставление персонализированных рекомендаций
- Создание контента — описание продуктов, блоги, посты для соцсетей
Пересчитать зеленый лес в кубометры древесины
По заданию заказчика для учета леса мы разработали мобильное приложение, которое распознает стволы в лесу или спиленные бревна на складе, определяет их размер и пересчитывает в объем древесины.
Для обучения ML-модели, повышения точности и конечной обработки потребовалось 300 фотографий. До фотографирования мы измеряли ствол каждого дерева. Это было нужно для обучения алгоритма. Наши инженеры тестировали систему в полевых условиях и решали специфические задачи из реального мира:
- В лесу не всегда хорошее освещение. И часто по фото невозможно четко очертить контур ствола, потому что его часть, например, в снегу и разница на контрасте не работает
- Как посчитать диаметр ствола, если он из-за своего огромного размера не поместился в кадр полностью
- Спил бревна, чаще всего, не является кругом. Поэтому учили модель измерять окружность таких «неправльных» бревен
- Требовалось дорисовать некоторые контуры диаметров, поскольку иногда бревна накладывались друг на друга и на фото контуры сливались. Для решения этой проблемы задействовали нейросетевой алгоритм, основанный на семантической сегментации объектов на картинке.
Полученные данные о каждом объекте связывались с его RFID-меткой, что использовалось заказчиком для учета ресурсов.
Где еще можно использовать?
Решение, не требующее специального оборудования для пользователя, облегчит бизнес-процессы не только на лесозаготовках, портовых и железнодорожных складах леса. Эта технология пригодится во всех сферах, где есть задачи определения размеров объектов по фото и инвентаризации. Например, в горном деле — для определения состава и фракции горной породы и нерудных материалов: щебня и гравия.
Как мы учим
В каждом ML-проекте есть основные этапы:
- Самый важный — сбор и подготовка данных для обучения модели. От их качества зависит, как будет работать модель. Собранные сведения мы очищаем, извлекаем только правильные и помеченные данные.
- Обучение модели.
- Тестирование модели. Проверяем, насколько она ошибается, настраиваем на наименьшее количество ошибок.
- Развертывание модели на сервере.
- Обновление и сопровождение. В процессе промышленной эксплуатации поступающие данные отличаются от тех, на которых модель тестировали. Важно, чтобы она правильно реагировала на изменение данных. После достижения установленного уровня ошибок мы проводим перетренировку модели и новое тестирование. Эти операции автоматизированы, но выполняем их с привлечением нашего data-scientist`а.
На каждом этапе разработчики постоянно контактируют с заказчиком. Это дает ему возможность рассказать о специфике внутренних бизнес-процессов, конкретизировать ожидания от использования ML, а команде — выполнить его ожидания.
Как оборудовать рабочее место для ИИ-ассистента
Если бизнес решит не отставать от прогресса и оптимизировать бизнес-процессы с помощью инструментов машинного обучения, то кроме создания программного продукта надо подготовить и «железо». Для развертывания программы потребуются:
- Быстрый процессор
- Большой объем хранилища данных
- Большой объем оперативной памяти (CPU/GPU)
- Графические процессоры (GPU) — для работы моделей компьютерного зрения
- Качественный интернет-канал
Конкретнее определить характеристики невозможно, потому что требования к инфраструктуре зависят от задачи и технологического решения. Чем больше пользователей и запросов, тем больше ресурсов понадобится.
При создании ML-моделей и систем наши разработчики стремятся к их оптимизации. На практике некоторые ML-модели прекрасно работают на скромных процессорах. Инженеры SimbirSoft советуют каждому заказчику оптимальную конфигурацию инфраструктуры, чтобы machine learning безотказно решал бизнес-задачи.
Пусть это задачи не космического масштаба. Но решения на основе машинного обучения помогают компаниям увеличивать производительность труда, экономить время, планировать экономику, совершенствовать имеющиеся сервисы и запускать новые. Инструменты ML упрощают работу людей. И даже делают комфортным въезд на парковку.
Интересное:
Новости отрасли:
Все новости:
Публикация компании
Профиль
Социальные сети