РБК Компании

Каким направлениям бизнеса может помочь ИИ и машинное обучение

В статье расскажем о реальных кейсах применения машинного обучения в ИТ-проектах для бизнеса
Каким направлениям бизнеса может помочь ИИ и машинное обучение
Алексей Колесников
Алексей КолесниковСоучредитель, руководитель проектов, тимлид, техлид, backend-разработчик ИТ-компании SimbirSoft

Спикер конференций HighLoad++, DUMP, Стачка, ТехноРеволюция, Российская неделя высоких технологий. Более 20 лет опыта работы в ИТ.

Подробнее

В конце апреля СМИ сообщили, что ИИ вышел за пределы Солнечной Cистемы. Для доказательства существования экзопланеты ученые использовали инструменты машинного обучения (machine learning, ML), чтобы провести анализ протопланетных дисков вокруг новорожденных звезд. 

Но и на Земле еще остается множество областей человеческой деятельности, которые можно улучшить с помощью инструментов ML. Да, это приземленные задачи, но они могут облегчить работу людей и повысить их комфорт. 

Часть проектов компании SimbirSoft также основаны на технологиях компьютерного зрения и машинного обучения. 

  • Компьютерное зрение — область искусственного интеллекта, которая занимается анализом и обработкой изображений или видео, сегментированием, классификацией и поиском данных, пониманием смысла и анализом движений.   
  • Машинное обучение — часть искусственного интеллекта для создания систем, которые обучаются и развиваются на основе получаемых данных.

Что скрывается за этими формулировками, расскажу на кейсах, в которых применялись модели machine learning. 

Любезный шлагбаум            

Как работает простой шлагбаум? Водителю при подъезде надо позвонить на номер, «привязанный» к шлагбауму,  либо остановиться и приложить ключ или карточку. Технологии ИИ позволяют водителю отказаться от лишних манипуляций. 

В SimbirSoft в качестве инструментов компьютерного зрения использовали нейронные сети для захвата изображения автомобиля и его номера, перевода картинки с номером в текст и определения, въезжает машина или выезжает. 

ML-инженеры провели обучение модели по фотографиям с камеры, что стоит у шлагбаума. Всего одна секунда проходит от фотографирования авто до распознавания номера. 

Шлагбаум, который стал исполнительным органом системы с компьютерным зрением и ML, теперь работает так: когда автомобиль подъезжает к шлагбауму, камера считывает его госномер. Система сопоставляет его с базой «белых» номеров, и, если он есть в базе данных, шлагбаум открывается. 

Где еще можно использовать? 

Эту технологию можно применять для:

  • отслеживания автотранспорта и организации дорожного движения;
  • контроля доступа людей к объектам;
  • подсчета посетителей с ведением статистики по времени, популярным местам присутствия и так далее. 

ML и компьютерное зрение применяют также в:

  • Медицине — для постановки диагноза по рентгеновским снимкам или фотографиям тестов.
  • Машиностроении, аэрокосмической, автомобильной и пищевой промышленности — для контроля качества.
  • Робототехнике — для компьютерного зрения беспилотных аппаратов.

Эти технологии используют для видеонаблюдения, компьютерной графики и мониторинга окружающей среды.

Найти корни

К нам обратился заказчик, который предоставляет редкие B2C-сервисы — они помогают клиентам восстановить родственные связи и построить генеалогические деревья. Перед командой SimbirSoft стояли задачи по автоматизации сбора данных из бумажных носителей. Буквально: 

  • Распознавание отсканированных газетных страниц XIX века и рукописных листов переписи населения.
  • Сегментация, извлечение из газет объявлений о свадьбах и похоронах.
  • Семантический анализ текста, извлечение сущностей и атрибутов: имена, даты, локации, родственные связи.
  • Наполнение базы для сервиса построения генеалогического древа.

Для машинного обучения мы использовали более 1 млн отсканированных газетных страниц, часть из которых были в плохом состоянии. В листах переписи встречался неразборчивый почерк. Но наши разработчики и искусственный интеллект справились, мы обучили модель выполнять все функции. 

Где еще можно использовать? 

Эту технологию можно использовать для оцифровки любых архивных данных, их распознавания и сегментации по темам. 

Например, собрать газетные публикации об экспозиции России на Всемирной выставке 1867 года в Париже или статистику об упоминании инженера и изобретателя Владимира Шухова к 170-летию со дня рождения этого автора ажурных стальных башен и стеклянных куполов. 

Жив ли сервер? 

В этом кейсе нет составляющей с компьютерным зрением. Здесь использовались только технологии машинного обучения. У заказчика — более 600 облачных сервисов. Перед нами стояла цель — оповещать администраторов о надвигающемся падении любого из серверов на основе определенных сигналов в ИТ-системе. Таким образом, можно предотвратить сбой сервисов и избежать разочарования пользователей.

Каким направлениям бизнеса может помочь ИИ и машинное обучение
Изображение сгенерировано при помощи нейросети

Для создания ML-модели разработчики выполнили следующие задачи:

  • Сбор и агрегирование системных логов в базу данных.
  • Анализ данных, обучение ML-модели на примере известных инцидентов и построение паттерна поведения системы.
  • Детектирование аномалий.

Для обучения использовали 100 млн записей логов. Мы научили систему сообщать администраторам заказчика, что через 10-15 минут с сервером случится что-то неприятное. Это позволяет им успеть предпринять действия и не допустить отказ и разочарования. 

Где еще можно использовать? 

Подход можно адаптировать для детектирования аномального поведения любой системы. Подобные решения применяются в распределенных системах на основе микросервисов и часто называются «Anomaly Detection».

Свой ChatGPT для бизнеса 

Нейросеть ChatGPT — это класс больших языковых моделей (Large Language Models, LLM). И, конечно, бизнес может использовать ChatGPT. 

Отмечу, что его модели создатели натренировали по своим правилам и данным. Мы же предлагаем бизнесу использовать LLM, машинное обучение которых можно проводить индивидуально на данных заказчика, с учетом особенностей компании. Такой ИИ-ассистент будет давать полные и точные ответы на вопросы, связанные с бизнесом заказчика. 

Нанять на работу «свой» ChatGPT могут компании, ведущие B2B и B2C бизнес, от цифровых экосистем до малого розничного или производственного бизнеса. 

Где еще можно использовать? 

Нейронному ассистенту на основе LLM можно доверить: 

  • Обслуживание клиентов через чат-боты.
  • Быстрый и точный языковой перевод.
  • Анализ больших данных — определение закономерностей и тенденций, генерации инсайтов.
  • Предоставление персонализированных рекомендаций.
  • Создание контента — описание продуктов, блоги, посты для соцсетей.

Пересчитать зеленый лес в кубометры древесины

По заданию заказчика для учета леса мы разработали мобильное приложение, которое распознает стволы в лесу или спиленные бревна на складе, определяет их размер и пересчитывает в объем древесины. 

Для обучения ML-модели, повышения точности и конечной обработки потребовалось 300 фотографий. До фотографирования мы измеряли ствол каждого дерева. Это было нужно для обучения алгоритма. Наши инженеры тестировали систему в полевых условиях и решали специфические задачи из реального мира: 

  • В лесу не всегда хорошее освещение. И часто по фото невозможно четко очертить контур ствола, потому что его часть может быть в снегу.
  • Как посчитать диаметр ствола, если он из-за своего огромного размера не поместился в кадр полностью.
  • Спил бревна, чаще всего, не является кругом. Мы учили модель измерять окружность таких «неправильных» бревен.
  • Требовалось дорисовать некоторые контуры диаметров, поскольку иногда бревна накладывались друг на друга и на фото очертания сливались. Для решения этой проблемы задействовали нейросетевой алгоритм, основанный на семантической сегментации объектов на картинке. 

Полученные данные о каждом объекте связывались с его RFID-меткой, которая использовалась заказчиком для учета ресурсов. 

Где еще можно использовать? 

Решение, не требующее специального оборудования для пользователя, может облегчить бизнес-процессы не только на лесозаготовках, портовых и железнодорожных складах леса. Эта технология пригодится во всех сферах, где есть задачи определения размеров объектов по фото и инвентаризации. Например, в горном деле — для определения состава и фракции горной породы и нерудных материалов: щебня и гравия. 

Как мы учим 

В каждом ML-проекте есть основные этапы: 

  • Самый важный — сбор и подготовка данных для обучения модели. От их качества зависит, как будет работать модель. Собранные сведения мы очищаем, извлекаем только правильные и помеченные данные. 
  • Обучение модели.
  • Тестирование модели. Проверяем, насколько она ошибается, настраиваем на наименьшее количество ошибок. 
  • Развертывание модели на сервере.
  • Обновление и сопровождение. В процессе промышленной эксплуатации поступающие данные отличаются от тех, на которых модель тестировали. Важно, чтобы она правильно реагировала на изменение данных. После достижения установленного уровня ошибок мы проводим перетренировку модели и новое тестирование. Эти операции автоматизированы, но выполняем их с привлечением нашего data-scientist`а. 

На каждом этапе разработчики постоянно контактируют с заказчиком. Это дает бизнесу возможность рассказать о специфике внутренних бизнес-процессов, конкретизировать ожидания от использования ML, а нашей команде — выполнить его ожидания. 

Каким направлениям бизнеса может помочь ИИ и машинное обучение
Изображение сгенерировано при помощи нейросети

Как оборудовать рабочее место для ИИ-ассистента 

Если бизнес решит не отставать от прогресса и оптимизировать бизнес-процессы с помощью инструментов машинного обучения, то кроме создания программного продукта надо подготовить и «железо». Для развертывания программы потребуются:

  • Быстрый процессор.
  • Большой объем хранилища данных.
  • Большой объем оперативной памяти (CPU/GPU).
  • Графические процессоры (GPU) — для работы моделей компьютерного зрения.
  • Качественный интернет-канал.

Конкретнее определить характеристики невозможно, потому что требования к инфраструктуре зависят от задачи и технологического решения. Чем больше пользователей и запросов, тем больше ресурсов понадобится. 

При создании ML-моделей и систем наши разработчики стремятся к их оптимизации. На практике некоторые ML-модели прекрасно работают на скромных процессорах. Инженеры SimbirSoft советуют каждому заказчику оптимальную конфигурацию инфраструктуры, чтобы machine learning безотказно решал бизнес-задачи. 

Пусть это задачи не космического масштаба. Но решения на основе машинного обучения помогают компаниям увеличивать производительность труда, экономить время, планировать экономику, совершенствовать имеющиеся сервисы и запускать новые. Инструменты ML упрощают работу людей. И даже делают комфортным въезд на парковку. 

Интересное:

Новости отрасли:

Все новости:

Профиль

Дата регистрации22.02.2001
Уставной капитал30 000,00 ₽
Юридический адрес обл. Ульяновская, г.о. город Ульяновск, пр-кт Нариманова, д. 1 стр. 2
ОГРН 1027301167563
ИНН / КПП 7325029206 732501001

Контакты

Адрес Россия, г. Ульяновск, пр-т Нариманова, д. 1 стр. 2
Телефон +78002009924

Социальные сети