Объединяя науку и бизнес: как «Войси» делает ИИ доступным
Как зарождался «Войси», какие технологии в проекте, каковы реалии рынка генИИ и как строятся планы стартапа на будущее — делится Алексей МихайлишинОснователь медиапроекта в сфере IT. Резидент Клуба Менторов, бизнес-ментор в области IT. Эксперт в создании стратегий бизнеса и организации IT-разработки, специализируется на работе со стартапами.
Современные технологии в области искусственного интеллекта предоставляют множество вариантов применения в бизнесе, однако существует значительный разрыв между научными достижениями и реальным использованием этих технологий в повседневной жизни. О планах компании «Войси» сократить этот разрыв и превратить достижения науки в удобные сервисы, а также о том, с чего все началось, на каких принципах базируется проект и что сервисы на основе ИИ смогут дать предпринимателям в будущем — рассказывает один из основателей «Войси» Алексей Михайлишин.
Что вдохновило на создание «Войси»?
Проект «Войси» начался с личного запроса моего коллеги и сооснователя проекта Павла Караневича, с которым мы были знакомы уже несколько лет. Он столкнулся с необходимостью транскрибировать свой двухчасовой подкаст, потратил больше пяти часов в попытках найти подходящий онлайн-инструмент и так и не нашел подходящего решения. Тогда он обратился ко мне, так как я уже имел опыт в сфере голосовой расшифровки. Это и стало отправной точкой проекта.
Как личный опыт сооснователей повлиял на развитие проекта?
Я был удивлен, узнав о проблемах с транскрибацией. Вообще, я полагал, что эта задача уже решена. Однако выяснилось, что качественной транскрибации на русском языке не существует и многие люди сталкиваются с этой проблемой. Вместе мы начали разрабатывать инструмент, который решал бы задачи транскрибации.
Я использовал уже имеющиеся у меня наработки. Например, я взял существующего бота, который позволял обрабатывать короткие фрагменты аудио, а Павел нарезал свой подкаст на небольшие части и отправлял их на транскрибацию. Мы совместно обсуждали, какие функции и возможности должны быть у нового инструмента.
Так постепенно мы улучшали работу с аудиофайлами и трансформировали наши идеи в полноценный продукт. Особенное внимание мы уделяем русскому языку и нюансам, таким как распознавание «й» и «е». Этот путь от задумки до первой версии реализации и стал основой для будущих шагов и развития «Войси».
Сейчас проекту почти полтора года, и наш Telegram-бот каждый месяц перерабатывает аудиофайлы в текст больше чем для 25 тысяч пользователей. Мы делаем ИИ доступным.
Каковы главные достижения компании «Войси» за это время?
Компания «Войси» была зарегистрирована в сентябре 2023 года. Одним из наших главных достижений является получение статуса IT-компании. Также в ноябре 2024 года мы получили статус резидента «Сколково». Это подтверждает уникальность и инновационность нашего продукта.
Мы запатентовали наши разработки и получили Свидетельство о госрегистрации ПО для ЭВМ «Войси» в Федеральной службе по интеллектуальной собственности. Кроме того, мы находимся на этапе включения в реестр российского программного обеспечения и реестр стартапов Москвы.
Эти достижения помогают нам строить доверительные отношения с клиентами.
Расскажите, пожалуйста, подробнее, какие технологии лежат в основе продукта.
Мы разработали собственные решения для обработки речи, включая транскрибацию, синтез и автоматический анализ. Наш сервис поддерживает более 37 языков, включая фарси и китайский, а также адаптирован под российский рынок. Кроме того, наши продукты интегрируются с популярными CRM-системами, такими как AmoCRM и «Битрикс24», что позволяет автоматизировать контроль качества в продажах и службах поддержки.
То есть ваши технологии доступны не только через Telegram-бота?
Да, крупные компании могут интегрироваться с нашими сервисами, загружая файлы для транскрибации и обработки в любое облако. Это особенно актуально для массовой обработки данных, когда необходимо обработать сотни файлов — например, телефонных звонков или эпизодов сериалов. В этом случае выгрузка папок с материалами в облако позволяет значительно ускорить процесс.
Мы все еще маленький стартап, и это дает нам преимущество: мы можем проявлять гибкость в обслуживании корпоративных клиентов, быстро предлагать новые решения.
Почему «Войси» делает ставку именно на адаптацию для российского рынка?
Мы сосредоточились на локализации, потому что российский рынок имеет свои особенности, включая юридические требования и языковые нюансы.
Рынок достаточно большой, мы хорошо понимаем его потребности и знаем, как их удовлетворить. К примеру, диаризация в русскоязычных записях — это важный аспект, качественную реализацию которого не могут пока предложить крупные корпорации, выпустившие аналогичные нашему сервисы. А «Войси» уже справляется с этой задачей.
Это запатентованная разработка?
Да, мы запатентовали алгоритм, который включает 15 нейросетей, работающих параллельно для проверки друг друга. Это позволяет добиться низкого числа ошибок без потери скорости. Мы фокусируемся на русском языке. У нас минимальное количество ошибок и максимальное разнообразие возможностей работы с текстовыми материалами на выходе.
Кто ваша целевая аудитория?
Мы работаем как с корпоративными клиентами, так и со всеми желающими получать текстовые файлы из своих аудио посредством Telegram-бота. Это дает нам возможность постоянно получать обратную связь от большого количества пользователей. Так, например, мы услышали, что было бы полезно иметь возможность мгновенно из аудио создавать черновики постов в блогах. Мы учли эту просьбу и внедрили множество новых функций, включая возможность создания постов и викторин. Мы придаем большое значение удобству пользователей, наш Telegram-бот автоматически генерирует аккуратно оформленные документы. Это означает, что пользователям не нужно прилагать никаких дополнительных усилий для получения качественной расшифровки звонков или лекций в формате PDF. Для нас это важно.
Как вы смотрите на хайп вокруг искусственного интеллекта, какие видите сдвиги в бизнес-процессах, в мире, в жизни?
Я вижу, что мы еще в самом начале пути. Пока никакого значительного эффекта на глобальную экономику ИИ не произвел, существенного внедрения в реальные бизнес-процессы не происходит, хотя оно и растет невероятными темпами. Люди уже понимают, что возможности ИИ ограничены, но пока плохо представляют, чем именно и что это за возможности. Многие пока не знают, как применить ИИ здесь и сейчас. Бизнесу еще предстоит сделать шаги на пути к обучению, нужны реальные инструменты и кейсы, нужен ликбез, что такое искусственный интеллект и где его применять.
А какие перспективы вы видите для ИИ в бизнесе?
Сейчас ИИ помогает решать специфические задачи, такие как транскрибация и распознавание речи в нашем случае. Но впереди еще много шагов, связанных с интеграцией ИИ в бизнес-процессы. Важно правильно понимать, где ИИ может быть полезен, и не ожидать, что он решит все проблемы. В будущем мы видим ИИ как узконаправленного помощника в определенных областях.
Как, по вашему мнению, меняется уровень доверия пользователей к технологиям ИИ?
Уровень доверия нормализуется. Я бы сказал, постепенно формируется зрелое понимание возможностей и ограничений ИИ. Пользователи начинают понимать, что ИИ, хорошо справляясь с одними задачами, может ошибаться в чем-то другом. Но ведь это происходит и у людей — мы тоже ошибаемся.
На какой период вы планируете развитие проекта как бизнеса?
Самые дальние бизнес-планы у нас на три года. Они довольно общо сформулированы и собраны из целей основателей. У «Войси» четыре кофаундера, поэтому мы собрали все, чтобы каждый достиг своих целей. В 2024 году мы планировали максимум на месяц вперед, а сейчас имеем перед собой план на 2025-й год.
Что бы вы посоветовали начинающим предпринимателям в сфере ИИ?
Главное — сталкивать свои идеи с реальностью. Общение с пользователями и тестирование продукта на реальном рынке — лучший способ понять, что работает, а что нет. Искусственный интеллект — это всего лишь один из инструментов, и успешный бизнес строится на том, как вы умеете использовать эти инструменты.
Интересное:
Новости отрасли:
Все новости:
Публикация компании
Профиль