День российской науки с Анной Калюжной: как ИИ меняет труд исследователей
Об агентных технологиях рассказывает кандидат технических наук, старший научный сотрудник ИЦ «Сильный искусственный интеллект в промышленности» ИТМО

С 2011 года участвует в научных проектах, с 2021 возглавляет магистратуру ИТМО «ИИ в промышленности», с 2022 отвечает за работу с индустриальными партнерами в исследовательском центре университета
Наука сотни лет развивалась с помощью естественного интеллекта, зачем ей искусственный?
Ни для кого не секрет, что научные открытия все эти сотни лет случались крайне редко. Умных людей на земле мало, и их возможности ограничены человеческой производительностью.
Сейчас уже можно говорить о том, что открытия делаются не только долго, но и дорого. И это даже в тех в сферах, где накоплено большое количество данных, в том числе в открытом доступе. Возьмем, например, химию. Инновации тут — поиск новых формул и схем синтеза. Вот уже двадцать лет для этого серьезно применяют искусственный интеллект, хотя первые попытки делали уже 40-50 лет назад (у меня, например, есть книга про ИИ в химии 1988 г.). Ожидания все растут, но катарсиса пока не происходит. По-прежнему нужно слишком много человеческого ресурса вкладывать в этот процесс.
Но статьи в авторитетнейших научных журналах за последний год просто пестрят заявлениями различных исследовательских групп по всему миру о том, что вот-вот будет достигнут уровень профессионального искусственного интеллекта в области химии, биомедицины, биологии. И этот профессиональный искусственный интеллект построят на агентных технологиях, что и даст существенный скачок в производительности труда ученых.
Ведь что мы ожидаем от систем искусственного интеллекта, которые применяются для сложных профессиональных задач? Как правило, это набор нетривиальных вычислений и очень четкое оперирование фактами. И вот тут нас ждет неприятный сюрприз. Языковые модели — это не те инструменты, которые по умолчанию хорошо с этим работают. Но они могут создавать гибкие интерфейсы между остальными системами, моделями, блоками, которые будут отвечать за оперирование фактами, за нетривиальные вычисления и так далее. И все то что делали люди, все то что составляло основную сложность для того, чтобы внедрять новые технологии, они потенциально могут взять на себя.
Почему именно агентные технологии искусственного интеллекта могут стать драйвером исследовательской работы?
Ни одна глубокая модель машинного обучения, которая создавалась для специализированных задач, не способна хорошо обобщаться. Одновременно ни одна, даже самая большая языковая модель, обученная для максимально широкого класса задач, не способна не способна специализироваться на узких задачах.
Было уже много попыток создать одну большую модель, которая будет знать абсолютно все обо всем. Но на практике есть две большие проблемы: во-первых, это эффективность с точки зрения используемых ресурсов, а во-вторых, проблема так называемого катастрофического забывания. Это когда мы пытаемся втолкнуть в модель очередной новый узкий навык, а она в ответ забывает что-то из ранее изученного.
Чтобы все это преодолеть, разработчики научили самые умные в мире модели самостоятельно использовать инструменты, которые существуют независимо от них. Именно в этом и заключается «агентность». Агент представляет собой ПО, которое имеет ядро в виде большой языковой модели, которая либо дообучена, либо заинструктирована на выполнение определенной роли, а также имеет доступ к набору внешних инструментов, которые можно использовать для решения поставленных задач. Таких агентов (по-разному специализированных) может быть несколько, и они могут решать задачу сообща, формируя мультиагентную систему. Например, для решения задачи подбора и обучения модели ИИ для предсказания свойств и синтеза молекул.
Есть ли уже в России такие агентные системы искусственного интеллекта?
С 2024 года в исследовательском центре «Сильный искусственный интеллект в промышленности» ИТМО мы занимаемся разработкой различных мультиагентных систем на основе больших языковых моделей для помощи ученым в цифровых научных исследованиях, градостроителям и управленцам. Большие языковые модели тут управляют инструментами обучения генеративных моделей, моделей машинного обучения, инструментами визуализации и анализа данных.
В центре системы находится агент-планировщик, которые заставляет все элементы системы в правильной очередности решать одну общую задачу. Причем, конечный пользователь, может и не понять, что стоит за интерфейсом, на какие факты опирается система для дачи ответов.
Можно ли будет использовать научную ИИ-систему, например, для наукоемких производств?
И здесь основной вопрос именно в данных, которые можно использовать. Фарма развивается сейчас такими бешеными темпами именно потому, что там накоплено огромное количество данных, в том числе в открытом доступе. И это дает пищу для искусственного интеллекта, для обучения, развития и так далее. То есть для каждой отрасли ключевой вопрос применения искусственного интеллекта — это вопрос наличия и качества и открытости данных.
В каких отраслях подобные системы будут наиболее эффективны?
Они могут быть потенциально эффективны во всех отраслях, но быстрее всего внедряться они будут там, где сейчас слабо развита вычислительная база и автоматизация, но при этом накоплено достаточно данных. В основном, это отрасли, где необходимо работать со слабо структурированными данными. Например, отрасли, берущие свое начало от наук о жизни и от гуманитарных наук.
Интересное:
Новости отрасли:
Все новости:
Публикация компании
Профиль
Социальные сети