Top.Mail.Ru
РБК Компании
Главная SML 27 марта 2026

Как выстроить системную безопасность ИИ

Технический директор СофтМедиаЛаб Максим Горшков — о том, как выстраивать контроль агентного ИИ на уровне архитектуры
Как выстроить системную безопасность ИИ
Источник изображения: Freepik.com
Максим Горшков
Максим Горшков
Технический директор SML

20+ лет в разработке ПО: от программиста до CTO. Полный цикл разработки — от идеи до запуска. Экспертиза: телеком, финтех, ритейл, MES, промышленная диспетчеризация.

Подробнее про эксперта

Первый тревожный сигнал для ИТ-директора сегодня звучит не из центра мониторинга и реагирования на инциденты (SOC) и не из отчетов по уязвимостям. Он появляется раньше — в момент, когда ИИ-агент впервые получает право что-то сделать в продакшене. Не ответить. Не подсказать. А именно — выполнить действие.

После появления агентных решений у крупных вендоров компании начали передавать ИИ доступ к рабочим системам, коду и внутренним данным. Параллельно усиливается регулирование — вводятся требования по защите данных и объектов критической информационной инфраструктуры.

Бизнес внедряет ИИ-агентов как инструмент повышения эффективности, но фактически получает новый слой инфраструктуры без выстроенной модели управления.

В предыдущих материалах мы уже разбирали, как меняется природа угроз и какие реальные инциденты происходят, когда агент действует вне контроля. Теперь ответим на главный вопрос: как выстроить безопасность так, чтобы предотвращать инциденты на уровне архитектуры.

Где компании начинают терять контроль

Первый признак проблем почти никогда не выглядит как инцидент. Он выглядит как удобство: команда подключает агенту доступ к системе управления задачами — «чтобы ускорить процессы». В этот момент кажется, что все работает идеально. Но именно здесь возникает новый контур риска — тихий и почти незаметный.

В большинстве компаний внедрение ИИ-агентов сегодня идет быстрее, чем появляется инфраструктура контроля. Агентам выдают права доступа, их подключают к внутренним системам и данным, но прозрачности того, как именно они действуют, зачастую нет.

В результате возникает ситуация: полномочия есть, а управляемости — нет.

На практике это означает, что при возникновении инцидента компания часто не может ответить на базовые вопросы: какой агент инициировал действие, к каким данным он обращался, какие запросы привели к утечке или ошибке. Именно этот разрыв сегодня становится главным источником рисков.

Где искать системное решение

Когда мы начали глубоко разбирать инциденты с ИИ-агентами, стало очевидно: попытки закрывать риски точечными запретами или ручными регламентами не работают. Агенты действуют слишком быстро, их поведение слишком вариативно, а количество сценариев использования растет экспоненциально.

Мы столкнулись с тем, что подход «запретить подозрительное» в мире агентов лишен смысла. Нужно было найти способ смотреть на безопасность ИИ как на целостную систему, где каждый элемент — данные, модель, инфраструктура, права доступа — должен быть управляем и прозрачен.

Именно тогда мы обратились к модели SAIMM (Secure AI Maturity Model), которая позволяет разложить риски по полкам и понять, где у компании действительно есть слабые места. SAIMM выделяет шесть доменов: от управления и данных до безопасности самих агентов и цепочек поставок. Это дает возможность вести диалог с заказчиком предметно: не «нам нужно защитить ИИ», а «давайте посмотрим, на каком уровне зрелости вы находитесь и что нужно сделать для перехода на следующий». 

Подробно подход SAIMM (Secure AI Maturity Model) разбирали в этой статье.

Но даже с хорошей методологией оставался один ключевой вопрос, который мне задавали клиенты: «Хорошо, мы понимаем риски. Но как нам увидеть, что агент делает прямо сейчас? Не в логах „когда-нибудь потом“, а в момент действия. И еще важнее — как остановить это действие, если оно выходит за рамки?»

Этот разрыв между стратегией и реальным контролем в реальном времени — самое больное место.

Как защитить действия ИИ-агентов на практике

Изначально мы пытались адаптировать существующие системы DLP (Data Loss Prevention — предотвращения утечек данных) и логирования, но быстро поняли, что они не подходят. Агенты общаются с моделями на естественном языке, их действия не укладываются в простые сигнатуры. Здесь нужен другой инструмент, который понимает контекст взаимодействия: что агент планировал, какие инструменты вызывал, какие данные получил.

Хорошая новость — такие системы для защиты ИИ-агентов есть. Они делают поведение агентов прозрачным и управляемым в реальном времени. Например, КиберАгентРевью (CyberAgentReview). Эта система не заменяет существующие средства контроля, но хорошо дополняет их, предоставляя недостающий слой видимости на уровне действий агентов.

Расскажу на примере недавнего внедрения в крупной продуктовой компании. У них работало несколько агентов: в разработке, поддержке, аналитике. Формально доступы были настроены, но никто не мог сказать, что именно эти агенты делают в системе управления проектами (Jira) и корпоративной базе знаний (Confluence).

Мы установили легковесные прокси-сервисы на машины разработчиков — они стали единым шлюзом для всех обращений к языковым моделям. Для сотрудников ничего не изменилось, агенты продолжили работать, но в центральной консоли стало видно полную картину.

Оказалось, что один из агентов, который должен был заниматься исправлением ошибок в коде, регулярно запрашивал доступ к финансовой документации по проекту. В результате анализа мы выяснили, что это происходило не из-за промпт-инъекций, а из-за обобщенной формулировки задачи в исходном промпте. Это классический пример избыточных привилегий. Благодаря системе для защиты ИИ-агентов получилось это увидеть и скорректировать поведение агента до того, как произошла утечка.

Другой случай — попытка агента установить на машине разработчика npm-библиотеку, содержащую демона для удаленного выполнения команд. Благодаря настроенной системе проверки устанавливаемых компонентов система защиты ИИ-агентов распознала аномалию и заблокировала действие, запросив подтверждение у разработчика. Инцидент был предотвращен.

Отдельный класс ситуаций связан с утечками данных: агенты могут передавать во внешние модели фрагменты кода, ключи или содержимое внутренних документов, если такие ограничения не заданы явно. Поэтому на практике применяется автоматическая фильтрация и маскирование чувствительных данных до их выхода за пределы инфраструктуры. Хорошо, когда система защиты ИИ-агентов имеет функцию маскировки данных и блокировки передачи чувствительных данных. 

Три момента, которые меняют подход к ИИ

В ходе внедрений становится заметно несколько повторяющихся эффектов, которые существенно меняют отношение заказчиков к безопасности ИИ.

  • Первый — когда ИТ-директор впервые видит в дашборде реальную картину того, какие данные запрашивают агенты и куда они их передают. Это всегда отрезвляет. Оказывается, что многие представления о безопасности были иллюзией.
  • Второй — когда мы показываем, что часть действий можно автоматически блокировать, не полагаясь на дисциплину сотрудников и не замедляя разработку. Это снимает огромный пласт напряжения между командой информационной безопасности и разработчиками.
  • Третий — когда CTO понимает, что с таким уровнем контроля он может внедрять новые ИИ-функции без бесконечных согласований с безопасностью. Система становится не стоп-фактором, а энтузиастом инноваций.

Что меняется после выстраивания контроля

Когда контроль над ИИ-агентами выстроен, компания выходит из режима «надеемся, что все работает» и переходит к управляемой прозрачности.

Появляется возможность не просто реагировать на инциденты, а понимать систему в целом: какие агенты существуют, какие у них права, как они принимают решения и с какими данными и инструментами работают.

Действия агентов становятся наблюдаемыми в реальном времени, а аномалии — управляемыми. Чувствительные данные перестают «утекать по умолчанию», потому что на уровне архитектуры появляются механизмы их фильтрации и ограничения.

Важно и другое: появляется полноценная воспроизводимость. Инциденты больше не расследуются по обрывкам логов — есть полная цепочка: что произошло, почему и на каком этапе.

Для службы безопасности это означает готовность к аудиту и соответствию требованиям регуляторов. Для бизнеса — возможность масштабировать использование ИИ без риска неконтролируемых последствий.

И в этот момент ИИ-агент перестает быть «черным ящиком» внутри компании. Он становится таким же управляемым элементом инфраструктуры, как и любые другие критически важные системы.

Рекомендации партнеров:

Новости отрасли:

Все новости:

Профиль

Дата регистрации
4 июня 2015
Уставной капитал
100 000,00 ₽
Юридический адрес
обл. Свердловская, г. Екатеринбург, ул. Мамина-Сибиряка, стр. 101, офис 8.19
ОГРН
1156658028009
ИНН
6658472405
КПП
667001001
Среднесписочная численность
42 сотрудника

Контакты

Адрес
620075, Россия, Свердловская обл., г. Екатеринбург, ул. Мамина-Сибиряка, стр. 101, офис 8.19

Социальные сети

ГлавноеЭкспертыДобавить
новость
КейсыМероприятия