Зайнулла Жумаев: «ИИ обучается на данных с наших устройств»
Разработчик-исследователь ГК InfoWatch, кандидат технических наук Зайнулла Жумаев рассказывает, как и зачем умные гаджеты собирают информацию о владельцах

Зайнулла Жумаев — кандидат технических наук, старший разработчик-исследователь в ГК InfoWatch.
Как наши умные гаджеты шпионят за нами и шпионят ли они вообще? Если да, как спастись от слежки?
Действительно, умные гаджеты собирают информацию. Как ИТ-специалист, я стараюсь у себя дома построить инфраструктуру так, чтобы от слежки избавиться. Это требует больших усилий, и полностью от слежки избавиться невозможно. Нужно понимать, чем мы готовы пожертвовать, а чем нет, какую информацию мы хотим в первую очередь защитить, а какой готовы поделиться, допустим, с провайдером или с производителем устройства.
Если дома есть набор устройств — телефон, компьютер, увлажнитель воздуха, робот-пылесос, посудомойка, видеоняня и так далее. Как оценить, что из этого опасно?
Нужно посмотреть на набор датчиков, который есть на каждом устройстве. Подключено ли оно к сети? Хранит ли какую-то информацию? Например, робот-пылесос может хранить карту вашего дома. Увлажнитель вряд ли хранит что-то, кроме названия и пароля вашей сети Wi-Fi. А телефон хранит очень много разной информации: пароли от сервисов, документы, фотографии.
Нам всегда приходится выбирать между конфиденциальностью и доступностью. Если мы хотим на прогулке включить робот-пылесос удаленно, то должны понимать: требуется, чтобы он был подключен к интернету.
Пока устройство не подключено к сети, оно не несет никакой опасности для владельца? Или даже без сети все равно собирает информацию, а при подключении к сети эти данные улетают?
В целом — отключенное устройство безопасно, но оно общается со своими серверами при подключении к сети, а некоторые устройства требуют постоянного подключения через сервер устройства. Например, тот же робот-пылесос должен постоянно общаться со своим сервером, чтобы понять, что ему пришла команда на включение.
В домашней ИТ-инфраструктуре я установил на собственный сервер операционную систему с открытым исходным кодом. Там практически ничего не было, но когда я зашел в графики трафика на Wi-Fi-роутере, я увидел, что сервер в постоянном режиме что-то отправляет со скоростью 300 кбит/с. Это не та скорость, чтобы отправлять видео, но достаточная, чтобы отправлять другую информацию. Вопрос: что отправляется? Если этот сервер не призван обслуживать какой-то сервис, доступный из внешнего мира, это остается загадкой.
Что касается других умных устройств — умных колонок и смарт-ТВ, которые уже есть почти у всех — они в фоновом режиме считывает информацию о нас, о доме, о быте, где-то ее хранят и передают?
Да. Допустим, если говорить про умную колонку: только небольшая часть функций доступна без сети, даже с точки зрения технических возможностей. Если мы спрашиваем что-то у колонки, она производит поиск в интернете, потому что базу знаний в колонку не поместить. Сейчас есть модели, которые позволяют голос распознавать локально и выполнять определенный функционал. Но если мы захотим послушать музыку, ее нужно скачать из интернета — значит, колонка подключается к сети. У себя дома я умную колонку не ставлю, хотя жена уговаривала.
Как могут использоваться данные, которые собирают умные устройства?
Помимо маркетинговых исследований и персонализированной рекламы, сейчас есть еще одна ключевая цель — искусственный интеллект. ИИ требует разработки новых моделей, новых архитектур, а для этого нужны большие объемы данных. Причем важно, чтобы эти данные были настоящими.
Сейчас у нас очень много контента в интернете, сгенерированного ИИ. Если на этом обучается следующее поколение ИИ, то качество не будет улучшаться. Поэтому нужны настоящие данные — их можно собирать с устройств пользователей.
И поэтому, например, облачные сервисы могут предлагать безлимитное облачное хранилище, если разрешить автоматическую загрузку фотографий со смартфона?
Да, это верно. Такой добрый провайдер говорит: «Я даю тебе бесконечное хранилище, только включи автоматическую загрузку в облако». А если мы делаем фотографию на камеру, это в большинстве случаев настоящее изображение, а не сгенерированное. Оно как раз хорошо подходит для обучения нейросети.
Какие советы по информационной безопасности вы можете дать людям, чтобы исключить или минимизировать слежку с помощью умных устройств?
Первое — начать с телефона: удалить лишние приложения, отозвать лишние разрешения. Второе — установить двухфакторную аутентификацию на мессенджеры и почтовые приложения. Третье — на своем домашнем роутере для умных устройств создать отдельную Wi-Fi-сеть. И четвертое: если вы храните какие-то данные в облаке, то самые чувствительные данные следует хотя бы положить в запароленный архив.
Рубрики
Рекомендации партнеров:
Новости отрасли:
Все новости:
Публикация компании
Достижения
Профиль
Контакты
Социальные сети
Рубрики
