Как нейросети получают информацию, и сколько приходится за нее платить
На Западе все чаще ИИ-разработчики заключают договоры с собственниками контента на получение доступа к информации. Возможен ли подобный сценарий в России

ИИ — моя сфера интереса. Я твердо уверен, что нейросети не заменят людей, но люди, использующие нейросети заменят тех, кто их не использует
Как показало исследование AP-NORC Poll, 60% пользователей старше 30 и 74% молодых людей до 25 лет в США используют нейросети для поиска информации. По данным ВЦИОМ, точно так же ИИ используют 60% россиян. Но для того, чтобы давать точные ответы на вопросы, нейросети должны получать информацию как из датасетов, на которых они обучались, так и из актуальных источников. В 2025 году во многих странах мира последние стали платными. Но в России этот тренд пока не прижился, и вряд ли приживется в ближайшее время.
Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета «Зерокодер». Искусственный интеллект — мой постоянный помощник и важная часть моей жизни. В этот раз разберемся, как именно нейросети получают информацию, и почему в западных странах разработчикам приходится за нее платить.
ИИ-разработчиков заставляют платить
К началу 2026 года подход к поиску информации с помощью ИИ кардинально изменился. Говоря коротко, все чаще создатели контента делают его платным для нейросетей. К примеру, в отчете Reuters Institute for the Study of Journalism (RISJ) «Journalism, media, and technology trends 2026», перечислены основные медиахолдинги, закрывшие ИИ бесплатный доступ к информации, размещенной на их ресурсах. В этот перечень попали Associated Press, Axel Springer, платформы Reddit, Stack Overflow и др. При этом 34% медиагигантов, включая BBC, The New York Times, Daily Mail и Sky News, полностью закрыли свои порталы для несанкционированного сбора данных.
Больше всего подобных компаний и ресурсов базируются в США. Согласно исследованию Research and Markets, именно американские медиахолдинги, а также разработчики специализированных библиотек контролируют 40% мирового рынка баз данных для обучения нейросетей. В денежном выражении его объем к 2026 году достиг $3,96 млрд.
Получение доступа к архивам крупного медиа в западных странах — удовольствие не из дешевых. По данным EDRM, стоимость годовой подписки для ИИ-разработчиков стоит от $5 млн до $20 млн. Суммы сделок с новостными агрегаторами достигают $70 млн.
Новые правила доступа
В сентябре 2025 года по инициативе организация RSL Collective был создан новый стандарт лицензирования, помогающий интернет-ресурсам определить условия предоставления доступа к своим данным. Его поддержали более 1,5 тыс. медиа, а том числе The Guardian, BuzzFeed, USA Today Co., Vox Media и др.
Сам стандарт, а также соглашения о доступе к базам данных потребовались после того, как крупные информационные ресурсы, видеостудии, маркетинговые агентства, университеты и другие организации начали массово подавать иски против ИИ-компаний, стремясь защитить свою интеллектуальную собственность.
Но даже с появлением подобных правил обучение ИИ в мире все еще остается в серой зоне. Впрочем, медиагиганты все внимательнее следят за принадлежащей им информацией, а штраф за ее несанкционированное использование может составить, к примеру, $3-5 млрд.
Проблема для ИИ-стартапов
Стоимость контента для крупных ИИ-корпораций не представляет большой проблемы. Зато ИИ-стартапы по всему миру оказываются в непростой ситуации. Как показало исследование RBC Wealth Management, теперь расходы на базы данных составляют в среднем 25% их операционного бюджета.
Крупные корпорации сразу закладывают на покупку контента десятки, а то и сотни миллиардов долларов. К примеру, корпорация Meta (признана экстремистской организацией и запрещена в России) планирует в этом году направить на развитие ИИ до $135 млрд, значительная часть которых пойдут на заключение контрактов на предоставление доступа к информации.
При этом искать обходные пути и не платить — плохая идея. По данным RISJ, это грозит снижением точности ответов нейросетей на 30%.
Цены для пользователей
Опосредованно контент оплачивают и пользователи нейросетей, если говорить о платных версиях ИИ-моделей. Во-первых, это заложено в стоимость подписки.
Но многие переходят на usage-based модели оплаты или оплаты по факту использования. По данным RBC, на нее перешли уже 62% ИИ-сервисов. При этом стоимость корпоративных нейросетей теперь может составить до $5 тыс. в месяц. Разработчики вынуждены повышать цены, чтобы сократить издержки на оплату лицензионного контента.
Некоторые правозащитники обеспокоены. Как отмечают эксперты международной юридической компании Slaughter and May, в сложившейся ситуации возникают скрытые препятствия для свободного пользовательского доступа к данным. В долгосрочной перспективе это может создать серьезный информационный разрыв между коммерческими или корпоративными и общедоступными ИИ-системами.
Российская специфика
В России развитие искусственного интеллекта — национальный приоритет, а к подобным вещам в нашей стране особое отношение. На сегодняшний день еще никто не слышал о крупных исках, которые российские медиа подавали бы против нейросетей, обращающихся к их контенту для генерации ответа на вопрос пользователя.
Более того, например, Союзмультфильм, как и Disney, разрешил использовать своих персонажей для создания мультфильмов с помощью ИИ. Правда, наша студия сделала это ради конкурса, посвященного ее юбилею.
Россия пока вдалеке от мирового тренда на платный контент. Отечественные нейросети пользуются информацией из открытых источников, а это практически все медиаресурсы в нашей стране.
При этом российские регуляторы больше внимания уделяют вопросам авторского права в применении к ИИ-контенту, этическим нормам работы с нейросетями и правилам ответственного использования искусственного интеллекта.
Если в нашей стране и подавали иски, связанные с ИИ, ситуации отличались от западных примеров. Так, в 2024 году Арбитражный суд Москвы присудил компании штраф в размере 500 тыс. рублей за использование дипфейк ролика с образом Киану Ривза. Выяснилось, что создали его специалисты другой компании. Суд установил, что технология Deep-fake — «дополнительный инструмент обработки видеоматериалов (технического монтажа), а не способ их создания». Права на ролик были оставлены за создателями, а бесплатное его использование было пресечено.
При этом стоит помнить: нейросети не придумывают нового, а виртуозно перекомпоновывают уже известное. В итоге, всегда есть шанс, что в созданном ИИ контенте будут признаки чужой работы. Если это обнаружится, автор может подать в суд, а штраф — достичь 5 млн рублей. В такой ситуации лучше всегда проверять генерацию на плагиат, а потом дорабатывать ее самостоятельно.
Выбор между первоисточником и вторичной информацией
Платные подписки на информационные порталы — установившаяся норма для многих стран мира. Если раньше ее оформляли сами читатели, теперь это делают разработчики нейросетей под давлением судебных исков со стороны редакций и их владельцев. При этом все большую популярность набирают данные, сгенерированные одними ИИ-моделями, а используемые — другими. По прогнозу Gartner, подобная практика может стать доминирующей для 90% датасетов, на которых обучаются нейросети.
Впрочем, вряд ли эти сгенерированные базы окажутся бесплатными. Тогда перед ИИ-разработчиками встанет выбор — оформлять соглашение с первоисточником или приобретать уже переработанную другой моделью информацию с возможными ошибками. Как предполагают аналитики McKinsey, большинство крупных ИИ-компаний все-таки выберут первый путь, даже если это повысит стоимость доступа к нейросетям для обычных пользователей.
Пока этот тренд не пришел к нам, так что, на мой взгляд, у российских разработчиков нет поводов для серьезного беспокойства. При этом пользователям нейросетей необходимо аккуратно использовать сгенерированный контент в коммерческих целях. Лучше воспринимать его как заготовку для будущего уникального продукта, чем как уже законченное его воплощение.
Материалы партнеров РБК:
Новости отрасли:
Все новости:
Публикация компании
Достижения
Профиль
Контакты