Утечка документов показала, как готовилась сеть фейковых сайтов и обучение ИИ для распространения пропаганды

В серии утёкших документов описаны планы по созданию клонированных энциклопедий, фальшивых СМИ и аналитических центров для манипулирования результатами поисковиков и больших языковых моделей.

Коротко о главном

Утечка множества внутренних документов раскрывает систему проектов по созданию широкой сети справочных сайтов в стиле «Википедии», поддельных СМИ и фейковых аналитических центров. Цель — заполнить интернет нужным контентом, чтобы влиять на поисковые выдачи и большие языковые модели, которые используют этот контент для генерации ответов.

«Они пытаются пробиться в поисковики, наводняя интернет‑пространство контентом, содержащим перекрестные ссылки на их материалы или нарративы. Это обходной способ проникновения в популярные чат‑боты и поисковые системы», — пояснила Катерина Седова, приглашённый старший научный сотрудник Центра по изучению Евразии при Атлантическом совете.

Основные элементы схемы

В утекших материалах подробно описаны несколько направлений работы:

  • Создание клонов энциклопедий и справочных сайтов с отредактированными страницами для распространения сфабрикованных сведений о политических деятелях и странах.
  • Разработка и распространение тысяч веб‑страниц, редактирование сотен статей в месяц с учётом требований поисковых систем.
  • «Тренировка» и «обучение» искусственных интеллектов на пропагандистских материалах, чтобы ИИ воспроизводил нужные нарративы.
  • Создание подставных аналитических центров и переписывание материалов авторитетных изданий с подведением нужных выводов.

Примеры из документов

В одном проекте планировалось создать «Википедию»-клон с фальшивыми материалами о властях Армении, куда вставлялись сфабрикованные сведения о преступной деятельности политика. Редакторы предлагалось отслеживать самые посещаемые страницы и подмешивать туда нужные «сведения» через ссылки и информационные блоки.

Найдены примеры сайтов с копиями и отредактированными статьями на русском языке, размещённых на одном IP‑адресе и зарегистрированных в январе. В документах предлагалось вести часть проектов из других стран, чтобы скрыть прямую связь с организаторами.

Для Германии в одном из планов фигурирует создание 200 000 страниц и задача редактировать по 100 статей в месяц, а также ежемесячно «обучать» шесть ИИ‑платформ на отредактированных текстах.

Отдельные документы демонстрируют попытки продвигать публикации ультраправых и ультралевых политиков во Франции и другие таргетированные кампании по разным странам.

Фигуранты и кураторы

В утечке названы руководящие фигуры, среди них упоминается София Захарова, находящаяся под санкциями ЕС и занимающая руководящую должность в одном из департаментов по развитию ИКТ при администрации президента. Куратором проектов называется первый заместитель главы администрации президента Сергей Кириенко.

Связь некоторых проектов с российскими структурами в 2024 году отмечалась и в материалах, опубликованных в официальных сообщениях зарубежных ведомств.

Чем это опасно

Заполнение интернета согласованным контентом с перекрёстными ссылками повышает вероятность того, что поисковые системы и большие языковые модели будут учитывать эти материалы при формировании результатов и ответов. Это создаёт устойчивый канал распространения дезинформации и искажённых выводов для широкой аудитории.

  • Манипуляция поисковой выдачей и обучающими датасетами ИИ.
  • Создание видимости объективности через «справочные» сайты и аналитические центры.
  • Скрытие реальных связей через регистрацию доменов и хостинг в третьих юрисдикциях.

Утечка подчёркивает необходимость более тщательного анализа источников в интернете и внимания к тому, какие материалы попадают в обучающие выборки для крупных ИИ‑систем.