Читайте РБК без баннеров

Подписка отключает баннерную рекламу на сайтах РБК и обеспечивает его корректную работу

Всего 99₽ в месяц для 3-х устройств

Продлевается автоматически каждый месяц, но вы всегда сможете отписаться

Большие данные и большая политика: как технологии влияют на выборы

Фото:Ilya Pavlov / Unsplash, Saul Martinez / Getty Images
Фото: Ilya Pavlov / Unsplash, Saul Martinez / Getty Images
В июне 2020 года вышла расширенная версия доклада о возможном вмешательстве России в выборы в США в 2016 году. Перед очередными выборами вспоминаем, как развивалась история с манипуляциями и причем тут большие данные
1
С чего все началось

В июле 2016-го Дональд Трамп победил на президентских выборах в США. В ноябре CNN сообщила, что избирательный штаб Трампа сотрудничает с компанией Cambridge Analytica, которая специализируется на политтехнологиях и получила за свои услуги более $5 млн. В декабре швейцарское издании Das Magazin выпустило расследование о том, что победу Трампу принесли большие данные — точнее, адресная агитация в сети (полный перевод с немецкого на русский на сайте The Insider).

В статье говорится о технологии микротаргетинга. В Cambridge Analytica протестировали пользователей соцсетей по 5 тыс. разных параметров. Среди них — политические пристрастия, кандидата на предыдущих выборах, любимые ТВ-шоу и сериалы, предпочитаемые товары и др. Затем людей разделили на небольшие группы и каждой группе показывали свое обращение с агитацией — в соцсетях, фильмах или передачах, которые они смотрят (не только на ТВ, но и в сети).

Почему пароли стали небезопасны и как теперь защитить свои данные Фото:Thomas Breher / Pixabay

Cambridge Analytica уже работала во время выборов разного уровня в США в 2014 году. Два года спустя о ней заговорили благодаря кампании Теда Круза — сенатора-республиканца, который был конкурентом Трампа на президентских выборах. Спонсором кампании выступил Роберт Мерсер — совладелец Cambridge Analytica.

В сентябре 2016, еще до президентских выборов, Александр Никс — глава компании — в своей презентации на Concordia Summit в Нью-Йорке рассказал, что успех Теда Круза — это результат их работы. Он также намекнул, что ту же технологию они планируют применить и в кампании Трампа.

2
Как все было на самом деле?

Еще в 2015 году Александр Коган — профессор психологии Кембриджского университета — создал опросник thisismydigitallife и запустил его на платформе Facebook. Пользователи сами давали разрешение на сбор и передачу данных и даже получали деньги за прохождение теста. Собранные данные он передал Cambridge Analytica. Всего, по оценке Facebook, компания получила данные о 87 млн пользователей.

Фото: Stefanie Loos / Reuters
Фото: Stefanie Loos / Reuters

В данных, которые привела Das Magazin усомнились многие издания. Например, в статье говорится, что Cambridge Analytica может рассылать таргетированные сообщения каждому избирателю, что повышает вероятность успешного воздействия на на 1400%. Однако никаких объективных доказательств этому нет — как и роли микротаргетинга в кампаниях Круза и Трампа. Швейцарская газета NZZ подсчитала, что реальная конверсия не может быть выше 60%. К тому же, Cambridge Analytica работала и над кампанией Бена Карсона, которая провалилась.

Важная деталь: в состав совета директоров Cambridge Analytica входит Стивен Бэннон — глава предвыборного штаба Трампа, а затем и главный стратег Белого дома. Кажется, этот факт мог стать решающим при выборе компании в качестве подрядчика.

В 2018 году телеканал Channel 4 выпустил фильм-расследование, из которого следует, что Cambridge Analytica имеет отношение к более 200 политических кампаний по всему миру. Среди них — голосование по Brexit, выборы в Кении, Нигерии, Чехии и Аргентине. Но оказалось, что микротаргетирование тут практически не при чем: компания активно использовала взятки, компроматы и прочие манипуляции. Позже, в ходе расследования Мюллера, вскрылись и другие нелегальные приемы — вплоть до слива личной переписки.

3
Получается, микротаргентинг не работает?

Работает, но не так очевидно. Таргетированная реклама — то есть направленная на узкую аудиторию — и правда эффективнее обычной. Недаром ее доля в соцсетях и поисковиках постоянно растет.

Крупные бренды тратят немало средств на то, чтобы изучить своих потребителей и обратиться к ним с наибольшим эффектом. Именно им продают данные Facebook, Google и другие корпорации, чтобы те размещали у них таргетированную рекламу. Персонализированная система рекомендаций увеличивает доход Amazon до 30% в год.

Фото: Justin Sullivan / Getty Images
Фото: Justin Sullivan / Getty Images

Но одно дело — побудить к покупке платья в интернет-магазине, и совсем другое — повлиять на политическое решение. Особенно в США, где к выборам относятся серьезно, проводят их в несколько этапов и тщательно следят за кампаниями кандидатов. На выбор избирателя тут влияет множество факторов. Среди ключевых — социальный статус, работа, политические и социальные взгляды. Реклама, даже самая эффективная, не сможет перечеркнуть все это.

4
Так можно ли влиять на политику с помощью больших данных?

Помимо Cambridge Analytica, на продаже данных поймали немецкую Deutsche Post, которая передавала их политическим партиям — в том числе Христианско-демократическому союзу Ангелы Меркель. В тех же штатах работают компании-брокеры, которые специализируются на сборе данных и продаже другим компаниям — например, Axiom и Experian.

Данные, даже обезличенные, действительно имеют высокую цену, но нужно уметь ими пользоваться.

Как защитить свои данные в сети?

Артур Хачуян, гендиректор Tazeros Global Systems:

Многие думают, что Трамп сидел дома на своей вилле с Меланьей и ничего не делал, а какие-то бородатые мужики — вот как в фильме про американских хакеров — накликали, бум! И он победил со 100% выбором. По сути дела, ребята запустили кучу тестов в Facebook. На основании ответов «Какой ты пирожок? С вишней или с черникой?» — понимали, что этот красненький, а этот — синенький. Разрезали эти аудитории, загружали их в Facebook и просто делали линейкой рассигментацию.

То есть Хилари Клинтон, условно, провела десять встреч, а Трамп — 1,1 тыс., но для меньшей аудитории. Дело тут даже не в анализе данных — это просто правильный политический подход. Ты не собираешь гигантский стадион, а приходишь просто к учителям и говоришь: «учителя, я вам подниму зарплату!». Потом приходишь к студентам, говоришь: «а я учителей всех уволю, будет у вас самый бесконтрольный вуз!»

Большинство его выступлений были абсолютно противоречивые — о чем, собственно, писали СМИ. Но сверхбольшой массив данных дает тебе среднестатистическую картину пользователя. Когда данных слишком много, алгоритму приходится сужать этот информационный пузырь. И ты в этом мини-мирке видишь только то, что ты постоянно лайкаешь, с чем ты постоянно взаимодействуешь: он тебе постоянно это подсовывает.

5
Какие инструменты влияния данных на выборы существуют?

Самый тонкий ход — это подстраивать поисковую выдачу под конкретных пользователей. К примеру, показывать по запросу с фамилией кандидата те материалы, которые выделяют его сильные стороны, особенно значимые для этой группы.

В ноябре 2019 вышел материал The Wall Street Journal. Журналисты опросили более 100 человек и пришли к выводу, что Google активно вмешивается в поисковую выдачу с помощью специальных алгоритмов. Например, когда вы вводите в строке поиска «Дональд Трамп», система подсказывает разным людям разные варианты окончания фразы.

С 2010 по 2018 год правительства разных стран направили Google 685 тыс. запросов на удаление ссылок из поисковой выдачи. 255 тыс. из них — из России. При этом, на Google приходится 90% мирового рынка поисковых систем.

Алгоритмы на основе больших данных помогают предсказывать исход выборов, но не всегда точно. В том же 2016 многие модели отдавали победу Хилари Клинтон, включая Cambridge Analytica. Правда, в последний момент компания изменила свое мнение. Кажется, что все это — чистая математика. Но когда избиратели видят, что у их кандидата совсем нет шансов, они с большей вероятностью проголосуют за кого-то еще.

Фото: Alex Wong / Getty Images
Фото: Alex Wong / Getty Images

Еще один неочевидный инструмент политической борьбы — это законы в области больших и персональных данных.

К примеру, спустя год после избрания Трамп отменил запрет на сбор и передачу провайдерами личных данных пользователей без их ведома, который ввел его предшественник — Барак Обама. Сюда входит история поисковых запросов, история браузера, геолокации и многое другое. По сути, любые компании и госслужбы могут получить информацию о здоровья, финансовом положении, личных предпочтениях и составе семьи пользователей. Однако Facebook и Google — крупнейшие обладатели больших данных в мире — под это разрешение не попали.

Кто и зачем собирает большие данные?

В июне 2020 года, на фоне протестов в США, Amazon закрыла полиции доступ к своей технологии распознавания лиц — Amazon Rekognition. Ранее в Калифорнии госорганам запретили использовать любые технологии, связанные с распознаванием лиц, чтобы защитить права граждан. Подобный же запрет, но уже на федеральном уровне, недавно предложили демократы. Вполне вероятно, что это — камень в огород республиканцев, во главе с Трампом, и как раз накануне выборов.

6
Как обстоят дела в России?

У нас большими данными оперируют, в первую очередь, бизнес-корпорации: МТС, Сбербанк, Яндекс, Mail.ru. В политике за «работу с электоратом» в сети отвечает Агентство интернет-исследований (АИИ) — оно же «Федеральное агентство новостей» или «фабрика троллей».

Выпуск документального фильма «Холивар» Андрея Лошака, где рассказывают, как устроена «фабрика троллей»

Здесь тоже работают с поисковой выдачей, только без больших данных и алгоритмов, а вручную. Сотрудники агентства переписывают новости так, чтобы информация о важнейших политических событиях и фигурах подавалась в нужном ключе. Эти новости распространяются через издания, которые сотрудничают с агентством на правах взаимного обмена ссылками, а также — многочисленные аккаунты в соцсетях и на форумах.

В докладе Роберта Мюллера «фабрика троллей», которой владеет Евгений Пригожин, названа главным инициатором манипуляций на президентских выборах в США в 2016. По данным расследования, проведенного РБК в 2017 году, АИИ (ФАН) получили за это $2,2 млн, использовали более 6 млн подписчиков и обеспечили охват до 70 млн в неделю.

В итоге, набирая в поиске фразу или фамилию, на первой странице выдачи пользователь видит новости, которые запущены АИИ, но опубликованы в разных СМИ и соцсетях. Это создает иллюзию объективной картины и влияет на восприятие людьми событий, происходящих в стране и мире.

Следующий материал: