Об эксперте: Артур Хачуян — СЕО Tazeros Global Systems, компании, которая занимается сбором и аналитикой данных в коммерческих целях.
Правда ли, что спецслужбы следят за нами в Сети?
«Если речь про системы распознавания — да. Бесполезно обсуждать, этично это или нет: государство никогда не откажется от подобных инструментов. Но для слежки в соцсетях у наших властей просто нет ресурсов и полномочий — нужен как минимум судебный запрос. Правда, по закону многие запросы тот же Роскомнадзор может не публиковать, и мы никогда о них не узнаем.
В США вообще не требуется разрешения суда для подобных запросов: у сотрудников ЦРУ есть прямой доступ к телефонным звонкам, переписке, банковским операциям. У нас же, когда после теракта в Санкт-Петербурге сделали запрос в Telegram, чтобы раскрыть IP-адреса предполагаемых террористов, помните, какой скандал вышел? (В 2017 году после отказа передать ключи шифрования мессенджера ФСБ объявила о блокировке Telegram. В 2018 мессенджер изменил правила, согласившись передавать данные по запросу спецслужб. — РБК Тренды).
Тут важно помнить, что технологии работают в обе стороны: если государству проще следить за нами, то и нам за ним — тоже, с помощью различных онлайн-сервисов».
Соцсети манипулируют выборами?
«Я согласен с большинством выводов, которые приводят в фильме Netflix «Социальная дилемма». Всем известна такая штука, как «социальный пузырь»: когда алгоритмы машинного обучения понимают, с каким контентом вы взаимодействуете лучше всего, они стараются именно его вам подсовывать.
У современного поколения практически отсутствует критическое мышление. Они привыкли полностью доверять той информации, что получают онлайн. И так как эта информация формируется алгоритмами, она чаще всего получается очень однобокой. Если завтра Facebook захочет в определенной стране определенной части населения внушить какой-то паттерн поведения — они это сделают, продвигая тот или иной контент».
«Все помнят историю с Cambridge Analytics и победой Трампа (в 2016 году Дональд Трамп победил на выборах в США. Позже власти США обвинили хакеров, спецслужбы, а также Cambridge Analytica в манипуляциях и взломах, приведших к такому результату. — РБК Тренды). Я, конечно, ставлю на то, что в реальности алгоритмы повлияли на 15–20%, но это тоже очень существенно. И все это сделала одна компания. Сначала они опрашивали людей и сохраняли их ID, а потом показывали рекламу на основе ответов: мексиканцам обещали, что Трамп раздаст всем грин-карты, а учителям — что выгонит мексиканцев и создаст много рабочих мест».
Что не так с Facebook, Google или Apple?
«Если бы законы о данных работали на 100%, ни Apple, ни Google, ни Facebook просто бы не существовало. Весь их бизнес построен на продаже и манипулировании данными, хоть и обезличенными.
Google — это самая продвинутая технологическая корпорация. Выше уровень технической грамотности, лучше работают алгоритмы, выше уровень защиты данных — для них это главный приоритет.
Facebook как был стартапом «на коленке» с технической точки зрения, так им и остался. Отсюда — постоянное обнаружение уязвимостей. Они были и до введения GDPR (регламент, принятый в ЕС, который запрещает использовать любые данных пользователей в сети без их согласия. — РБК Тренды), просто регламент обязал соцсеть сообщать об утечках публично. Большинство утечек при этом произошло по вине самих пользователей. Они переходят по левым ссылкам, используют фишинговые страницы. У большинства один и тот же пароль для аккаунта в Facebook и онлайн-банка.
То, что Тим Кук говорит о защите данных своих пользователей — жуткая лицемерная фигня. Apple постоянно использует данные — от рекламной сегментации до взаимодействия с внутренними приложениями. Сейчас они максимально ограничивают сторонние приложения и трекеры: не хотят, чтобы кто-то еще зарабатывал на этих данных. И это правильно, но только надо честно об этом говорить».
Могут ли компании предугадывать действия пользователей?
«В онлайне это очень хорошо работает: кто куда пойдет, каким контентом поинтересуется, какую публикацию расшарит. Реклама давно уже создает интерес к какому-то контенту, а потом нам его же и показывает.
Что касается офлайн-поведения, то сейчас все крупные компании над этим работают — строят то, что у нас модно называть «экосистемами». Мы идем в сторону монополизации рынка больших данных и ИИ. Казалось бы, зачем «Сберу» покупать условный «Яндекс.Маркет»? Для того, чтобы иметь информацию для построения прогнозных моделей покупок. Зачем покупать компании с фитнес-трекерами? Для того, чтобы собирать медицинские данные.
Антимонопольные органы в разных странах, к сожалению, сквозь пальцы следят за подобными историями, плюс их очень сложно доказать. С другой стороны, в случае с «МегаФоном», «Сбером» и другими монополистами это ведет к улучшению их сервисов».
Большие и персональные данные в Европе, США и России: в чем разница?
«В США более капиталистический подход. Они считают, что у рынка должна быть саморегуляция. Я считаю, что это правильно: большие и взрослые компании сами в состоянии договориться.
В Европе все регулирует GDPR. Его важное отличие от российского 152-ФЗ (Закон о защите персональных данных. — РБК Тренды) в том, что в Европе защищают права граждан, а у нас — данные. Если вы сделали в европейской клинике аборт, и данные об этом утекли из базы, вы можете засудить клинику за нанесенный ущерб и получите серьезные компенсации. В России максимум, что произойдет — медицинский центр оштрафуют на 50 тыс. руб. в пользу государства.
У нас по-прежнему действует чисто советский подход: данные — гостайна, спрятать в сейф. Хотя 1 марта вступили в силу новые поправки. В частности, в закон ввели новые понятия — что есть персональные и открытые данные, отрегулировали сбор данных из открытых источников.
Самое плохое, что у нас по-прежнему почти не работает закон о забвении. То есть ты можешь из поисковых систем удалить ссылки на ресурсы, которые тебя компрометируют, но с самих ресурсов — вряд ли. Для этого нужно судиться. Это дорого, долго и сложно, и среднестатистическому россиянину не под силу».
Кто собирает и использует большие данные в России?
«Есть крупные ИТ-корпорации: «Яндекс», Mail.ru. Но с манипуляцией восприятием пользователей у них не все так круто: до Facebook им очень далеко. При этом реклама «ВКонтакте» работает намного эффективнее, чем в Facebook для определенных групп.
В основном, данные продают и используют через myTarget — крупнейшего оператора таргетированной рекламы. Если у вас интернет-магазин нижнего белья, вы можете загрузить туда данные о своих пользователях в обезличенном виде — то есть без фамилий, имен и номеров телефонов, но с указанием региона, пола, возраста. Площадка заплатит вам за это деньги и будет показывать этим людям таргетированную рекламу».
«Самые продвинутые в плане использования данных — банки. Они уже применяют скоринг (система оценки потенциального заемщика. — РБК Тренды), до которого банки Европы дорастут лет через десять. Банки используют всю информацию о вас из публичных источников — включая соцсети. Они делают это, чтобы предложить дополнительные бонусы: например, персональные скидки и бесплатные сервисы, которые вам подойдут. Банк рассчитывает, что вы поделитесь этим в соцсетях».
Единый цифровой профиль — это шаг к социальному рейтингу, как в Китае?
«Я считаю, что система социального рейтинга — это очень хорошая идея, которую почему-то выставили в негативном свете. Не вижу ничего плохого в том, что, например, люди, которые не платят алименты, не смогут выехать за рубеж. Но несколько международных расследователей заявили, что система якобы анализирует, хорошо или плохо вы говорите о президенте в социальных сетях. Если это действительно учитывается, то это очень плохо и страшно.
У нас в ближайшем будущем такое вряд ли возможно. Китай потратил десятилетия и миллиарды долларов на то, чтобы развить внутреннюю инфраструктуру и локальные сервисы, и только после этого из них начал получать информацию. В России люди не спешат регистрировать свои данные на Госуслугах и не хотят пользоваться биометрией, потому что не видят в этом никакой выгоды. В итоге все данные, которые собираются в госреестр, имеют колоссальный уровень неточности».
«В этом плане будущее — за частными компаниями, которые будут легально собирать данные пользователей в обмен на какие-то бонусы или бесплатные сервисы для них. Например, «ВКонтакте» предлагает вам отсканировать QR-коды чеков, чтобы получить внутреннюю валюту. Делается это для того, чтобы привязать ваши данные через ОФД к рекламным идентификаторам «ВКонтакте» и потом вам же показывать персональную рекламу. Считаю, гениальный ход».
Про систему распознавания лиц в Москве
«Это тоже очень интересная история. У меня есть одна хорошая знакомая — Алена Попова, она постоянно судится с московскими властями. Как раз недавно меня в суд вызывали экспертом.
Как это работает? Примерно так же, как и Shazam: он не хранит у себя базу музыкальных треков, но может по маленькому фрагменту опознать конкретную песню. С камерами примерно так же. Департамент информационный технологий Москвы, по сути, является хранителем записей с камер, которые распознают лица, но не могут сами идентифицировать их. Пока МВД не приходит к ним с запросом на конкретных людей: фото и паспортные данные.
Откуда у них фотографии — тоже любопытный момент. Все кричат о распознавании лиц на митингах, но по факту людей находят с помощью их же мобильных телефонов и селфи с геолокацией. А сейчас в Минцифры внесли законопроект, по которому получение геолокации телефона хотят вывести из-под действия закона о тайне связи».
«Одна из самых больших проблем — в том, что информационной безопасности уделяют крайне мало внимания. Саркис Дарбинян (эксперт по цифровому праву, сооснователь проекта «Роскомсвобода». — РБК Тренды) несколько раз успешно покупал данные из московской системы распознавания лиц в даркнете. Там же можно найти данные из баз МФЦ и многих других».
Сможем ли мы сами удалять свой цифровой след?
«Такие сервисы точно появятся в ближайшие три-пять лет. Я сам о нем последние пять лет мечтаю, но, к сожалению, с точки зрения законодательства это все еще очень сложно. Для начала нужно правильно идентифицировать человека. Нужен какой-то государственный реестр, который будет хранить все разрешения, выданные сторонним сервисам на доступ к персональным данным. Если бы у нас много людей было на Госуслугах зарегистрировано, тогда можно было бы проверять свой цифровой след прямо там».
О блокировке Дональда Трампа и цензуре в Сети
«Сейчас социальные сети являются крупнейшей публичной платформой по охвату аудитории. Они же являются и крупнейшим цензором. Условный Роскомнадзор обладает гораздо меньшей властью: он может заблокировать ресурс по заявлению, но это можно юридически оспорить. А если тебя заблокируют в Facebook, ты, конечно, можешь подать в суд, но на практике это очень долго и сложно. Я по своему опыту знаю».
В 2018 году Facebook заблокировал 66 страниц, связанных с Social Data Hub — одной из компаний Артура Хачуяна, зарегистрированных в Ирландии. Ее обвинили в сборе и анализе данных пользователей без их согласия.
«Есть интересный кейс с Russia Today. Недавно зашел к ним в YouTube и увидел, что на канале куча подписчиков, а просмотров очень мало. Это из-за теневого бана. Формально их не заблокировали, но алгоритм персонализации YouTube не показывает этот канал в рекомендациях другим людям. И ты не можешь на это никак повлиять.
По факту, есть два вида цензуры: государственная и общественная. И вот общественная, на мой взгляд, гораздо опаснее. Нам приятно, когда блокируют аккаунты каких-нибудь правых националистов, а либеральных просветителей — нет».
Как бороться с дискриминацией со стороны алгоритмов?
«Нужно понимать, что никаких алгоритмов-расистов нет, есть люди, которые неправильно подбирают исходную выборку. Либо вносят свои субъективные умозрительные заключения в работу нейронок.
В США раньше считалось, что афроамериканцы чаще совершают правонарушения. Из-за этого полицейские чаще на них обращают внимание, поэтому афроамериканцы чаще попадают в криминальную статистику. Классическая «ошибка выжившего». Или популярная история с HR-кейсами. Когда HR-менеджер берет 10 тыс. своих сотрудников, загружает в алгоритм, и получается, что его идеальный сотрудник — белый цисгендерный мужчина с высшим образованием. Он думает: алгоритм — расист! На самом же деле, расист — это он сам.
Что касается распознавания лиц, Baseline Model лица (стандартные модели лиц, которые используют для обучения нейросетей. — РБК Тренды) сейчас достаточно хорошо работает. Да, с азиатами и афроамериканцами дела обстоят чуть похуже: статистическая погрешность там около 10–12% и 5–7% соответственно, но считать это дискриминацией уже нельзя».
Правда ли, что приватность в Сети давно умерла?
«Во-первых, я разделяю анонимность и приватность. Анонимность — это возможность подключиться к интернету и сделать там что-то анонимно. Анонимность и правда умерла: подключая домашний интернет или покупая SIM-карту, мы обязательно достаем паспорт. Таким образом, сотовые операторы и провайдеры знают, кому принадлежит этот номер или IP-адрес.
Приватность — это право на неприкосновенность личной жизни. Наша квартира в этом плане — все еще относительно безопасное место. Но когда мы выходим на улицу, попадаем в объектив камер, нас можно отследить по геолокации телефона или через публичный Wi-Fi. Однако у вас все еще есть право требовать, чтобы всю информацию о вас удалили из любого сервиса.
Когда вы ставите галочку, соглашаясь с политикой конфиденциальности какого-либо сервиса, обратите внимание на самый важный пункт: «передача данных третьим лицам» — кому, в каком виде и на какой срок компания передает ваши данным третьим лицам. Например, первая версия «Социального мониторинга» в Москве просила доступ к персональным данным в неограниченное пользование на десять лет с правом передачи любых идентификаторов на рекламные платформы. Не многовато ли это для Департамента информационных технологий? На мой взгляд — да.
Мне кажется, проблема приватности слишком раздута. При этом наше общество пока не готово ей всерьез заниматься. Люди злятся на корпорации и кричат о тотальной слежке, но ничего не делают для защиты своей приватности. Они сами выкладывают в соцсетях фото детей, документов и геолокацию квартиры, не используют закрытые профили в соцсетях или отдельные номера и почту для регистрации».