Большие данные в России: что изменилось для бизнеса и государства

Фото: Freepik
Фото: Freepik
На First Russian Data Forum поговорили о новых горизонтах в использовании и обмене данными, а Минцифры призывало ограничить их накопление

В 2023 году в Москве прошел первый российский форум, посвященный большим данным. Мероприятие под названием First Russian Data Forum (18+) стало интерактивной площадкой для публичного диалога бизнеса и государства. Обе стороны поделились своими достижениями, прогнозами и опасениями, связанными с развитием этой сферы. И если бизнес больше всего пугают возможные законодательные ограничения, то государственные структуры страшатся избыточного накопления и бесконтрольного распространения big data. В событии приняли участие более 700 человек, проведение форума инициировала Ассоциация больших данных (АБД). Делимся главным, о чем говорили на форуме.

Прогнозы и оценки

В ходе форума президент АБД Анна Серебряникова представила масштабную стратегию развития рынка данных до 2024 года. По ее словам, похожий проект составили пять лет назад, однако современные реалии заставили его изменить. «У нас была стратегия 2018 года, которая прекрасно реализовывалась. Темпы роста рынка фиксировались на уровне около 75% за предыдущие годы. Но в 2022 году рынок существенно изменился. Мы поняли, что не можем жить в рамках прежней стратегии, и разработали новую — на три года», — объяснила Серебряникова.

Описывая текущее состояние рынка данных, эксперт выделила влияние государственной поддержки IT-отрасли. Серебряникова назвала его беспрецедентным с точки зрения количества мер, возможности быть услышанным и постоянного развития IT-направления. Она также отметила высокий уровень зрелости отраслевых игроков и потребления цифровых сервисов пользователями.

Если смотреть в будущее и оценивать сценарии развития, АБД прогнозирует, что консолидированные действия бизнеса и государства способны обеспечить рост рынка больших данных на 90% (до 319 млрд руб.) к концу 2024 года. При этом от использования big data отрасли экономики получат дополнительный эффект в 1,6 трлн руб. Условием достижения такой цифры Серебряникова назвала, в частности, «право на ошибку» для бизнеса, также отметив, что сотрудничество бизнеса и государства необходимо в области стимулирования спроса на цифровые продукты, снятия излишних регуляторных барьеров и подготовки кадров.

Анна Серебряникова:

«Для совместных исследований и инновации в области больших данных нам нужны не только деньги, но и право на ошибку от государства. Сейчас господдержка предполагает, что проект будет не только разработан и внедрен, но найдет своих покупателей. Это не всегда так работает в области научно-исследовательских и опытно-конструкторских работ (НИОКР)».

Достижимой целью в Ассоциации больших данных сочли 40 некоммерческих НИОКР в области IT, рост экспорта товаров и услуг в области больших данных на 10%, а также достижение объема инвестиций в эту сферу в размере 1,1% ВВП. Планомерное развитие рынка позволит создать 32 тыс. новых рабочих мест в индустрии big data и поднять индекс качества жизни на 0,7%.

Фото:Mint Images / Shutterstock
Экономика инноваций Что такое Big Data и почему их называют «новой нефтью»

Мнение чиновников

Представители власти, присутствовавшие на форуме, признали: сейчас отрасли не хватает правил игры, единых для всех участников. «Нам, как законодателям, предстоит вместе с отраслью, государством и обществом дать четкие определения существующим сегодня явлениям, — заявил депутат Госдумы Александр Хинштейн. — Нам надо договориться, что такое обезличенные данные, обогащение данных, большие массивы данных. Только определив понятийный аппарат, мы сможем двинуться дальше в сторону изменения законодательства».

В качестве положительного примера Хинштейн привел Кодекс этики использования данных, принятый в 2019 году. Документ создали по инициативе Ассоциации больших данных вместе с Институтом развития интернета (ИРИ). «Опыт этого кодекса может лечь в основу законодательных инициатив», — уверен депутат.

По мнению председателя комитета Совета Федерации по экономической политике Константина Долгова, каждое решение игроки рынка big data должны «перекладывать на повседневный язык нашей страны и ее граждан». Цифровое развитие в регионах он назвал неравномерным и выделил необходимость «объяснять преимущества IT-решений и делать их доступными». В качестве примера желаемого вектора развития Долгов назвал государственно-частные партнерства в сфере big data.

Наиболее радикальную точку зрения высказал министр цифрового развития, связи и массовых коммуникаций Максут Шадаев. Если несколько лет назад данные было принято называть новой нефтью, то сегодня министерство оценивает ситуацию с другой стороны. «Последняя наша рефлексия заключается в том, что накопление данных — это огромные риски. Даже внутри государственной системы надо находить определенный баланс», — считает Шадаев. Министр призвал все государственные структуры провести ревизию накопленных баз данных: «Наша позиция заключается в том, что многие данные надо убирать из оперативного контура».

Второй технологической задачей на ближайшее время Шадаев назвал взаимное обогащение баз данных — правда, опять с упором на защиту от чрезмерного распространения сведений. «В полный рост встает вопрос создания единого технологического решения, единой системы хеширования, чтобы при объединении различных баз данных не создавать дополнительный риск утечки персональных данных», — заявил министр.

Практический подход бизнеса

В ходе круглого стола «Ключевые направления развития цифровой экономики» бизнес представил собственные методы и принципы работы с данными. Руководитель стратегического комитета АБД и управляющий директор департамента управления данными Сбербанка Мария Поликанова отметила, что данные являются активом, который может дать социальный и экономический эффект, в связи с этим данные являются национальной ценностью и требуют к себе соответствующего отношения. Поэтому стратегия развития рынка big data направлена на достижение трех целей: создание качественной среды для бизнеса, поддержку технологической независимости и повышения качества жизни граждан.

Как будет устроен российский сегмент big data к концу 2024 года

  • Государство будет уделять много внимания отрасли больших данных и IT.
  • Компании начнут обмениваться данными и запускать новые продукты и сервисы.
  • Общество лучше подготовится к работе с данными: люди поймут, какую ценность можно извлечь из big data.
  • Технологии смогут развиваться на российской базе опережающими темпами.
  • Законодательство позволит обмениваться данными для развития экономики.

Прогноз Ассоциации больших данных

Мария Поликанова отметила, что финансовый сектор, телекоммуникации, медиа и технологии, а также ретейл являются лидерами по темпам развития big data. По ее словам, эти отрасли находятся уже на этапе масштабирования своих data-решений, а нефтегазовый, горнодобывающий, агропромышленный сектора и девелопмент находятся на стадии внедрения технологий работы с данными. Поликанова заметила, что финансовый сектор является не только флагманом цифровизации, но и одним из самых креативных, который находит новые возможности для внедрения решений big data.

Мария Поликанова:

«Раньше банки применяли данные для скоринга клиента — оценки, вернет он кредит или нет. Теперь банки наращивают виды и объемы данных, улучшают точность моделей и уже умеют предсказывать ранний дефолт заемщика еще до его возникновения».

Промышленный сектор в дискуссии представил Владимир Дождев, директор департамента цифровых технологий Министерства промышленности и торговли. Он рассказал, что спрос на решения big data в промышленности растет, как и объем инвестиций в разработку. Проекты, связанные с большими данными, — больше не удел отраслевых лидеров, а распространенное явление. «Мы видим кейсы, когда промышленные компании осваивают новые рынки благодаря данным», — уточнил Дождев. В качестве примера он привел автопроизводителей, которые занимают рынок телеметрии и сервисные рынки.

По словам представителя Минпромторга, в промышленности сейчас собирают 3–4% данных из общего объема доступных сведений. А из собранных только 5% данных нужны и востребованы в существующих бизнес-моделях. По словам Дождева, потенциал для проектов с big data в промышленности огромен: заказчики ищут продукты, среди которых особо востребованы рекомендательные системы на основе больших данных, машинное зрение и цифровые двойники виртуальных испытаний.

Директор центра big data «МТС» Виктор Кантор предложил такой взгляд на рынок, в котором большие данные существуют не только как самостоятельный бизнес или способ оптимизировать процессы, но и как движущая сила для запуска новых направлений. В «МТС» технологии big data применяют в четырех вертикалях: телеком, финтех, реклама и медиа. Повторяющиеся задачи в разных вертикалях компания перевела на общие «двигатели», сформировав четыре технологические платформы: «умное» ценообразование, рекомендательные системы, скоринг и геоаналитика.

«Эти платформы для нас стали инструментами развития новых продуктов, потому что в них заложены продуктовые паттерны», — заявил Кантор. «Умное» ценообразование решает задачу уберизации. Рекомендательные системы позволяют работать с большими каталогами, скоринги — применять решения по противодействию мошенничеству, в геоаналитике — оптимизировать логистику.

Фото:Pexels
Футурология Гадания на нейросетях: что общего между Таро и Big Data

Big data на практике

Рекомендательные системы дают реальные продуктовые эффекты. Чтобы это доказать, в «МТС» провели эксперимент и на две недели отказались от алгоритмов: одну из полок рекомендаций на основе машинного обучения в онлайн-кинотеатре Kion заменили на ручные подборки. Падение было заметным. Если полка с машинным обучением обеспечивает около 400 тыс. часов смотрения в месяц, то в ручном режиме та же полка генерирует лишь 290 тыс. часов.

Руководитель центра аналитических продуктов VK Predict Роман Стятюгин рассказал об опыте компании в разработке продуктов на основе big data для других отраслей. Одной из областей для их применения назвал сферу строительства. Стятюгин представил кейс с ИИ-сервисом для застройщиков — «Девелопер». Искусственный интеллект помогает определить оптимальный класс жилья для выбранной локации, подобрать наиболее эффективную квартирографию, рассчитать стоимость квартиры на всех этапах строительства и обеспечить максимальную выручку и равномерную продажу недвижимости.

В механике этого решения — ансамбль моделей, которые определяют, сколько квартир, какого размера и с каким количеством комнат должно быть в жилом комплексе. Для этого алгоритмы учитывают исторические данные спроса, цен и предложений застройщиков в выбранной локации, а также анализируют данные о привлекательности и инфраструктуре района. В итоге застройщик получает точность прогнозирования стоимости квартир около 92%.

Роман Стятюгин:

«Чтобы раскрывать ценность данных для других индустрий, игрокам рынка нужно доводить ИИ-решения до коробочного продукта, который решает поставленные задачи. Бизнесу неважно, что под капотом, важно, чтобы был результат».

Big data применяют и в более консервативных отраслях. Это доказал генеральный директор платформы управления агробизнесом «Агросигнал» Владимир Коршунов. Он объяснил, как растениеводство теряет деньги без использования данных. В пример спикер привел обработку поля химическим препаратом при нарушении температурного режима: из-за неправильной температуры препарат не подействовал, что привело к потере большой части урожая и убыткам в размере десятков миллионов рублей с одного поля.

Сбор информации, обогащение данных и экспертные модели в сельском хозяйстве способны снижать риски и затраты бизнеса. По оценке Коршунова, цифровые системы приводят к увеличению рентабельности до 25% и росту производительности работ до двух раз. Анализ процессов сокращает простои и позволяет быстро реагировать на риски, что повышает урожайность на 15%.

О том, как продвинутая аналитика встраивается в бизнес-процесс в торговле, рассказал Данила Наумов, директор по данным «М.Видео-Эльдорадо». Компания использует речевую аналитику и машинное зрение, чтобы взаимодействовать с клиентами. Например, речевые решения помогают общаться с клиентами в чат-боте, а видеоаналитика в магазинах — замечать одинокого покупателя и сообщать о нем ответственному менеджеру.

Неожиданное применение цифровые инструменты нашли в перевозке электроники. «Коллеги из логистики заметили, что контейнеры приезжают полупустыми. Попросили нас составить алгоритм по оптимальному наполнению контейнеров и фур. Мы взяли требования, как товары можно размещать, что на что ставить, и предложили модель», — рассказал Наумов. Теперь цифровое решение формирует инструкцию для комплектовщиков, и те собирают контейнеры эффективнее.

Выступления представителей бизнеса подтвердили, что big data и машинное обучение применимы не только в компаниях, непосредственно связанных с разработкой цифровых решений. Отрасли нуждаются в продвинутых инструментах для улучшения своей работы, и big data проекты способны удовлетворить их запросы.

Фото:Unsplash
Экономика шеринга Как Big Data помогает корпорациям следить за нами

Данные и люди

Еще одной значимой темой, которую обсудили на форуме, стало будущее data-обработки. По мнению директора по управлению и анализу данных QIWI Юлии Богачевой, в ближайшее время в мире появится новый пласт данных, которые эксперт назвала Bio data. Это сведения о том, как функционирует организм человека.

Юлия Богачева:

«Уже сейчас многие носят «умные» часы, фитнес-трекеры, которые собирают данные о том, какое у нас давление, пульс. Скорее всего, в ближайшее время будут устройства, которые будут собирать информацию об уровне холестерина, содержании различных веществ в крови и другие параметры. Тема актуальная, потому что сейчас большое внимание уделяется повышению качества жизни, развивается превентивная медицина».

Представитель QIWI отдельно подняла вопросы, касающиеся сбора, хранения и обработки Bio data, а также рисков, с которыми этот процесс сопряжен. По словам Богачевой, информация об организме человека может стать помощником на ранней диагностике серьезных заболеваний, будет подсказывать, какой диеты придерживаться и какие пищевые добавки принимать. При этом особое значение имеет защита таких данных и предупреждение утечек.

«Наверное, нет человека, который не получил бы звонок от «службы безопасности» какого-то крупного банка или в последнее время — «майора милиции или ФСБ». Представьте себе, что в эту базу добавится еще информация о том, какими болезнями вы можете заболеть или болеете», — предостерегла Богачева. Одним из путей решения эксперт считает наполнение кейсами «Белой книги» — свода практик в сфере добросовестного использования данных, входящего в кодекс АБД. По мнению Богачевой, кейсы о Bio data и их применении пора включать в этот свод.

Russian Data Forum станет ежегодным мероприятием, на котором будут собираться представители госструктур и крупнейших компаний. Следующий форум запланирован на весну 2024 года.

Обновлено 24.08.2023
Главная Лента Подписаться Поделиться
Закрыть