Как большие данные помогают бороться с пандемией

Как анализ Big Data может помочь победить коронавирус и как технологии машинного обучения позволяют анализировать огромный массив данных? Ответы на эти вопросы ищет Николай Дубинин, ведущий Youtube-канала «Индустрия 4.0»

Новые технологии борьбы с инфекцией. Как отследить коронавирус?
(Видео: РБК)

Анализ больших данных — это один из самых действенных способов отследить распространение вируса и победить пандемию. 160 лет назад случилась история, которая наглядно показала, насколько важно собирать данные и оперативно анализировать их.

Фото:Mint Images / Shutterstock
Экономика инноваций Что такое Big Data и почему их называют «новой нефтью»

Карта распространения коронавируса по Москве и Подмосковью.

С чего все начиналось? 1854 год. Лондонский район Сохо поражает вспышка холеры. За десять дней умирает 500 человек. Никто не понимает источник распространения болезни. В то время считали, что болезнь передается из-за вдыхания нездорового воздуха. Все изменил врач Джон Сноу, который стал одним из основоположников современной эпидемиологии. Он начинает опрашивать местных жителей и наносит все выявленные случаи заболевания на карту. Статистические данные показали, что больше всего умерших было рядом с водозаборной колонкой на Брод-стрит. Не воздух, а отравленная нечистотами вода стала причиной эпидемии.

Сервис компании Tectonix показывает на примере пляжа в Майами, как скопление людей может повлиять на распространение эпидемий. На карте собраны миллионы единиц анонимных данных с геолокацией, поступающие со смартфонов и планшетов.

А теперь представьте, с какой скоростью распространяется коронавирус по России после пробки из людей в московском метро 15 апреля. Тогда полиция проверяла цифровой пропуск у каждого человека, спустившегося в подземку.

Давки в метро и пробки на дорогах. Результат введения пропускного режима в Москве
(Видео: РБК)

Зачем нужны цифровые пропуски, если система не справляется с их проверкой? Есть же камеры наблюдения.

По словам Григория Бакунова, директора по распространению технологий Яндекса, система распознавания лиц, которая действует сегодня, распознает 20—30 кадров в секунду на одном компьютере. Он стоит примерно $10 тыс. При этом в Москве 200 тыс. камер. Чтобы это все работало в реальном режиме, нужно поставить примерно 20 тыс. компьютеров. Таких денег у города нет.

В то же время 15 марта в Южной Корее прошли офлайн-выборы в парламент. Явка за последние шестнадцать лет была рекордная — 66%. Почему они не боятся мест массового скопления народа?

Южная Корея сумела переломить развитие эпидемии внутри страны. У них уже был похожий опыт: в 2015 и 2018 годах, когда в стране случились вспышки вируса MERS. В 2018 году они учли свои ошибки трехлетней давности. В этот раз власти действовали особенно решительно и подключили большие данные.

Движения пациентов отслеживали с помощью:

  • записей с камер наблюдения

  • транзакций с кредитных карт

  • данных GPS с автомобилей граждан

  • мобильных телефонов

Индустрия 4.0 Видеострим. Быстрое развитие технологий 4.0 — возможность или опасность?

Те, кто сидели на карантине, должны были установить специальное приложение, которое оповещало власти о нарушителях. В нем можно было видеть все перемещения с точностью до минуты, а также узнать, носили ли люди маски.

Штраф за нарушение составлял до $2,5 тыс. Это же приложение оповещает пользователя, если рядом есть заразившиеся или скопление людей. Все это — параллельно с массовым тестированием. Каждый день в стране делали до 20 тыс. тестов. Было создано 633 центра, предназначенных только для тестирования на коронавирус. Также работали 50 станций на парковках, где можно было пройти тест, не выходя из автомобиля.

Но, как верно замечает научный журналист и создатель портала о науке N+1 Андрей Коняев, пандемия пройдет, а личные данные останутся. Государство и корпорации смогут отслеживать пользовательское поведение.

Индустрия 4.0 Что такое цифровой тоталитаризм и возможен ли он в России

Кстати, по последним данным коронавирус оказался заразнее, чем мы думали. Это официальное исследование китайских ученых. Стало известно, что COVID-19 может с передаваться от одного человека пяти-шести людям, а не двум-трем, как предполагалось ранее.

Коэффициент заражения гриппом — 1.3. Это значит, что один больной заражает одного или двух человек. Изначальный коэффициент заражения коронавирусом — 5.7. Смертность от гриппа — 0.1%, от коронавируса — 1-3%.

Данные представлены по состоянию на начало апреля. Многие случаи заболевания остаются недиагностированными, потому что человеку не проводят тест на коронавирус или заболевание протекает бессимптомно. Поэтому на данный момент делать выводы о цифрах нельзя.

Коронавирус vs грипп (ENG)

Технологии машинного обучения лучше всего анализируют огромный массив данных и помогают не только отслеживать перемещения, контакты, но и:

  • диагностировать коронавирус

  • искать лекарства

  • искать вакцину

Многие компании заявляют о готовых решениях на основе искусственного интеллекта, которые в автоматическом режиме будут определять коронавирус не по анализам, а, например, по рентгену или КТ легких. Таким образом врач начинает работать сразу с максимально серьезными случаями.

Индустрия 4.0 Как наука борется с коронавирусом: 12 инновационных идей

Но не всякий искусственный интеллект обладает достаточным интеллектом. В конце марта по СМИ разошлась новость о том, что новый алгоритм с точностью до 97% может определить коронавирус по рентгену легких. Однако выяснилось, что нейронная сеть натренирована всего на 50 фотографиях. Это примерно на 79 950 фотографий меньше, чем нужно для того, чтобы начать распознавать болезнь.

Индустрия 4.0 Сколько стоит расшифровать геном человека и зачем это нужно

Подразделение материнской компании Google Alphabet DeepMind с помощью ИИ хочет полностью воссоздать белковую структуру вируса. В начале марта DeepMind заявила, что ее ученые пришли к пониманию структуры белков, связанных с COVID-19. Это поможет понять, как функционирует вирус, и ускорить поиск лекарства.

Что еще почитать по теме:


Подписывайтесь и читайте нас в Яндекс.Дзене — технологии, инновации, эко-номика, образование и шеринг в одном канале.

Обновлено 28.09.2020
Главная Лента Подписаться Поделиться
Закрыть