Анализ больших данных — это один из самых действенных способов отследить распространение вируса и победить пандемию. 160 лет назад случилась история, которая наглядно показала, насколько важно собирать данные и оперативно анализировать их.
Карта распространения коронавируса по Москве и Подмосковью.
С чего все начиналось? 1854 год. Лондонский район Сохо поражает вспышка холеры. За десять дней умирает 500 человек. Никто не понимает источник распространения болезни. В то время считали, что болезнь передается из-за вдыхания нездорового воздуха. Все изменил врач Джон Сноу, который стал одним из основоположников современной эпидемиологии. Он начинает опрашивать местных жителей и наносит все выявленные случаи заболевания на карту. Статистические данные показали, что больше всего умерших было рядом с водозаборной колонкой на Брод-стрит. Не воздух, а отравленная нечистотами вода стала причиной эпидемии.
Сервис компании Tectonix показывает на примере пляжа в Майами, как скопление людей может повлиять на распространение эпидемий. На карте собраны миллионы единиц анонимных данных с геолокацией, поступающие со смартфонов и планшетов.
А теперь представьте, с какой скоростью распространяется коронавирус по России после пробки из людей в московском метро 15 апреля. Тогда полиция проверяла цифровой пропуск у каждого человека, спустившегося в подземку.
Зачем нужны цифровые пропуски, если система не справляется с их проверкой? Есть же камеры наблюдения.
По словам Григория Бакунова, директора по распространению технологий Яндекса, система распознавания лиц, которая действует сегодня, распознает 20—30 кадров в секунду на одном компьютере. Он стоит примерно $10 тыс. При этом в Москве 200 тыс. камер. Чтобы это все работало в реальном режиме, нужно поставить примерно 20 тыс. компьютеров. Таких денег у города нет.
В то же время 15 марта в Южной Корее прошли офлайн-выборы в парламент. Явка за последние шестнадцать лет была рекордная — 66%. Почему они не боятся мест массового скопления народа?
Южная Корея сумела переломить развитие эпидемии внутри страны. У них уже был похожий опыт: в 2015 и 2018 годах, когда в стране случились вспышки вируса MERS. В 2018 году они учли свои ошибки трехлетней давности. В этот раз власти действовали особенно решительно и подключили большие данные.
Движения пациентов отслеживали с помощью:
-
записей с камер наблюдения
-
транзакций с кредитных карт
-
данных GPS с автомобилей граждан
-
мобильных телефонов
Те, кто сидели на карантине, должны были установить специальное приложение, которое оповещало власти о нарушителях. В нем можно было видеть все перемещения с точностью до минуты, а также узнать, носили ли люди маски.
Штраф за нарушение составлял до $2,5 тыс. Это же приложение оповещает пользователя, если рядом есть заразившиеся или скопление людей. Все это — параллельно с массовым тестированием. Каждый день в стране делали до 20 тыс. тестов. Было создано 633 центра, предназначенных только для тестирования на коронавирус. Также работали 50 станций на парковках, где можно было пройти тест, не выходя из автомобиля.
Но, как верно замечает научный журналист и создатель портала о науке N+1 Андрей Коняев, пандемия пройдет, а личные данные останутся. Государство и корпорации смогут отслеживать пользовательское поведение.
Кстати, по последним данным коронавирус оказался заразнее, чем мы думали. Это официальное исследование китайских ученых. Стало известно, что COVID-19 может с передаваться от одного человека пяти-шести людям, а не двум-трем, как предполагалось ранее.
Коэффициент заражения гриппом — 1.3. Это значит, что один больной заражает одного или двух человек. Изначальный коэффициент заражения коронавирусом — 5.7. Смертность от гриппа — 0.1%, от коронавируса — 1-3%.
Данные представлены по состоянию на начало апреля. Многие случаи заболевания остаются недиагностированными, потому что человеку не проводят тест на коронавирус или заболевание протекает бессимптомно. Поэтому на данный момент делать выводы о цифрах нельзя.
Технологии машинного обучения лучше всего анализируют огромный массив данных и помогают не только отслеживать перемещения, контакты, но и:
-
диагностировать коронавирус
-
искать лекарства
-
искать вакцину
Многие компании заявляют о готовых решениях на основе искусственного интеллекта, которые в автоматическом режиме будут определять коронавирус не по анализам, а, например, по рентгену или КТ легких. Таким образом врач начинает работать сразу с максимально серьезными случаями.
Но не всякий искусственный интеллект обладает достаточным интеллектом. В конце марта по СМИ разошлась новость о том, что новый алгоритм с точностью до 97% может определить коронавирус по рентгену легких. Однако выяснилось, что нейронная сеть натренирована всего на 50 фотографиях. Это примерно на 79 950 фотографий меньше, чем нужно для того, чтобы начать распознавать болезнь.
Подразделение материнской компании Google Alphabet DeepMind с помощью ИИ хочет полностью воссоздать белковую структуру вируса. В начале марта DeepMind заявила, что ее ученые пришли к пониманию структуры белков, связанных с COVID-19. Это поможет понять, как функционирует вирус, и ускорить поиск лекарства.
Что еще почитать по теме:
Подписывайтесь и читайте нас в Яндекс.Дзене — технологии, инновации, эко-номика, образование и шеринг в одном канале.