Даже самого мощного суперкомпьютера не всегда хватает, чтобы решить масштабные научные задачи. Поэтому ученые просят помощи у добровольцев. Каждый может подключить свое устройство — компьютер или смартфон — к распределенной сети и поделиться небольшим количеством его мощностей. К некоторым сетям подключены сотни человек, и каждый день они помогают ученым быстрее продвигаться в их исследованиях. Научные направления разные: от поиска внеземных цивилизаций до расшифровки генома. С недавнего времени можно внести свой вклад в борьбу с коронавирусом.
Как это работает
Пользователь загружает приложение и выбирает, каким количеством ресурсов он готов поделиться. Для работы приложения есть два простых условия: устройство должно быть подключено к источнику питания и интернету. Помимо этого никаких дополнительных действий не требуется.
По умолчанию приложение не работает, когда устройство активно, например, когда вы пользуетесь компьютером или экран смартфона включен. Поэтому эффективнее всего оно работает ночью. В это время устройство выполняет небольшую задачу, например, моделирует определенный процесс, обрабатывает изображение или решает уравнение, и отправляет результаты ученым.
Для пользователя подключение к распределенной сети безопасно:
-
приложение не повлияет на работу устройства;
-
у приложения нет доступа к персональным данным;
-
пользователь задает максимальную нагрузку на устройство и может ее регулировать.
Почему ученым нужно так много вычислительных мощностей
Обычный компьютер часто «виснет» во время обработки фотографий большого разрешения. Ученым же требуется анализировать, например, изображения, сделанные самым большим телескопом в мире, и простые компьютеры, которыми мы пользуемся каждый день, с этой задачей не справятся. Для таких исследований существуют суперкомпьютеры — вычислительные машины, способные выполнять миллиарды операций в секунду. Но даже их мощностей не всегда хватает. Кроме того, количество таких компьютеров ограничено, поэтому ученым приходится ждать в очереди на подключение, чтобы решить свои задачи.
«Распределенные вычисления — это своего рода суперкомпьютер масштаба планеты, — объясняет Мария Попцова, заведующая лабораторией биоинформатики, доцент департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ. — В обычном компьютере все вычислительные мощности сосредоточены под корпусом ноутбука или десктопа. В распределенном по планете Земля суперкомпьютере все мощности находятся в разных местах (на разных столах в разных домах, городах и странах) и соединены между собой проводами — кабелями интернета».
Примеры проектов, работающих на основе распределенной сети
SETI@home — самый известный проект с использованием распределенной сети. Ученые из Калифорнийского университета в Беркли занимались поиском сигналов внеземных цивилизаций. После запуска в 1999 году проект быстро привлек миллион пользователей. На компьютерах добровольцев обрабатывались снимки, полученные с телескопа в Южной Америке. SETI@home просуществовал 20 лет, однако в марте 2020 года был приостановлен. На тот момент приложение было установлено на 1,8 млн устройств. Ученые сослались на необходимость проанализировать все данные, накопившиеся за годы исследований.
После успеха SETI@home ведущие университеты стали по очереди запускать собственные проекты. Калифорнийский университет в Беркли открыл доступ к BOINC (от англ. Berkeley Open Infrastructure for Network Computing) — открытой программной платформе, которую можно свободно использовать для организации распределенных вычислений. Сейчас распределенные сети на BOINC помогают ученым решать задачи по математике, физике, биологии, астрономии, медицине, химии и другим направлениям:
-
World Community Grid — проект IBM, в котором объединены медицинские исследования: от поиска онкомаркеров до поиска лекарства от лихорадки Зика. Распределенная сеть позволила завершить несколько фаз различных исследований, например, исследований по расшифровке информации генома различных организмов, поиску лекарств и вакцин от тропической лихорадки и гепатита С, созданию полной карты белков человеческого организма и др. На данный момент к распределенной сети подключено более 780 тыс. устройств.
-
MilkyWay@Home — проект направлен на создание высокоточной трехмерной динамической модели звездных потоков в нашей Галактике. С помощью распределенных вычислений произведено моделирование динамики эволюции звездных потоков Стрельца и Сироты.
-
Climate Prediction — проект для прогноза изменений климата Земли в ближайшие десятилетия. У каждого участника сети на компьютере запускается компьютерная модель земного климата, а анализ тысяч таких моделей поможет делать более точные прогнозы.
-
Rosetta@Home — проект по моделирования структуры белков. Он способствует прикладным исследованиям для борьбы с раком, малярией, болезнью Альцгеймера и другими болезнями. После публикации результатов исследования о свертывании белка куратор Rosetta@Home Дэвид Бейкер поблагодарил пользователей, сказав, что их вклад был совершенно необходим для этого проекта.
-
Einstein@Home —проект по поиску гравитационных волн. С помощью распределенной сети ученые уже открыли несколько звезд-радиопульсаров и гамма-пульсаров, излучающих гравитационные волны, а пользователи, на компьютерах которых были найдены пульсары, получили сертификаты первооткрывателей.
-
Asteroids@home — проект помогает выяснить параметры астероидов — их форму, период вращения и т.д. В 2019 году были опубликованы более 1 тыс. модели астероидов.
Существуют и проекты, основанные на других платформах. Например, исследование, помогающее в разработке новейшего ускорителя элементарных частиц, анализ и прогнозирование временных рядов, анализ данных с различных телескопов и другие.
Как распределенные сети помогают в борьбе с коронавирусом
Собственные исследования, связанные с вирусом COVID-19, запустили несколько проектов, в том числе упомянутые World Community Grid и Rosetta@Home. Самым массовым на сегодня является проект Стэнфордского университета Folding@home.
О сути проекта рассказывает Мария Попцова: «Самый известный сейчас белок — это белок на поверхности коронавируса, так называемый белок-шип (spike), который соединяется с рецепторами-белками на поверхности клеток нашего организма. Этот белок перед захватом клетки изменяет форму, переходит из закрытого состояния в открытое, и необходимо смоделировать все потенциальные формы, которые примет этот белок во время перехода».
Именно для этого нужна распределенная сеть, поясняет Мария Попцова: «Один компьютер вычисляет возможность и характеристики какой-то одной формы, а всего таких возможностей — миллионы. Для чего нужно знать все возможные формы? Для разработки лекарств. Нужно подобрать такую молекулу, чтобы она связалась с опасным местом белка-шипа и заблокировала его. Тогда белок-шип не сможет связаться с нашими клетками. Этот процесс тоже надо сначала смоделировать и просчитать все формы и характеристики этого связывания, прежде чем испытывать лекарство в пробирке».
За несколько недель к проекту присоединилось более 400 тыс. человек. В мае производительность распределенной сети превысила 2,4 эксафлопс, или миллиард миллиардов операций в секунду. Это больше, чем мощность всех суперкомпьютеров из списка TOP500 вместе взятых.
Мария Попцова подчеркивает важность подключения большого количества пользователей для этой задачи: «Невозможно поставить опыты с миллионом лекарств — на это не хватит человеческой жизни. А компьютеры могут просчитать и предсказать, какое лекарство стоит испытывать, а на какое и не надо тратить время. Чем больше будет одновременных параллельных вычислений на каждом индивидуальном компьютере, тем лучше».
Какие приложения можно скачать, чтобы присоединиться к распределенной сети
-
Здесь можно скачать приложение Folding@home и присоединиться к крупнейшему распределенному проекту по анализу коронавируса.
-
Приложение World Community Grid помогает ученым разработать ученым лекарство от коронавируса. Перед скачиванием приложения зарегистрируйтесь на сайте.
-
Приложение для смартфона DreamLab в Google Play и в App Store. После установки выберите в списке проектов Corona-AI и обозначьте, сколько трафика вы готовы передавать каждый месяц. Максимальное значение — 500 Мб— эквивалентно просмотру видео длительностью 1,5 часа.
Больше информации и новостей о трендах шеринга в нашем Telegram-канале. Подписывайтесь.