Большие данные (от англ. Big Data) — это массив данных, которые поступают регулярно и в большом объеме. Их собирают, обрабатывают и анализируют, чтобы выстраивать модели и закономерности.
Big Data играют большую роль не только в госуправлении и бизнесе различных сфер, но и в военной отрасли. У больших данных есть приложения во всех областях войны, от предоставления подробного анализа угроз во враждебной среде до улучшения возможностей автономных систем.
Big Data в иностранных армиях
Во время войны в Ираке американские силы специальных операций (ССО) смогли найти и ликвидировать сеть секретных ячеек «Аль-Каиды» (запрещена и признана террористической организацией в России) путем разработки новых оперативных методов на передовых программных приложениях. Они интегрировали большие данные в уже существующие инструменты благодаря новым технологиям.
Первоначальная цель этого проекта, получившего название Project Maven, была в том, чтобы автоматизировать обработку, использование и распространение огромных объемов полноформатного видео, собираемого средствами разведки по всему миру. Только в 2011 году беспилотники отправили командованию США более 327 тыс. часов или 37 лет видеоматериалов. В итоге слишком много оперативной информации не использовалось, потому что не было возможности ее обрабатывать. В условиях очевидной нехватки специалистов-аналитиков выходом стала комбинация ИИ, компьютерного зрения и машинного обучения. Специально обученные алгоритмы начали искать, идентифицировать и классифицировать интересующие объекты в огромных объемах данных и отмечать интересующие элементы.
Кроме того, американская армия уже использует DCGS–A — распределенную аналитическую геоинформационную систему, способную интегрировать данные из различных источников, таких как беспилотные летательные аппараты, спутники, системы фиксации телефонных переговоров, биометрические системы, базы данных спецслужб и прочее. В настоящее время ведется разработка второй, усовершенствованной версии этой системы.
Военные США также проводят серию тестов под названием Global Information Dominance Experiments (GIDE) с сетью искусственного интеллекта, которая в течение нескольких дней будет предупреждать об изменениях на военных базах других стран. Например, увеличение количества автомобилей на стоянке на зарубежной военной базе может означать предстоящее наступление.
Британская армия использует систему геопространственного интеллекта, способную собирать воедино данные от разных объектов для принятия решений в режиме реального времени. В 2021 году она впервые применила искусственный интеллект во время учений «Весенний шторм» в рамках операции «Кабрит» в Эстонии. Солдаты использовали ИИ-инструмент, который предоставлял им информацию об окружающей среде и местности. Благодаря интеллектуальной аналитике Big Data движок может быстро обрабатывать большие массивы сложных данных, что дает военным возможность планировать соответствующие действия и их результаты.
О том, как Китай использует в военных целях большие данные, известно мало. Однако в этом году СМИ сообщили о том, что китайская компания BGI Group, занимающаяся вопросами генетики и продающая тесты для беременных по всему миру, разработала их в сотрудничестве с вооруженными силами страны и использует их для сбора генетических данных миллионов женщин. Тесты под названием NIFTY для «неинвазивного исследования плода» также собирают генетическую информацию о матери и другие данные, такие как страна проживания, рост и вес. Эта информация требуется для широкомасштабных исследований особенностей популяций. Отмечалось, что власти КНР могут использовать полученные данные для генетических модификаций собственных солдат, либо для выведения искусственных патогенов.
Big Data в российской армии
В России Big Data также активно внедряют в военной сфере. С 2019 года в армии работает система поддержки принятия решений с использованием технологий больших данных и элементами искусственного интеллекта. «Информационная система боевого управления» способна анализировать различные сценарии и предлагать варианты реагирования на них в бою, ранжируя их по успешности.
Система позволяет сократить время, затрачиваемое командиром на принятие решений. Использование технологий Big Data при этом даст возможность получать почти неограниченные объемы данных, которые в боевых условиях в режиме реального времени будут поступать от техники, военнослужащих и средств разведки, например, беспилотников.
На форуме «Армия-2021» в августе 2021 года на стенде Минобрнауки представили цифровую платформу REx для управления трафиком данных на основе анализа больших данных. Как рассказали разработчики, платформу можно использовать для оценки продукта еще перед его созданием, увеличения автоматизации военного производства, управления цепочками поставок и интеграции продуктов и услуг. По их словам, данная система состоит из нескольких взаимодействующих интеллектуальных агентов. Ее можно использовать для решения более сложных задач. Например, система способна мониторить и прогнозировать использование ресурсов.
Исследования и разработки
Данные с «умных» устройств можно использовать не только для таргетинга рекламы, но и в целях разведки. Этим целям служит специальное программное обеспечение, способное сначала обрабатывать зеттабайты данных с устройств интернета вещей (IoT), а затем анализировать их ценность.
Военная информация часто поступает из текстовых источников, будь то сообщения со смартфона, электронная почта, сообщения в социальных сетях, документы и тому подобное. Однако информация, как правило, генерируется для людей, и машинам бывает не под силу ее обрабатывать, так как слова часто имеют несколько значений и есть много разных способов сформулировать одно и то же предложение. Американская Charles River Analytics разрабатывает подход к извлечению смысла из текста, основанный на социолингвистической теории. Данная теория изучает связь между языком и социальными условиями его использования.
В MathWorks уже разработали подобный продукт, Text Analytics Toolbox, который ориентирован на анализ и понимание неструктурированных текстовых данных. Его можно использовать в таких приложениях как анализ настроений в соцсетях и тематическое моделирование для обобщения больших коллекций текстов.
Военные датчики генерируют огромные объемы данных от средств разведки и радиоэлектронной борьбы (РЭБ), а также от средств связи. В Mercury Systems (Андовер, Массачусетс) разработали концепцию центра обработки данных, но для военных. Решения такого ЦОД основаны на архитектуре OpenVPX. Это открытая архитектура, которая имеет преимущества в плане получения быстрых обновлений.
Между тем специалисты компании «Диасофт» разработали программный комплекс для доступа к данным, который обеспечивает их получение из любых источников, а также способен формировать «умные» пакеты данных. На платформе могут одновременно работать до 50 тыс. пользователей, что позволит оперативно собирать больше информации для ее агрегации и обработки. Такая система обеспечит самые актуальные данные о показателях ресурсного обеспечения вооруженных сил для принятия управленческих решений.
Перспективы Big Data в армии
Аналитическая компания из Великобритании GlobalData определили ключевые технологические тенденции, влияющие на внедрение больших данных.
Облачные вычисления
Значение облачных вычислений для обороны растет из-за большого объема данных, производимых военной техникой. Кроме того, облако снижает потребность в поддержке ИТ-систем и инфраструктуры и обеспечивает значительную масштабируемость. Правительство Великобритании уже применяет подход «сначала облако» в отношении защиты используемых в работе устройств.
Периферийные вычисления
Такие вычисления позволяют обрабатывать огромные объемы данных и аналитики. Развитие периферийных вычислений тесно связано с интернетом вещей. Развертывание сотовых технологий 5G станет важным стимулом как для интернета вещей, так и для периферийных вычислений.
Квантовые вычисления
От внедрения квантовых систем выиграют технологии искусственного интеллекта и машинного обучения, поскольку они должны уметь выполнять чрезвычайно сложные вычисления. Системы нового типа позволят легко решать трудоемкие рутинные задачи классификации больших данных и их анализа. Квантовые компьютеры способны выполнять несколько задач параллельно, что ускорит машинное обучение, а, значит, и повысит эффективность обработки Big Data.
ИИ-чипы
Центральные процессоры обеспечивают работу центров обработки данных, но рабочие нагрузки, связанные с ИИ и интернетом вещей, доводят их работу до предела. Однако графические процессоры, которые когда-то использовались в основном для игр, могут обрабатывать множество процессов параллельно. Таким образом, теперь они перемещаются в центры обработки данных.
Кремниевая фотоника
Это синергия двух групп технологий — электроники и оптики, которая позволяет принципиально изменить систему передачи данных на расстояниях от нескольких миллиметров до тысяч километров. Большинство областей обороны в той или иной степени зависят от оптики и фотоники. Они переходят на оптическую визуализацию, дистанционное зондирование, связь и оптическое оружие. Кремниевая фотоника позволит обеспечить максимально быструю передачу больших данных.
Аналитика в реальном времени
Комбинация потоковых данных и аналитики может принести пользу тем, кто полагается на быстрое принятие решений. Например, ее можно применять для прогнозирования механических отказов в производственной линии на основе данных с умных датчиков.
Когнитивная аналитика
Это модернизированный подход к аналитике и работе с данными, который использует облачные платформы и архитектуру больших данных. В качестве примера можно привести систему IBM Watson. В ее задачи входит разработка и коммерциализация облачных когнитивных сервисов в таких областях как здравоохранение, финансы, путешествия, телекоммуникации и розничная торговля. Суперкомпьютер Watson понимает вопросы, сформулированные на естественном языке, и находит на них ответы с помощью ИИ, а затем анализирует информацию.