По данным Statista, ежедневно в мире генерируется 328,7 млн террабайт данных, а к 2025 году объем создаваемой в глобальном масштабе информации превысит 180 зеттабайт (Зб, то есть, например, 83 млн жестких дисков емкостью 12 Тб). Однако лишь небольшой ее процент удается эффективно сохранить. Рынок хранения данных активно растет, предлагая все новые решения. Согласно исследованию Global Market Insights, к 2032 году он будет оцениваться более чем в $150 млрд. Компании уже предлагают решения, которые позволят хранить огромные массивы информации в течение тысячелетий.
Данные в стекле
Microsoft разрабатывает технологию хранения информации на кварцевом стекле под названием Project Silica с 2017 года. Уже в 2019 году корпорация впервые записала на стеклянный носитель размером 75x75х2 мм фильм «Супермен» 1978 года. В 2023 году компания начала позиционировать Project Silica как решение для рынка хранения данных на облачных серверах.
Microsoft использует технологии сверхбыстрой лазерной оптики и искусственного интеллекта. Лазер кодирует данные в носителе в виде слоев трехмерных решеток. Эти узоры создают поляризованный свет, который проходит через кварцевое стекло. Алгоритмы считывают световой узор и декодируют записанные данные.
Особенность проекта в том, что он нацелен на хранение «холодных» данных — архивов или другой информации, к которой не нужно часто обращаться. При Используемое в проекте твердое кварцевое стекло способно выдержать кипячение в воде, нагревание в духовке и микроволновой печи, мытье и чистку, попадание в сильные магнитные поля и другие жесткие воздействия окружающей среды. Оно не требует особых условий хранения.
Как отмечают в Microsoft, такие носители способны обеспечить хранение информации «в течение пятидесяти, ста или тысячи лет, пока она не понадобится детям наших правнуков». Используя технологию Project Silica емкостью 7 ТБ, можно хранить около 1,75 млн песен или около 3,5 тыс. фильмов в течение 10 тыс. лет.
5D-оптика
В 2013 году исследователи из Университета Саутгемптона продемонстрировали технологию записи данных на кварцевый носитель. Они использовали «кристаллы памяти» из кварца, куда лазером записывали данные с пятью разными характеристиками, включая координаты в трех измерениях, ориентацию и объем. Последние два показателя ученые смогли контролировать при помощи интенсивности лазерного луча.
Разработчики технологии использовали лазер со сверхкороткими импульсами (фемтосекундный лазер), который наносил на кристалл точки слоями на расстоянии 5 мкм. Полученные данные считывались с помощью оптического микроскопа. Сначала на кварцевый диск получилось записать текстовый файл объемом 300 Кб, но со временем на таких носителях смогли уместить Всеобщую декларацию прав человека, трактат Ньютона об оптике, Великую хартию вольностей и Библию.
Разработчики утверждают, что технология больше всего подойдет музеям, библиотекам, промышленным предприятиям, которым нужно хранить множество «холодных» данных. Срок хранения информации не ограничен, а условия окружающей среды могут быть любыми, главное, чтобы сам кристалл не получал физических повреждений.
Некоторые из разработок Университтета Саутгемптона использовала Microsoft в Project Silica.
Керамическая нанопамять
Осенью 2023 года немецкий стартап Cerabyte представил первый прототип системы хранения данных, которая использует керамику и лазер. Создатели утверждают, что такие носители позволят хранить до 10 петабайт (10240 Тб) данных в течение минимум 5 тыс. лет.
Носитель представляет собой небольшой квадрат или гибкую ленту, на которую нанесены слои керамики толщиной от 50 до 100 атомов. Данные на нее записываются при помощи фемтосекундных лазеров, за один импульс можно нанести 2 млн бит информации. Информацию с него можно считать при помощи микроскопа высокого разрешения. Как отмечают в Cerabyte, носитель может быть двусторонним. Устройство доступно только для чтения или записи данных, но информацию на керамическом носителе редактировать нельзя.
Керамический материал устойчив к большинству неблагоприятных условий: к температурам от -273 °C до 300 °C, кислотам, электромагнитным импульсам и другим воздействиям. Носители планируется хранить в роботизированных хранилищах. Особенность системы заключается в высокой скорости считывания данных с носителей: за секунду можно будет считать гигабайт информации и более.
В 2024 году Cerabyte планирует выпустить первый керамический носитель, а в течение нескольких лет наладить выпуск носителей большей емкости. Предполагается, что первые устройства будут вмещать от 10 до 100 Пб, а в последующих поколениях плотность хранения материала достигнет 1 Тб данных или более на один мм². К 2030 году Cerabyte планирует разработать носители в виде картриджей на 100 Пб, а к 2035-му — ленту с керамическим слоем, способную хранить 1 эксабайт (Эб) данных.
ДНК-хранилища
В природе ДНК кодирует и хранит огромные объемы генетической информации в крошечных пространствах (клетках, бактериях и вирусах), причем с высокой степенью точности и воспроизводимости. За последнее десятилетие исследователи выяснили, что нити синтетической ДНК, которые производят в лабораториях, также позволяют эффективно записывать данные. В одном грамме ДНК помещается 215 Пб данных, которые можно хранить до 2 тыс. лет. В 2010 году биологи из Гонконга сумели внедрить в клетку бактерии E.coli синтетическую ДНК, а в 2012 году ученые из Гарварда записали в нее 643 Кб данных.
Уже в 2016 году Microsoft закупила 10 млн нитей синтетической ДНК у биологического стартапа Twist Bioscience для проверки технологии записи. Исследователи Microsoft разработали способ записи последовательностей единиц и нулей при помощи блоков последовательностей ДНК или нуклеотидов. Единицей хранения в такой системе выступает последовательность примерно из 200 нуклеотидов с объемом информации в 50–100 бит. В 2019 году Microsoft и Вашингтонский университет представили автоматизированную систему кодирования и считывания ДНК. В ней лабораторное оборудование подает необходимые жидкости и реагенты в синтезатор, который собирает изготовленные фрагменты ДНК и помещает их в емкость для хранения. Когда информацию нужно извлечь, система добавляет другие химические вещества для правильной подготовки ДНК и использует микрофлюидные насосы для проталкивания жидкостей в те ее части, которые считывают последовательности и преобразуют их в данные.
Исследователи также разработали методы поиска по определенным параметрам, например, изображений с яблоком или велосипедом, с использованием самих молекул ДНК и без необходимости конвертировать их в цифровой формат. Для этого используются магнитные наночастицы — метки, которые привязываются к определенным участкам ДНК и извлекаются с помощью магнита. Сами ДНК-носители будут храниться в специальных капсулах, к каждой из которых будет крепиться такая метка.
В 2023 году исследователи из Технического университета Эйндховена представили усовершенствованную микрокапсулу из белков и полимера, которая позволит не только эффективно хранить ДНК-носители, но и считывать информацию сразу с нескольких из них и копировать ее, используя реакции молекул на разные температуры.
В 2020 году Microsoft, Twist Bioscience, производитель систем анализа генетического разнообразия Illumina и производитель накопителей данных Western Digital объявили об основании Альянса хранения данных ДНК для дальнейшего развития технологии.
Участники альянса отмечают, что ДНК в будущем позволит хранить огромные массивы информации в ограниченном пространстве. Например, 10 полнометражных фильмов можно будет сохранить на носителе размером с крупинку соли. Однако эта система также предназначена для «холодных» данных из-за ограниченной скорости их извлечения.