Цифровые данные на молекулярном уровне: как ДНК-кассета изменит будущее хранения информации
Исследователи из Шэньчжэня, Китай, создали революционную "кассету", которая может хранить цифровые данные в виде нитей ДНК на гибкой пластиковой ленте. Один прототип содержит 36 петабайт, что эквивалентно около миллиону гигабайт информации, достаточно, чтобы вместить более трех миллиардов песен. Это открытие не только поднимает вопросы о новых способах хранения данных, но и может сыграть ключевую роль в решении проблемы хранения цифровой информации в будущем.
ДНК как новый способ хранения данных
Цифровые файлы в этой системе превращаются в последовательности четырех букв ДНК: A, T, C и G, которые обозначают данные, используемые компьютерами. Эти последовательности затем становятся цифровыми файлами. Работу руководил Xingyu Jiang, биомедицинский инженер из Южного университета науки и технологий (SUST) в Шэньчжэне, и его исследования сосредоточены на создании устройств на основе ДНК, которые могут хранить информацию и выполнять полезные молекулярные задачи. Этот процесс напоминает другие инновационные методы хранения информации, такие как палеогенетические исследования, которые используют ДНК для восстановления древних генетических данных.
Группа разработчиков хотела, чтобы их кассета была совместима с уже существующими технологиями работы с ДНК, используемыми в лабораториях. Это потребовало проектирования ленты так, чтобы стандартные инструменты для записи и секвенирования ДНК могли взаимодействовать с каждым разделом по очереди.
Хранение данных на ДНК-кассете
Лента состоит из блоков белого пространства, которые поглощают раствор ДНК. Черные полосы, покрытые чернилами, отталкивающими воду, предотвращают распространение жидкости вбок. Каждый белый блок содержит отдельный кусок ДНК, который создает небольшие перегородки для хранения данных. Вдоль ленты длиной чуть более полумили есть около 550 000 таких файловых слотов, что позволяет хранить огромные объемы информации.
Малый оптический сканер отслеживает штрих-коды, когда двигатели вращают ленту, выбирая правильный раздел, как только появляется нужный рисунок. В тестах система могла находить около 1570 различных положений файлов каждую секунду вдоль движущейся ленты.
"Наша система может эффективно искать и извлекать данные с ДНК-кассеты, что открывает новые возможности для хранения информации", — заявляет Xingyu Jiang, руководитель исследования.
Преимущества хранения данных в ДНК
Глобальные цифровые данные продолжают расти с каждым годом. Всё больше людей транслируют медиа, совершают покупки в Интернете и подключают устройства к сети. Один отраслевой анализ прогнозирует, что к середине 2020-х годов общий объем хранимых данных может достичь около 175 триллионов гигабайт. В настоящее время для хранения этих данных используются огромные центры обработки данных, которые уже используют около 4,4% всей электроэнергии в США, согласно последнему отчету Министерства энергетики.
Использование ДНК как материала для хранения информации может значительно изменить этот процесс. Один грамм ДНК может хранить около 455 экзабайтов данных — это примерно миллиард гигабайт, что позволяет создавать хранилища с невероятной емкостью. Исследования древних костей показывают, что ДНК медленно распадается, что позволяет ей сохранять информацию на протяжении веков. Это открытие напоминает о том, как генетика и палеогенетика могут раскрыть многое о прошлом, а теперь и о будущем хранения данных.
Чтение и переписывание данных с ДНК
Внутри устройства барабаны и двигатели перемещают ленту, а контроллер отслеживает местоположение каждого файла. Когда нужный файл выбран, система переносит соответствующий раздел в маленькую реакционную камеру, где раствор вытягивает одну нить ДНК из ленты. Затем эта нить считывается с помощью процесса секвенирования ДНК, который определяет порядок букв. После считывания оставшаяся нить на ленте используется как шаблон для восстановления молекулы ДНК.
В экспериментах команда неоднократно восстанавливала один и тот же файл десять раз, не теряя возможности его декодировать. Для удаления данных фермент отрезает прикрепленную ДНК в выбранном участке, и нить отсоединяется, смываясь. Это позволяет легко обновлять информацию на ленте, а система гарантирует, что около 99,9% данных может быть заменено.
Защита ДНК и долговечность данных
Для того чтобы сохранить ДНК в безопасности, исследователи покрыли перегородки кристаллической оболочкой из металлического органического каркаса, который блокирует воду и ферменты. Этот материал помогает защищать информацию на протяжении веков. Согласно более ранним исследованиям, ДНК, запечатанная в материалах на основе кремнезема, может сохранять данные даже при повышенных температурах.
Исследования показали, что ДНК может сохраняться читаемой в течение более 300 лет при комнатной температуре. В более холодных условиях, например, в высокогорьях, ДНК может оставаться читаемой до десятков тысяч лет. Это открытие подчеркивает, как ДНК может быть использована как долговечное хранилище данных.
"Мы обнаружили, что ДНК может быть долговечным и надежным способом хранения данных, который остается доступным даже через сотни лет", — говорит исследователь Маркус Гутджахр.
Будущее хранения данных в ДНК
Несмотря на колоссальную емкость, ДНК-кассета значительно медленнее, чем привычные устройства хранения, такие как жесткие диски или облачные сервисы. В демонстрациях копирование данных на ленту и с нее заняло десятки минут для файла всего лишь нескольких сотен килобайт. Синтез ДНК пока еще дорог, а многие машины для секвенирования громоздки и требуют специализированных лабораторий.
Однако с развитием биотехнологий и снижением затрат на химические процессы, ДНК-кассеты могут стать реальной альтернативой традиционным методам хранения данных. Прототипы уже показывают, как молекулярное хранилище может однажды справиться с растущими объемами цифровых данных, помогая архивировать музыку, фильмы и важные архивы.