Изображение предоставлено: миллиард фотографий / Shutterstock
В 2020 году каждый человек в мире генерирует около 1,7 МБ данных в секунду, и эти данные составляют 418 зеттабайт, или 418 миллиардов жестких дисков емкостью один терабайт, всего за один год.
Данные в настоящее время хранятся в виде нулей и единиц в оптических или магнитных системах, которые не сохраняются в течение 100 лет. Между тем, центры обработки данных потребляют большое количество энергии и создают колоссальный углеродный след. Другими словами, способ хранения постоянно растущего объема данных не является устойчивым.
ДНК как хранилище данных
Однако есть альтернативный метод – сохранение данных в биологических молекулах, таких как ДНК. В природе ДНК обычно кодирует, сохраняет и создает большие читаемые объемы генетических данных в мельчайших пространствах (вирусы, бактерии и клетки), и делает это с высоким уровнем воспроизводимости и безопасности.
По сравнению с традиционными устройствами хранения данных ДНК более компактна и долговечна, имеет в 1000 раз более высокую плотность хранения, может хранить в 10 раз больше данных и потребляет в 100 миллионов раз меньше энергии для сохранения того же объема данных, что и водить машину. Устройство для хранения данных на основе ДНК также было бы очень маленьким – то есть годовые глобальные данные могут быть сохранены всего в 4 г ДНК.
Однако сохранение информации с помощью ДНК также связано с болезненно медленными механизмами чтения и записи, чрезмерными затратами и вероятностью неправильного прочтения.
Нанопоры спешат на помощь
Один из методов заключается в использовании отверстий наноразмеров, известных как нанопоры, которые обычно пробиваются бактериями в другие типы клеток, чтобы убить их. Заражающие бактерии используют специфические белки, называемые «порообразующими токсинами», которые связываются с мембраной клетки и создают в ней трубчатый канал.
Нанопоры используются в биоинженерии для «ощущения» биомолекул, таких как РНК и ДНК. Молекула проходит через нанопору, как струна, и управляется напряжением. Его различные составляющие создают четкие электрические сигналы («ионную сигнатуру»), которые можно использовать для их обнаружения. Благодаря их превосходной точности, ученые также экспериментировали с нанопорами для считывания данных, закодированных ДНК.
Но, несмотря на этот факт, нанопоры по-прежнему ограничены показаниями с низким разрешением – реальная проблема, если системы с нанопорами должны использоваться для чтения и хранения информации.
Нанопоры аэролизина
Перспектива появления этих нанопор побудила исследователей из Школы наук о жизни Федеральной политехнической школы Лозанны (EPFL) изучить нанопоры, созданные порообразующим токсином, называемым аэролизином. Этот токсин вырабатывается бактерией Aeromonas hydrophila .
Под руководством Маттео Дала Пераро из Школы естественных наук команда продемонстрировала, что нанопоры аэролизина можно использовать для декодирования двоичных данных.
Еще в 2019 году лаборатория Дала Пераро продемонстрировала, что нанопоры можно использовать для обнаружения белков и других подобных сложных молекул.
В новом исследовании, опубликованном в журнале Science Advances исследователи в сотрудничестве с лабораторией Александры Раденович (инженерная школа EPFL) модифицировали аэролизин, чтобы определять молекулы, которые были точно настроены. сделано для чтения этой нанопорой. Исследователи подали патент на эту технологию.
Молекулы, получившие название «цифровые полимеры», были созданы в лаборатории Жана-Франсуа Лутца в Институте Шарля Садрона Национальной ассоциации ядерной безопасности в Страсбурге. Эти молекулы, по сути, представляют собой комбинацию небиологических мономеров и нуклеотидов ДНК, разработанных для движения через нанопоры аэролизина и выработки электрического сигнала, который можно считать «битом».
Используя мутанты аэролизина, команда методично разработала нанопоры для считывания сигналов своих информационных полимеров. Они улучшили скорость прохождения полимеров через нанопору, так что она может излучать однозначно обнаруживаемый сигнал.
Но в отличие от обычных считывателей нанопор, этот сигнал обеспечивает цифровое считывание с однобитным разрешением и без ущерба для плотности информации ».
Д-р Чан Цао, первый автор исследования, EPFL
Исследователи декодировали эти считываемые сигналы, применяя глубокое обучение, и это позволило им декодировать в общей сложности четыре бита данных из полимеров с превосходной точностью. Команда даже применила этот метод для слепого обнаружения смесей полимеров и определения их относительной концентрации.
Стоимость системы намного ниже, чем при использовании ДНК для хранения данных, что обеспечивает более длительный срок службы. Кроме того, он «миниатюризируемый», что означает, что его можно легко интегрировать в портативные устройства хранения данных.
Мы работаем над несколькими улучшениями, чтобы превратить эту основанную на биологии платформу в реальный продукт для хранения и поиска данных. Но эта работа ясно показывает, что биологическая нанопора может читать гибридные ДНК-полимерные аналиты. Мы рады, поскольку это открывает новые многообещающие перспективы для памяти на основе полимеров с важными преимуществами сверхвысокой плотности, длительного хранения и портативности устройств »
Маттео Даль Пераро, Школа естественных наук, EPFL
Справка журнала
Cao, C., и др. . (2020) Нанопоры аэролизина декодируют цифровую информацию, хранящуюся в специально подобранных макромолекулярных аналитах. Достижения науки . doi.org/10.1126/sciadv.abc2661.
Источник: https://www.epfl.ch/en/[19459008visible
Диэнай