Сегодня 17 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам

Ведущий разработчик систем хранения информации на базе ДНК — компания Catalog Technologies — сообщил об «историческом прорыве». Компания показала возможность быстрого параллельного поиска по данным, зашифрованным в ДНК. Работа с ДНК не отличается скоростью, но Catalog смогла найти возможность ускорить эти процессы. В перспективе это обещает привести к появлению беспрецедентных по плотности записи носителей информации, в миллионы раз лучше современных аналогов.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Компания Catalog разрабатывает систему записи и считывания данных на ДНК из синтетических нуклеотидов. В природе биологическая информация записывается всего четырьмя нуклеотидами. Если себя этим не ограничивать, то можно в два, три и даже больше раз увеличить «разрядность» кодирования данных, а это, прежде всего, рост плотности записи. Таким образом, в одном грамме раствора из ДНК можно хранить до 200 Пбайт информации, с чем современные методы записи совершенно не сравнятся.

В Catalog провели эксперимент, в котором показали способность записывать относительно большой массив данных в ДНК и проводить в нём поиск по ключевым словам. Так, большой отрывок из Шекспировского «Гамлета» размером в 17 тыс. слов был записан в ДНК на опытной установке компании. Никакой предварительной обработке данные не подвергались, включая индексацию. На запись и поиск по ключевым словам ушли считанные минуты, о чём раньше даже не мечтали. Система нашла все вхождения искомого слова.

 Источник изображения: Catalog Technologies

Установка для кодирования информации в синтетической ДНК. Источник изображения: Catalog Technologies

Поскольку химические процессы, в результате которых происходят реакции с ДНК, по своей сути параллельны, то нет разницы, какой по объёму массив данных будет обрабатываться: 17 тыс., 170 тыс. или 17 млн. В новом году, например, компания обещает запустить поиск на массиве из более 100 млн зашифрованных в ДНК слов. Подобные возможности, помимо многократного увеличения плотности записи, обеспечат потребности нейросетей и ИИ при обработке больших массивов информации.

Сегодня установка Catalog Shannon не отличается компактностью — размерами она как «кухня для обычной семьи». Поиск тоже не блещет скоростью: 17 тыс. слов в среднем по 5 символов каждое — это всего лишь 472 байт/с. Но это только начало. Придёт время, когда записывать данные на ДНК и считывать их будут маленькие чипы. Вместе с компанией Catalog это время приближает её партнёр — компания Seagate. Но это уже другая история.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Крупнейший в России оператор ЦОД и облачных услуг «РТК-ЦОД» готовится к IPO 13 мин.
Palit представит на Computex видеокарту с водоблоком и воздушной системой охлаждения 2 ч.
Роборуки от MIT помогут астронавтам NASA встать после падения на Луне 2 ч.
Xiaomi представила смартфон среднего уровня Redmi Note 13R — он почти идентичен Redmi Note 12R 2 ч.
AT&T и AST SpaceMobile обеспечат спутниковой связью обычные смартфоны сначала в США, а после — по всей Земле 2 ч.
TSMC будет выпускать основания для стеков HBM4 по 12- и 5-нм техпроцессам 5 ч.
LG свернула производство рулонных телевизоров Signature OLED R 5 ч.
Производитель микроэлектроники «Элемент» выйдет на биржу до конца мая — это позволит привлечь до 15 млрд рублей на развитие 5 ч.
Раскрыта примерная цена российского электромобиля «Атом» 6 ч.
Гарвардский университет и Amazon построили в Бостоне квантовую сеть длиной более 35 км 6 ч.