Возможность хранения данных с помощью ДНК давно будоражит умы многих ученых. Недавно исследователи Китайского университета Гонконга обнародовали результаты своей работы в рамках проекта Bioencryption. Они утверждают, что с помощью их способа хранения и считывания данных в одном грамме бактерий можно уместить до 900 Тбайт информации.

Технология была создана в рамках международного конкурса iGEM-2010 (International Genetically Engineered Machine) и позволяет кодировать информацию с помощью смешивания ДНК (DNA shuffling), а проверку точности чтения осуществлять с помощью контрольных сумм.

Перед записью данных в молекулы информация должна быть преобразована из двоичной системы, применяемой на ПК, в четверичную: по количеству видов азотистых оснований нуклеотидов — аденин (А), тимин (Т), цитозин (С), гуанин (G).

Таким образом, к примеру, последовательность «iGEM», если представить дело довольно условно, вначале должна быть переведена в

двоичную кодовую таблицу ASCII (i = 105; G = 71; Е = 69; М = 77), затем в четверичную систему (105 > ТССТ; 71 > ATTG; 69 > АТТТ; 71 > ATGT), чтобы в итоге превратиться в цепь нуклеотидов внутри ДНК.

iGEM >1221 01130111 0131 >ТССТ ATTG АТТТ ATGT

Перед записью данных исследователи предлагают использовать алгоритм сжатия DEFLATE, позволяющий уменьшать длину гомополимера и число повторяющихся участков. В каждой «синтетической» клетке можно хранить не более 1 Кбайт данных, а потому более объемные информационные блоки нужно разбивать на минимально адресуемые единицы, каждая из которых имеет собственный заголовок (включает порядок размещения данных) и хвост (включает контрольную сумму последовательности), и размещается в 4-уровневой иерархической структуре.

Ученые предлагают для хранения использовать бактерии E.coli DH5 с внедренными в них синтезированными ДНК. 1 грамм таких бактерий может вместить столько же данных, сколько 450 двухтерабайтных жестких дисков. Пока, впрочем, технология не представляет практического интереса, потому что синтез ДНК чрезвычайно дорог.

В своей презентации исследователи отмечают, что в будущем подобную систему можно использовать для хранения любой информации: от текста и фотографий до аудио- и видеофайлов.