Генетическая память. Почему в недалеком будущем вся информация в мире будет храниться на ДНК
Все фильмы на свете можно сохранить на донышке пробирки. Для этого нужно записать их на ДНК. Эта молекула — самый компактный носитель информации из всех, что нам известны. Пройдет десяток лет, и ДНК-память станет такой же привычной, как жесткий диск
Это шутка? Или какой‑то экзотический эксперимент? Нет. Природа создала ДНК специально для хранения информации, и молекула очень хороша в этой роли. В теле среднего человека всего 200 граммов ДНК, но на это количество в теории можно было бы записать 43 тысячи петабайт данных (один петабайт равняется тысяче терабайтам, или квадриллиону байт, это число с пятнадцатью нулями). Чтобы разместить столько же информации на жестких дисках, понадобилось бы 4 миллиона 300 тысяч 10-терабайтных носителей, которые заняли бы куб с ребром почти 12 метров.
Кроме компактности у ДНК есть и другие преимущества. Она хранится неопределенно долго — смогли же ученые прочитать ДНК мамонта, пролежавшего в вечной мерзлоте 38 тысяч лет. Для сравнения: записи на оптических носителях становятся нечитаемыми уже через 30 лет, магнитные ленты за несколько десятилетий рассыпаются в пыль, ячейки на жестких дисках размагничиваются через 10–50 лет.
Помимо физического старения есть еще и моральное. Устройства для чтения устаревают и оказываются на свалке, а информация, записанная на старомодный носитель, становится недоступной. Такое случилось с результатами экспериментов, которые провел на Луне экипаж «Аполлона‑11». Ученые из NASA записали их на магнитные ленты, а в 2008 году уже не смогли прочитать. Если бы аппарат IBM 729 Mark V не нашелся в музее, уникальные данные о свойствах лунной пыли пропали бы навсегда.
С технологией чтения ДНК такое вряд ли случится. «Если на Земле не останется ни одного места, где можно секвенировать ДНК, это будет означать, что наша цивилизация столкнулась с очень серьезными проблемами», — шутит биоинформатик Дина Зелински. И действительно, если мы разучимся читать ДНК, значит, потеряем биохимию, медицину, вирусологию и многие другие науки.
Понятно, в природе ДНК хранит информацию. А на каком языке?
Молекула ДНК содержит генетический код. Это инструкция, по которой ферменты (молекулярные машины, управляющие химическими реакциями) строят живые организмы: от кишечной палочки до человека. Если представить, что гены — это слова, то биологический вокабуляр достаточно велик: геном человека содержит 20–40 тысяч генов. Алфавит же состоит всего из четырех букв. Смысловая часть ДНК представляет собой последовательность азотистых оснований, или нуклеотидов. Это четыре простых химических соединения, которые называются аденин (А), тимин (Т), цитозин (C) и гуанин (G).
Сходство очевидно. Компьютерные данные записывают в виде чисел в двоичной системе, используя значения 0 и 1. ДНК — это четверичный код, состоящий из букв: A, T, C и G. Есть много способов превратить двоичный код в последовательность нуклеотидов. Например, можно записать 00 как A, 01 — как C, 10 — как G, и 11 — как T.
Правда, самый простой способ не всегда лучший. Некоторые последовательности, которые часто встречаются в двоичной записи, для геномов живых организмов нехарактерны. Например, длинные участки ДНК с преобладанием одного и того же нуклеотида или двух чередующихся. Их трудно синтезировать: они склонны к разрывами или закручивают молекулу в узлы, которые мешают ее прочитать.