Схема двойной спирали молекулы ДНК, показывающая, как две ее цепочки закручиваются друг вокруг друга. Если разделить их, каждая цепочка сможет служить матрицей для синтеза точно такой же противоположной цепочки.
ДНК кажется чем-то столь современным, что нам сложно оценить, как мало в 1953 году было известно о началах молекулярной биологии. Образ двойной спирали разошелся по свету именно из той публикации Уотсона и Крика, иллюстрацию к которой нарисовала жена Крика Одиль (она была художницей). На ее рисунке ДНК похожа на своего рода винтовую лестницу, и именно так его и воспроизводили почти без изменений на протяжении полувека. Написанная в 60-х годах знаменитая книга Уотсона “Двойная спираль” стала, в свою очередь, классическим изображением современного взгляда на науку. Влияние этой книги было настолько велико, что сама жизнь, может быть, начала подражать искусству. Я, например, прочитав “Двойную спираль” еще в школе, и сам стал мечтать о Нобелевской премии и революционных открытиях. Думаю, мои представления о том, как занимаются наукой, в то время основывались почти исключительно на книге Уотсона, и разочарование, которое неизбежно постигло меня в университете, по всей вероятности, было связано с тем, что действительность не оправдала моих восторженных ожиданий. Я перестал искать острых ощущений в науке и занялся ради них скалолазанием. Потребовался не один год, чтобы я снова проникся чувством интеллектуального восторга от научной работы.
Но едва ли не все, чему я научился в университете, было неизвестно в 1953 году Уотсону и Крику. Давно стал общим местом тезис, что “белки закодированы в генах”. Но в начале 50-х годов даже по этому вопросу у ученых не было единого мнения. Уотсон впервые приехал в Кембридж в 1951 году, и очень скоро его стал раздражать скептицизм Макса Перуца и Джона Кендрю. По их мнению, еще нельзя было считать окончательно доказанным, что гены записаны в ДНК, а не в белках. Хотя молекулярная структура ДНК не была пока известна, ее химический состав был уже вполне ясен, и было известно, что он почти не меняется от одного вида к другому. Если гены действительно составляют основу наследственности и в них закодированы бесчисленные отличительные черты разных особей и видов, то как можно было пытаться объяснить все богатство и разнообразие жизни этим однородным соединением, по составу которого даже животные и бактерии не слишком отличаются друг от друга? Казалось, что белки с их бесконечным многообразием гораздо лучше подходят на роль носителя наследственной информации.
Уотсон был одним из тех немногих, кого убедили результаты экспериментов американского биохимика Освальда Эвери, опубликованные в 1944 году и свидетельствовавшие о том, что гены записаны в ДНК. Только энтузиазм и убежденность Уотсона побудили Крика взяться за насущную проблему разгадки структуры ДНК. Когда эта проблема была решена, ребром встал вопрос о генетическом коде. И здесь степень неосведомленности ученых того времени тоже просто удивительна для людей нового поколения. Молекулы ДНК состоят из последовательностей, составленных из всего четырех букв, расположенных на первый взгляд в случайном порядке. Было не так уж сложно догадаться, что этот порядок должен каким-то образом кодировать белки. Молекулы белков тоже состоят из последовательности “строительных блоков”, которые называют аминокислотами. Последовательностями букв в ДНК были предположительно закодированы последовательности аминокислот в белках. Но если код был универсальным для всех организмов (чего на тот момент уже можно было ожидать), то набор аминокислот, входящих в состав белков, тоже должен был оказаться универсальным. А в этом еще отнюдь не было уверенности. Саму эту возможность мало кто обсуждал, пока Уотсон и Крик за обедом все в том же “Орле” не составили канонический список двадцати аминокислот, который сейчас можно найти во всех учебниках. Любопытно, что хотя ни один из дуэта не был биохимиком, они угадали все с первого же раза.
Теперь задача сразу стала ясна. Все свелось к математической головоломке, варианты решения которой не ограничивались никакими фактами из тех, что пришлось зубрить следующим поколениям студентов, изучавших молекулярную биологию. Четыре буквы в молекулах ДНК должны были кодировать двадцать аминокислот. Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте. Дублетный код тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот (4x4 = 16). Минимальное число букв было три, то есть код мог быть триплетным (впоследствии Фрэнсис Крик и Сидней Бреннер доказали, что это именно так). Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (4x4x4 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же их было только двадцать? Секрет этого фокуса должен был объяснить смысл четырехбуквенного “алфавита”, организованного в шестьдесят четыре трехбуквенных “слова”, кодирующие двадцать аминокислот.
Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий (Джордж) Гамов, больше известный своими теориями, касающимися Большого взрыва. Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали. Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной. Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации. Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее. Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц. Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее. И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.
Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом. Но Фред Сэнгер, скромный гений, впоследствии получивший две Нобелевских премии (одну за метод прочтения последовательностей аминокислот в белках, другую — за метод прочтения букв в ДНК), занимался в то время выяснением последовательности аминокислот в молекуле инсулина. Вскоре он выяснил, что аминокислоты в белке могут располагаться в любом порядке и ограничений на их последовательности в белках в природе нет. Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота. Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.