Андо вдруг со всей силой ощутил, как красиво и точно работал ум Такаямы. Почему зашифрованное сообщение было найдено именно в клетках, пораженных вирусом? Потому что Такаяма, закончивший медицинский факультет, прекрасно знал, что именно эти клетки будут в первую очередь пропущены через секвенсор. Предвидя, что специалисты сосредоточат свое внимание на неизвестном вирусе, Рюдзи направил всю свою волю в мутировавшие молекулы ДНК. Такаяма хотел, чтобы его послание дошло наверняка.
Все эти размышления привели Андо к одному-единственному заключению: из-за того что этот код выглядел кодом и сразу же наводил на мысль о зашифрованном сообщении, он, по сути дела, переставал функционировать как таковой. Значит, он не был шифром в полном смысле этого слова – просто Рюдзи не мог контактировать с человеческим миром никаким другим способом. Вот и все. Двойная спираль ДНК состоит из нуклеотидов, которые обозначаются латинскими буквами А, Т, G и С. То есть единственный способ передать некое сообщение посредством ДНК – это составление различных комбинаций из этих четырех букв. По крайней мере, Андо не видел, что еще можно сделать в условиях кодирования на молекулярном уровне. Рюдзи приспособился к этим условиям и сделал единственно возможное.
И вот тут чувство безысходности, одолевавшее Андо в течение последних дней, вдруг отступило, уступив место непоколебимой уверенности в том, что он сможет решить этот ребус. Это в его силах.
Андо чуть было не закричал. Ведь если предположить, что Рюдзи сознательно попытался посредством ДНК передать ему какое-то сообщение, то, значит, зашифрованные слова должны легко поддаваться дешифровке. Зачем было Рюдзи усложнять задачу? На этой мысли Андо притормозил и шаг за шагом проверил цепочку своих умозаключений на предмет логических прорех. Ошибиться в самом начале значило заведомо обречь себя на провал. Ему не хотелось зря потратить уйму времени из-за неверного выбора отправной точки.
У него больше не было ощущения, что он просто убивает время и старается заглушить воспоминания. Теперь, когда он понял, что сможет расшифровать послание Рюдзи, ему не терпелось поскорее взяться за расшифровку.
Цепочка нуклеотидов выглядела следующим образом:
ATGGAAGAAGAATATCGTTATATTCCTCCTCCTCAACAACAA
Прежде всего нужно было решить, на какие именно комбинации поделить этот ряд символов. Андо решил для начала разбить их на двойки, а потом на тройки. До обеда он успел опробовать оба варианта.
Поделив ряд на двойки, он получил 21 пару:
AT GG AA GA AG AA
ТА ТС GT ТА ТА ТТ
СС ТС СТ СС ТС АА
СА АС АА
Если взять буквенную пару за основную единицу, то – по числу возможных комбинаций из имеющихся четырех букв – максимальное количество таких единиц равнялось шестнадцати. Андо предположил, что каждая пара должна соответствовать какой-то букве.
Ну хорошо. А о каких буквах идет речь? На каком языке написано исходное сообщение?
Это почти наверняка не мог быть японский с его слоговой азбукой, в которой содержится около пятидесяти графем: в этом случае шестнадцати возможных комбинаций было явно недостаточно. Английский и французский алфавиты оба состоят из двадцати шести букв, а итальянский, например, всего из двадцати. Правда, можно было допустить, что сообщение написано на японском, но с использованием латинских букв. Узнать, на каком языке написано исходное сообщение, значит проделать полпути к разгадке.
Но для Андо этой проблемы, можно считать, не было. Ведь ему уже удалось один раз расшифровать послание Такаямы – шесть цифр на клочке газеты, которые сложились в английское слово «ring». Скорее всего, это был намек. Поэтому Андо исходил из того, что, разгадав ребус, он и на этот раз получит текст на английском. В этом он не сомневался.
Итак, у него получилась 21 пара. Некоторые пары повторялись: АА – четыре раза, ТА и ТС – три раза, и СС – два раза. Таким образом, вместо шестнадцати возможных было представлено только тринадцать уникальных комбинаций. Андо записал все эти комбинации к себе в блокнот и полез в пособие по криптографии. На одной из страниц он нашел то, что искал, – таблицу повторяемости разных букв английского алфавита.
Понятно, что, хотя алфавит насчитывает двадцать шесть букв, все эти буквы встречаются в тексте с разной частотой. Например, А, Т и Е – очень употребительные, в то время как Q или Z попадаются на странице текста в среднем всего лишь два-три раза. Таблицы, подобные той, в которую сейчас всматривался Андо, чаще всего вместе с прочими приложениями находятся в конце учебников и пособий. С помощью этих приложений специалисты могут довольно быстро определить, на каком языке написано исходное сообщение.
Если верить таблице, то выходило, что в отрезке текста, состоящем из 21 буквы и написанном на английском, в среднем содержится 12 разных букв. Андо буквально подпрыгнул от радости. У него получалось тринадцать букв. Практически та же самая частотность. Это косвенным образом доказывало, что он на правильном пути. Данные статистики подтверждали, что было вполне правомерно поделить исходный буквенный ряд на пары и попытаться соотнести с каждой парой какую-то букву.
Впрочем, стоило проверить и второй вариант. Андо поделил ряд на тройки:
ATG GAA GAA GAA TAT CGT ТАТ АТТ ССТ ССТ ССТ САА САА САА
Из четырнадцати троек четыре повторялись больше одного раза. Уникальных сочетаний было семь: ATG, GAA, TAT, CGT, АТТ, ССТ и САА. Всезнающая таблица утверждала, что в английской фразе из четырнадцати символов в среднем содержится девять разных букв. Больше, чем семь, но ненамного...
Количество повторов бросалось в глаза с первого же взгляда: GAA, ССТ и САА встречались три раза, а сочетание ТАТ повторялось дважды. Однако проблема была не в самих повторах, а в их конфигурации – три одинаковых тройки одна за другой. Если предположить, что каждая тройка – это определенная буква, то получалось, что в этом коротком отрывке было три случая повторения одной и той же буквы три раза подряд. В английском хватает слов с удвоенными буквами, но вот насчет слов с утроенными буквами Андо не был уверен. Единственное, что пришло ему в голову, это довольно редкие случаи, когда одно слово заканчивается на удвоенную букву, а следующее за ним слово начинается с этой же самой буквы: «too old»
[14]
или, например, «will link»
[15]
.
Пришлось взять с полки первую попавшуюся книгу на английском и просмотреть наугад несколько страниц, чтобы понять, насколько часто встречаются в тексте утроенные буквы. Первый случай трехкратного повтора он нашел только на шестой странице. И следовательно, наличие такого же повтора (да еще и трех разных букв) в случайной фразе из четырнадцати символов было очень маловероятным, и даже практически невозможным. Между прочим, когда он поделил ряд аминокислотных основ на пары, у него получилась всего одна повторяющаяся буква, да и то – не утроенная, а удвоенная. В результате Андо пришел к выводу, что, исходя из данных статистики, работать в первом направлении гораздо разумней. Он сузил область поиска и сосредоточился на двойках. Теперь придется продвигаться методом проб и ошибок.