Однако закону Бенфорда подчиняются не все списки чисел. Например, телефонные номера обычно начинаются с определенного кода, соответствующего региону. Даже таблицы квадратных корней не подчиняются этому закону. С другой стороны, не исключено, что если собрать все числа, появившиеся в передовицах нескольких местных газет в вашем городе за неделю, они будут распределяться по этой формуле. Но почему же так получается? Что общего у городского населения в штате Массачусетс со смертностью от землетрясений во всем мире и с числами из статей в «Reader’s Digest»? И почему этому же правилу подчиняются числа Фибоначчи?
Строго доказать закон Бенфорда математическими методами оказалось совсем не просто. Одним из главных препятствий стал именно тот факт, что подчиняются этому закону не все перечни чисел – и даже приведенные примеры из ежегодника «World Almanac» не вполне ему соответствуют. В статье об этом законе в журнале «Scientific American», опубликованной в 1969 году, математик Ральф А. Райми из Рочестерского университета сделал вывод, что «ответ остается неясным».
Объяснить этот закон удалось лишь в 1995–1996 годах, и сделал это математик из Технологического института в Джорджии Тед Хилл. Хилл заинтересовался законом Бенфорда в начале девяностых, когда готовил доклад о сюрпризах вероятности. Вот как он вспоминал об этом в беседе со мной: «Я начал работать над этой задачей для развлечения, однако многие коллеги предупреждали меня, что надо быть осторожным, поскольку закон Бенфорда вызывает наркотическое привыкание». После нескольких лет работы Теда наконец осенило, что не нужно рассматривать числа из одного конкретного источника: главное – это смесь данных. Хилл переформулировал закон Бенфорда статистически в новой форме: «Если распределения подбираются случайно (любым непредвзятым способом) и из каждого распределения выбираются случайные образцы, то частота встречаемости цифр на значимом месте в смеси образцов сходится к распределению Бенфорда, даже если некоторые отдельные выбранные распределения не подчиняются этому закону». Иными словами, предположим, что вы собрали случайный набор чисел из мешанины распределений – например, из таблицы квадратных корней, таблицы смертности в сенсационных авиакатастрофах, населения округов и расстояний между теми или иными городами на планете по воздуху. Некоторые эти распределения сами по себе не будут подчиняться закону Бенфорда, но Хилл доказал, что чем больше вы соберете подобных чисел, тем ближе встречаемость цифр в этих числах будет к предсказанной законом Бенфорда. Так почему же этому закону подчиняются и числа Фибоначчи? Ведь они-то строго определены рекурсивным соотношением, это не случайные образцы из случайных распределений.
Так вот, в этом случае выясняется, что соответствие закону Бенфорда свойственно не только числам Фибоначчи, но и другим подобным последовательностям. Если исследовать большой массив различных степеней двойки (21 = 2, 22 = 4, 23 = 8 и т. д.), станет видно, что они тоже подчиняются закону Бенфорда. Удивляться этому не следует, если учесть, что сами по себе числа Фибоначчи – это степени золотого сечения (вспомним, что n-ное число Фибоначчи близко к φn/√5). В сущности, можно доказать, что закону Бенфорда подчиняются последовательности, заданные большим классом рекурсивных соотношений.
Закон Бенфорда – очередной поразительный пример того, как чистая математика превращается в прикладную. В числе прочих занятных способов применения этого закона – выявление подделки и фабрикации данных в бухгалтерии и при уклонении от налогов. Данные из самых разных финансовых документов всегда очень хорошо соответствуют закону Бенфорда. А сфабрикованные данные – очень редко. Хилл доказал, как работает этот метод выявления мошенничества, на одном простом примере при помощи теории вероятности. На первом занятии своего курса по теории вероятностей Хилл просит студентов провести эксперимент. Если девичья фамилия их матери начинается с букв от А до L, они должны подбросить монетку 200 раз и записать результат – сколько было орлов и сколько решек. Остальным студентам предлагается подделать результат 200 бросков монетки, то есть создать случайную последовательность орлов и решек. На следующем занятии Хилл собирает результаты и очень быстро определяет, где результат подлинный, а где поддельный, и в 95 % случаев не ошибается. Как ему это удается? В любой последовательности из 200 бросков монетки, если ее действительно бросали, с большой вероятностью попадается по шесть орлов или шесть решек подряд. А когда кто-то пытается подделать последовательность из 200 бросков монетки, им кажется, что такого уж точно не может быть.
Недавно закон Бенфорда применили для выявления финансовых махинаций в одном американском туристическом бюро. Директор по аудиту обнаружил что-то странное в отчете начальника отдела медицинского страхования компании. Первые две цифры в суммах выплат на медицинскую страховку, когда эти данные проверили на соответствие закону Бенфорда, почему-то тяготели к 65 (более подробно о том, как закон предсказывает и вторую и далее цифры, см. в Приложении 9). Тщательный аудит выявил тринадцать поддельных чеков на суммы от 6500 до 6599 долларов. В управлении окружного прокурора в нью-йоркском районе Бруклин при помощи проверок на основе закона Бенфорда также выявили бухгалтерские подделки в семи нью-йоркских фирмах.
Закон Бенфорда состоит именно из тех ингредиентов, которые так по вкусу большинству математиков. Он отражает простой, но поразительный факт: распределение цифр на первом месте в числе подчиняется вполне конкретной закономерности. Более того, этот факт еще и трудно объяснить. Но иногда числа приносят радость, которой не приходится долго ждать. Например, многие математики, как любители, так и профессионалы, очень увлекаются простыми числами. Почему же простые числа так важны? Потому что «Фундаментальная теорема арифметики» гласит, что любое целое число больше единицы можно выразить произведением простых чисел (обратите внимание, что 1 считается простым числом). Например, 28 = 2 × 2 × 7, а 66 = 2 × 3 × 11 и т. д. Простые числа так глубоко укоренились в человеческом понимании математики, что Карл Саган (1934–1996) в своей книге «Космос», когда ему надо было описать, какого типа сигнал разумная цивилизация передала бы в космос, избрал для этого, в частности, последовательность простых чисел: «Крайне маловероятно, чтобы какой-нибудь естественный физический процесс генерировал радиосообщение, содержащее только простые числа. Получив подобное сообщение, мы можем заключить, что где-то есть цивилизация, которая любит простые числа» (пер. А. Сергеева). Великий Евклид более двух тысяч лет назад доказал, что простых чисел существует бесконечно много (это изящное доказательство приведено в Приложении 10). Однако большинство любителей простых чисел согласны, что среди них попадаются особенно интересные. Некоторые математики, например, француз Франсуа Ле Лионне и американец Крис Колдуэлл, вели списки «примечательных» или «титанических» чисел. Приведу несколько занятных примеров из великой сокровищницы простых чисел.
– Число 1 234 567 891, представляющее собой «цикл» всех цифр, – тоже простое число.
– 230-е простое число, в котором 6400 цифр, состоит из 6399 девяток и всего одной восьмерки.