Формулировка теоремы Байеса предполагает также, что данные, которые мы получаем, должны быть точными, что не будет никаких ложноположительных и ложноотрицательных результатов. Поэтому я в ходе своего исследования кошек предполагаю, что если я беру кота и определяю, что он чеширский, так и есть. Это очень важная оговорка. Например, в мире медицины ложноположительных и ложноотрицательных результатов очень много. В таких случаях формулу Байеса приходится немного подправить, чтобы учесть вероятность неверного диагноза и ошибок при анализах. Если вы пытаетесь оценить вероятность той или иной болезни или даже эпидемической угрозы, главное – точность данных и «априори», на которые вы опираетесь.
Итак, теорема Байеса позволяет нам оценить отношения между тем, что мы можем наблюдать и измерять, и нашими гипотезами или математическими моделями. В принципе, она должна позволять нам приписывать абсолютную вероятность – уверенность, – что наша гипотеза представляет собой точное описание природного феномена. Но тут возникают кое-какие досадные осложнения, и иногда результаты подобных вычислений сильно нас огорчают. Не исключено, что мы не знаем, что считать «априори» и вообще верна наша гипотеза хотя бы приблизительно. И измерения бывают несовершенными из-за случайной выборки или непредвиденных погрешностей – и в моем примере так и есть, поскольку чеширских котов в природе не существует. Поэтому вероятность (то есть мера уверенности), которую мы получаем, оказывается очень маленькой и не помогает нам принять решение.
К счастью, теорема Байеса куда мощнее. Она позволяет обойти эти очевидные препятствия при помощи красивого приема, который ученые часто применяют в повседневной работе – и когда гоняются за котами, и когда оценивают структуру мироздания. Дело в том, что абсолютные значения вероятностей нас обычно не очень интересуют. Нас интересует, какая модель или гипотеза «лучше», то есть вероятнее, прочих. Тогда мы для начала предполагаем, что все гипотезы могут оказаться верными с одинаковой вероятностью. На самом деле главное – разобраться, какая гипотеза лучше всего соответствует нашим данным, какая победит. Конечно, может оказаться, что все они ошибочны, но нам просто хочется узнать, какая из них ошибочна меньше прочих. Для этого нам нужно перевернуть формулу Байеса. В конце концов мы оценим вероятность или уверенность, что наши измерения могут объясняться той или иной гипотезой (по сравнению с остальными). Этот простой прием, как выясняется, – необычайно мощный научный инструмент.
Чтобы применить его к любопытному случаю с чеширскими котами, я могу протестировать разные методы выявления чеширских котов – например, взвешивание или проверка, умеют ли они улыбаться. Если 20 % котов и в самом деле чеширские, то результаты любых методов, и точных, и не очень, дадут примерно одни и те же результаты с разными относительными вероятностями. Подход Байеса позволяет мне сочетать их все и таким образом измерить общую уверенность в своей гипотезе по сравнению с альтернативными вариантами.
А вдруг никакие методы выявления не дадут похожих результатов, и общая уверенность у меня окажется низкой? В таком случае мне придется задуматься о том, что либо неверны какие-то подробности моей изначальной гипотезы, либо чеширских котов не бывает.
В некотором смысле теорема Байеса – довольно простая математическая концепция, однако просто поразительно, как далеко может завести ее применение. Для многих ученых ее действенность в определении контуров реальности служит доказательством, что байесовский метод предельно близок к тому, «как устроена природа» – похоже, она позволяет точно предсказать вероятностный результат самых разных явлений, которые, в сущности, определяются не законами, а случайностью. Все дело в том, что даже если природа знает, какие законы действуют в ситуации, когда мы применяем этот метод, мы можем лишь догадываться об этом.
Чаще всего это не имеет особого значения. Если наши догадки – наша научная модель – достаточно точна, то теорема Байеса, словно по волшебству, сгладит все неровности, или по крайней мере даст нам понять, насколько мы можем быть уверены в полученных результатах. Правда, у некоторых ученых такой метод делать выводы об устройстве Вселенной по-прежнему вызывает раздражение, ведь получается, что не бывает по-настоящему ошибочных теорий, просто одни хуже, а другие лучше.
Прекрасно помню, как на старших курсах наблюдал жаркие споры маститых ученых, которые чуть ли не в драку лезли, пытаясь разобраться, можем ли мы позволить себе подобную мягкотелость
[177]. Если байесовский анализ дает нам лишь вероятность, что та или иная теория хорошо совпадает с наблюдениями, нельзя же полностью доверять этому методу, когда требуется точное знание! Такие же дискуссии велись и по поводу обратной аргументации: ведь это куда более честный и реалистический подход к структурированию наших исследований мира природы, поскольку он полон неопределенностей и незавершенных историй. Однако, как и при решении многих других задач в человеческой жизни, можно сказать, что если что-то работает без сбоев и дает приемлемое, пусть и не совершенное, решение какой-то задачи, именно оно и становится решением де-факто, а в таких случаях, конечно, нет ничего лучше теоремы Байеса.
* * *
В наши дни байесовский метод вездесущ, он внедрен в нашу технологию и мышление. Он окружает нас повсюду, даже там, где не ожидаешь. Например, он заложен практически в любое программное обеспечение для обработки фотографий. Распознавание лиц? Да, оно основано на байесовской вероятности, именно она обеспечивает, чтобы в фокус попали драгоценные мгновения детских игр. Обидный штраф, который вы получили за то, что пытались проскочить на красный? Скажите спасибо Томасу Байесу: номер вашей машины распознали на размытом фото при помощи байесовских приемов. Автокоррекция текста, которая подсказывает вам безумно смешные варианты, когда вы набираете сообщение на телефоне? Да, и здесь тоже применяется теорема Байеса – статистический анализ использования слов генерирует вероятности того, что вы собираетесь напечатать или имели в виду. Биржевые роботы, торгующие акциями и определяющие курсы валют, почти всегда делают это на основе байесовских методов определения вероятностей и уверенности в результатах. В нашу эпоху Больших Массивов Данных, когда компании собирают информацию обо всех мельчайших особенностях поведения потребителей, все те же инструменты статистической оценки и прогноза обеспечивают им подсказку, какую марку мыла мы предпочитаем – или какую марку мыла нас уговорят полюбить.
* * *
Без мощного влияния наследия Байеса в науке мы не смогли бы понять, что говорит нам о вероятности существования жизни во Вселенной тот простой факт, что существуем мы сами. Да, именно теорема Байеса помогает нам расшифровать генетический код и оценить результат анализа на онкомаркеры, чтобы понять, с какой вероятностью мы можем заболеть раком. Она позволяет нам лавировать среди петабайтов данных и найти там эфемерные признаки новых элементарных частиц и новых законов физики. Но еще она помогает нам найти ответ на животрепещущий вопрос, какие выводы можно сделать из нашего существования о вероятности зарождения жизни в Галактике, которая состоит из миллиардов других солнечных систем. Итак, теперь, когда мы думаем над нашим вопросом подобно Томасу Байесу, давайте посмотрим, что будет, если мы попробуем сформулировать математический ответ на вопрос о жизни во Вселенной.