Думай медленно... Решай быстро - читать онлайн книгу. Автор: Дэниел Канеман cтр.№ 51

читать книги онлайн бесплатно
 
 

Онлайн книга - Думай медленно... Решай быстро | Автор книги - Дэниел Канеман

Cтраница 51
читать онлайн книги бесплатно

• Гольфист, успешно сыгравший в первый день, вероятно, на второй день тоже сыграет успешно, но не так хорошо, поскольку необычное везение вряд ли сохранится.

• Гольфист, сыгравший плохо в первый день, скорее всего, и во второй день сыграет хуже среднего, но лучше по сравнению с предыдущим результатом, поскольку его вероятное невезение должно прекратиться.

Также ожидается, что разница между двумя гольфистами на второй день уменьшится, хотя надежнее всего предположить, что первый все равно сыграет лучше второго.

Мои студенты всегда удивляются тому, что лучшие предсказания результатов второго дня – более скромные и близкие к среднему, чем те результаты, на которых предсказания основаны. Именно поэтому такая модель называется регрессией к среднему. Чем выше исходные данные, тем сильнее ожидаемое сокращение, поскольку чрезвычайно хороший результат предполагает очень счастливый день. Регрессивное предсказание разумно, но его точность не гарантируется. Некоторые гольфисты, набравшие 66 в первый день, во второй справятся еще лучше, если им повезет еще больше. Большинство игроков справятся хуже, поскольку их удача уже не будет выше средней.

Теперь давайте взглянем в прошлое. Отсортируйте игроков по результатам второго дня и посмотрите на их результаты в первый день: обнаружится точно такая же регрессия к среднему. Лучшим гольфистам второго дня, вероятнее всего, сопутствовала удача, и надежнее всего предположить, что в первый день им везло меньше и их результат был хуже. Тот факт, что регрессия наблюдается и при попытках предсказать более раннее событие по более позднему, должен убедить вас в том, что у нее нет каузального объяснения.

Эффекты регрессии встречаются везде, а вместе с ними – и ошибочные объяснения их причин. Известный пример – «проклятие Sports Illustrated». Утверждают, что спортсмен, чей портрет опубликован на обложке журнала, обречен на плохие результаты в следующем сезоне. В качестве причины часто называют излишнюю самоуверенность и боязнь не соответствовать ожиданиям, однако существует и более простое объяснение. Спортсмен попадает на обложку Sports Illustrated в том случае, если он добился исключительных результатов в предыдущем сезоне, в том числе, вероятно, и при помощи удачи – а она непостоянна.

По странному совпадению, когда мы с Амосом писали об интуитивных предсказаниях, я смотрел зимние Олимпийские игры – соревнования мужчин по прыжкам на лыжах с трамплина. У каждого участника есть две попытки, которые объединяются в окончательный результат. Я с удивлением слушал заявления комментатора во время подготовки ко второму прыжку: «Норвежец отлично выполнил первый прыжок, теперь спортсмен напряжен, постарается защитить свою позицию и, вероятнее всего, прыгнет хуже» или «Шведский спортсмен плохо выполнил первый прыжок, он знает, что ему нечего терять, будет расслаблен, и это поможет ему прыгнуть лучше». Комментатор заметил регрессию к среднему и придумал совершенно безосновательные объяснения, которые тем не менее вполне могли соответствовать действительности. Если бы мы измерили пульс спортсменов перед каждым прыжком, то, возможно, обнаружили бы, что они более расслаблены после первой неудачи. Или не обнаружили бы. Важно помнить о том, что не следует искать объяснений изменению результатов между двумя попытками. Это – математически неизбежное следствие того факта, что на исход первого прыжка влияла удача. История не слишком удовлетворительная – нам всем больше понравилось бы каузальное объяснение, – но другой нет.

Понимание регрессии к среднему

Независимо от того, не замечают ли его или неправильно объясняют, феномен регрессии чужд человеческому разуму. Регрессию впервые опознали и поняли на двести лет позже, чем теорию гравитации и дифференциальное исчисление. Более того, для объяснения регрессии потребовался один из лучших британских умов XIX века.

Впервые это явление описал сэр Фрэнсис Гальтон, троюродный брат Чарльза Дарвина, обладавший поистине энциклопедическими знаниями. В статье под названием «Регрессия к среднему при наследовании», опубликованной в 1886 году, он сообщил об измерениях нескольких последовательных поколений семян и о сравнении роста детей с ростом их родителей. О семенах он пишет так:

«Исследования дали интересный результат, и на их основании 9 февраля 1877 года я прочитал лекцию в Королевской ассоциации. Эксперименты показали, что потомство не походило на родителей размером, но всегда оказывалось более заурядным, то есть меньше крупных родителей или больше мелких… Эксперименты показали также, что в среднем регрессия потомства прямо пропорциональна отклонению родителей от среднего».

Гальтон, очевидно, ожидал, что ученая аудитория в Королевской ассоциации, старейшей независимой исследовательской организации мира, так же удивится его «интересным результатам», как и он сам. Но самое интересное состоит в том, что его удивила обычная статистическая закономерность. Регрессия распространена повсеместно, но мы её не узнаём. Она прячется на виду. За несколько лет, с помощью выдающихся статистиков того времени, Гальтон проделал путь от открытия наследственной регрессии размеров до более широкого понимания того, что регрессия неизбежно возникает при неполной корреляции между двумя величинами.

Среди препятствий, которые пришлось преодолеть исследователю, оказалась и проблема измерения регрессии между величинами, выражающимися в разных единицах: например, весом и умением играть на пианино. Их измеряют, беря в качестве эталона для сравнения все население. Представьте, что у 100 детей из всех классов начальной школы измерили вес и умение играть и расположили результаты по порядку, от максимальной до минимальной величины каждого показателя. Если Джейн на третьем месте по музыке и на двадцать седьмом по весу, можно сказать, что игра на пианино у нее лучше, чем рост. Давайте для простоты сделаем несколько допущений.

В любом возрасте:

• Успехи в игре на пианино зависят только от количества часов занятий в неделю.

• Вес зависит исключительно от количества потребляемого мороженого.

• Поедание мороженого и количество часов занятий музыкой в неделю – независимые величины.

Теперь мы можем написать некоторые уравнения с использованием позиций в списке (или стандартных оценок, как их называют статистики):

вес = возраст + потребление мороженого

игра на пианино = возраст + количество часов занятий в неделю

Очевидно, что при попытках предсказать уровень игры на пианино по весу или наоборот, будет появляться регрессия к среднему. Если о Томе известно лишь то, что он по весу двенадцатый (намного выше среднего), можно сделать статистический вывод, что Том, вероятно, старше среднего и, возможно, потребляет больше мороженого, чем другие. Если о Барбаре известно лишь то, что она восемьдесят пятая по пианино (намного ниже среднего по группе), можно сделать вывод, что Барбара, скорее всего, еще маленькая и, наверное, занимается меньше других.

Коэффициент корреляции между двумя величинами, варьирующийся от 0 до 1, – это мера относительного веса факторов, влияющих на обе из них. Например, у всех нас половина генов – общая с каждым из родителей, и у черт, на которые внешние факторы влияют мало (например, у роста), корреляция между показателями родителя и ребенка близка к 0,5. Чтобы оценить значение меры корреляции, приведу несколько примеров коэффициентов:

Вернуться к просмотру книги Перейти к Оглавлению