Думай «почему?». Причина и следствие как ключ к мышлению - читать онлайн книгу. Автор: Джудиа Перл, Дана Маккензи cтр.№ 78

читать книги онлайн бесплатно
 
 

Онлайн книга - Думай «почему?». Причина и следствие как ключ к мышлению | Автор книги - Джудиа Перл , Дана Маккензи

Cтраница 78
читать онлайн книги бесплатно

Как оказалось, ED в нашем примере нельзя игнорировать по отношению к S, обусловленной EX, и поэтому метод сопоставления (приравнивание Берта к Кэролайн) даст неправильный ответ. Фактически оценки для них должны отличаться на сумму S1 (Берт) — S1 (Кэролайн) = $5 000 (читатель теперь выведет это из чисел в табл. 12 и трехэтапной процедуры). Теперь я покажу, что благодаря диаграмме причинности студент мог сразу увидеть, что ED нельзя игнорировать и пытаться искать здесь соответствие. При отсутствии диаграммы у студента возникнет соблазн предположить, что игнорируемость сохраняется по умолчанию, и он попадет в эту ловушку. (Это не безосновательные подозрения. Я позаимствовал идею для примера из статьи в «Юридическом журнале Гарвардского университета», где история была, по сути, такой же, как на рис. 53 и автор действительно использовал сопоставление.)

Вот как целесообразно использовать причинно-следственную диаграмму для проверки (условной) игнорируемости. Чтобы определить, является ли X игнорируемым относительно результата Y, обусловленного набором совпадающих переменных Z, нам надо лишь убедиться, что Z блокирует все обходные пути между X и Y и ни один член Z не является потомком X. Это так просто! В нашем примере предлагаемая совпадающая переменная (стаж) блокирует все лазейки (потому что их нет), но не проходит тест, так как является потомком образования. Следовательно, ED нельзя игнорировать, а EX нельзя использовать для сопоставления. Никакой сложной умственной гимнастики не требуется, достаточно взглянуть на схему. От исследователя вообще не требуется мысленно оценивать, насколько вероятен потенциальный результат того или иного лечения.

К сожалению, Рубин не рассматривает диаграммы причинности как средство, которое помогает сделать причинно-следственные выводы. Следовательно, те, кто последует его советам, не смогут проверить игнорируемость вот так. Им придется либо заняться сложной умственной гимнастикой, чтобы убедиться в верности допущения, либо просто принять его как «черный ящик». И действительно, видный исследователь потенциальных результатов Маршалл Джоффе писал в 2010 году, что допущения об игнорируемости обычно делают потому, что они оправдывают использование доступных статистических методов, а не потому, что искренне в них верят.

С прозрачностью тесно связано понятие проверяемости, которое неоднократно упоминалось в этой книге. Модель, представленная как диаграмма причинности, легко тестируется на совместимость с данными, тогда как модель, представленная на языке потенциальных результатов, лишена этой возможности. Проверка проходит так: всякий раз, когда все пути между X и Y на диаграмме блокируются набором узлов Z, в данных X и Y должны быть независимыми при условии Z. Это свойство d-сепарации, упомянутой в главе 7, которое позволяет нам отклонять модель всякий раз, когда независимость не проявляется в данных. Напротив, если одна и та же модель выражается на языке потенциальных результатов (т. е. в виде набора утверждений об игнорируемости), нам не хватает математического аппарата, чтобы выявить независимость, которую влечет за собой эта модель, и исследователям не удастся подвергнуть ее проверке. Трудно понять, как исследователям потенциальных результатов удавалось мириться с этим недостатком, не сопротивляясь. У меня есть единственное объяснение: их так долго держали в стороне от графических инструментов, что они забыли, что каузальные модели могут и должны быть проверены.

Теперь я должен применить те же стандарты прозрачности к себе и расказать немного больше о допущениях, воплощенных в структурной модели причинности.

Помните историю Авраама, которую я упоминал выше? Первой реакцией библейского героя на известие о неминуемом разрушении Содома были поиски зависимости «доза — реакция», или функции-ответа, связывающей порочность города с его наказанием. Это был здравый научный инстинкт, но, подозреваю, мало кто из нас был бы достаточно спокоен, чтобы отреагировать таким образом.

Функция-ответ — ключевая составляющая, которая позволяет СМП обрабатывать контрфактивы. Она подразумевается в парадигме потенциальных результатов у Рубина, но является основным отличием СМП от байесовских сетей, включая каузальные байесовские сети. В вероятностной байесовской сети стрелки к Y означают, что вероятность Y определяется таблицами условной вероятности для Y с учетом наблюдений за его родительскими переменными. То же верно и для каузальных байесовских сетей, только в таблицах условной вероятности указывается вероятность Y с учетом интервенций по родительским переменным. Обе модели определяют вероятности для Y, а не конкретное значение Y. В структурной модели причинности нет дополнительных таблиц вероятностей. Стрелки просто означают, что Y является функцией от своих родителей, так же как и экзогенная переменная UY:

Y = fY (X, A, B, C, …, UY) (8.4)

Таким образом, инстинкт Авраама был здравым. Чтобы превратить некаузальную байесовскую сеть в причинную модель, или, точнее, сделать ее способной отвечать на контрфактивные запросы, нам нужна взаимосвязь «доза — реакция» в каждом узле.

Я осознал это далеко не сразу. Еще не обратившись к контрфактивам, я очень долго пытался сформулировать модели причинности, используя таблицы условной вероятности. Одним из препятствий, с которым я столкнулся, были циклические модели, полностью устойчивые к формулировкам условной вероятности. Еще одним препятствием была необходимость придумать запись, позволяющую отличать вероятностные байесовские сети от причинных. В 1991 году меня внезапно осенило, что все трудности исчезнут, если сделать Y функцией от его родительских переменных и обозначить с помощью UY все неопределенности, касающиеся Y. В то время это казалось ересью по отношению к моему же учению. Посвятив несколько лет изучению причин вероятностей в искусственном интеллекте, я предлагал теперь сделать шаг назад и использовать невероятностную квазидетерминированную модель. Я до сих пор помню, как мой тогдашний студент Дэнни Гейгер недоверчиво спрашивал: «Детерминированные уравнения? Действительно детерминированные?» Как будто Стив Джобс только что велел ему купить PC вместо Mac. (Это был 1990 год!)

На первый взгляд, в этих уравнениях не было ничего революционного. Экономисты и социологи использовали такие модели с 1950–60-х годов и называли это моделированием структурных уравнений. Но это название сигнализирует о противоречиях и путанице, связанной с каузальной интерпретацией уравнений. Со временем экономисты упустили из виду тот факт, что первые разработчики этих моделей, Трюгве Ховельмо в экономике и Отис Дадли Дункан в социологии, хотели, чтобы они отображали причинно-следственные связи. Они начали путать структурные уравнения с линиями регрессии, тем самым отрывая суть от формы. Например, в 1988 году, когда Дэвид Фридман попросил 11 исследователей SEM объяснить, как применять интервенцию к модели структурного уравнения, ни один из них не смог этого сделать. Они рассказали, как оценить коэффициенты на основе данных, но не сумели растолковать, зачем это делать. Если интерпретация функции-ответа, которую я представил в период с 1990 по 1994 год, и внесла нечто новое, то это было всего лишь возвращением и оформлением изначальных намерений Ховельмо и Дункана. Я хотел представить их ученикам смелые выводы, которые вытекают из этих намерений, если относиться к ним серьезно.

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию