Думай «почему?». Причина и следствие как ключ к мышлению - читать онлайн книгу. Автор: Джудиа Перл, Дана Маккензи cтр.№ 24

читать книги онлайн бесплатно
 
 

Онлайн книга - Думай «почему?». Причина и следствие как ключ к мышлению | Автор книги - Джудиа Перл , Дана Маккензи

Cтраница 24
читать онлайн книги бесплатно

Главной точкой соперничества Фишера и Райта был не путевой анализ, а эволюционная биология. Фишер был не согласен с теорией Райта (называемой генетическим дрейфом), согласно которой вид может эволюционировать очень быстро, когда проходит через популяционное бутылочное горлышко. Детали этого спора выходят за рамки данной книги, и заинтересованный читатель должен обратиться к работе Провина. Важно здесь, однако, следующее: с 20-х до 60-х годов ХХ века научный мир был преимущественно повернут лицом к Фишеру, как к оракулу статистических знаний. И уверяю вас, что он никогда не сказал ни одного доброго слова про путевой анализ.

В 1960-х все стало понемногу меняться. Группа представителей общественных наук, включающая Отиса Дункана, Хьюберта Блалока и экономиста Артура Гольдбергера (упомянутого ранее), заново открыла путевой анализ как метод предсказания результатов социальной и образовательной политики. По иронии судьбы Райта приглашали выступить перед влиятельной группой эконометриков, комиссией Каулза, в 1947 году, но ему совершенно не удалось разъяснить им, в чем смысл путевых диаграмм. Только когда экономисты сами додумались до подобных идей, на короткое время удалось установить контакт. Судьба путевого анализа в экономике и в социологии двигалась по разным траекториям, но каждая из них вела к предательству идей Райта. Социологи переименовали путевой анализ в уравнения структурного моделирования (Structural Equation Modeling; SEM), полюбили диаграммы и активно их использовали до 70-х годов прошлого века, когда компьютерная программа LISREL автоматизировала подсчет путевых коэффициентов (в некоторых случаях). Райт мог бы предсказать то, к чему это привело: путевой анализ превратился в рутинный метод, а исследователи стали пользователями программы, которых слабо интересует, что у нее внутри. В конце 1980-х обращенный к научному обществу призыв (статистика Дэвида Фридмана) объяснить допущения, стоящие за уравнениями структурного моделирования, был проигнорирован, а некоторые эксперты по SEM даже отрицали, что этот метод как-то связан с причинностью.

В экономике алгебраическая часть путевого анализа получила известность как системы одновременных уравнений (без общепринятого сокращения). Экономисты почти никогда не использовали путевые диаграммы и продолжают обходиться без них и по сей день, полагаясь взамен на числовые уравнения и матричную алгебру. Прямое последствие этого подхода в том, что, поскольку алгебраические равенства не направлены(т. е. x = y — это то же самое, что и y = x), у экономистов не было обозначений для различения причинных и регрессионных уравнений, поэтому на вопросы, связанные с выбором стратегии, не получалось ответить даже после того, как уравнения были решены. Вплоть до 1995 года большинство экономистов избегали прямо придавать своим уравнениям каузальный или контрфактивный смысл. Даже те из них, кто использовал структурные уравнения для обоснования выбора стратегических решений, неизлечимо боялись диаграмм, хотя те могли бы избавить их от многих страниц лишних вычислений. Неудивительно, что многие экономисты и сегодня стоят на точке зрения «в данных уже содержится все».

По всем этим причинам многообещающие перспективы путевых диаграмм оставались реализованы только отчасти, по крайней мере до 90-х годов прошлого века. В 1983 году Райта снова лично вызвали на ринг защищать их, на этот раз в «Американском журнале генетики человека». В то время, когда он писал эту статью, ему уже было за 90. Читать его эссе 1983 года одновременно и радостно, и больно — оно о том же, о чем он писал в 1923 году. Много ли в истории науки случаев, когда нам выпадала честь вновь выслушать создателя великой теории через 60 лет после того, как он впервые изложил ее на бумаге? Это примерно как если бы Чарлз Дарвин восстал из могилы, чтобы поприсутствовать на «обезьяньем процессе» Скоупса в 1925 году. Но это и трагично, потому что за эти 60 лет теория должна была расти, развиваться, цвести, а вместо этого она осталась практически на том же уровне, что и в 1920-х.

Написать статью Райта побудила критика путевого анализа, которую ранее опубликовали в том же журнале Самуэль Карлин (математик Стэнфордского университета, награжденный в 1989 году Национальной научной медалью, внесший фундаментальный вклад в экономику и популяционную генетику) и два его соавтора. Нас здесь интересуют два аргумента Карлина.

Во-первых, путевой анализ вызывает у Карлина возражения по причине, которую Найлз не упомянул: он предполагает, что все взаимоотношения между любыми переменными в путевой диаграмме линейны. Это допущение позволило Райту описать каузальные взаимодействия с помощью только одного числа — путевого коэффициента. Если бы уравнения были нелинейны, то тогда воздействие на Y от изменения X на единицу зависело бы от текущего значения X. Ни Карлин, ни Райт не знали, что до появления общей теории нелинейности осталось совсем немного (ее всего три года спустя разработает звезда моей лаборатории Томас Верма).

Но самое интересное возражение Карлина — как раз то, которое он считал важнейшим: «Наконец, с наибольшим успехом исследователь может выбрать подход, не предполагающий модели вообще, приводящий к пониманию данных интерактивно, используя ряд отображений, индексов и контрастов. Этот подход подчеркивает концепцию надежности данных в интерпретации результатов». В одном этом коротком отрывке Карлин выражает, сколь мало изменилось со времен Пирсона и насколько влиятельной его идеология оставалась даже в 1983 году. Он говорит, что в самих данных уже заключена вся научная мудрость; их нужно только уметь умаслить и сделать им массаж (с помощью отображений, индексов и противопоставлений), и они сами выронят жемчуг мудрости вам в руки. Нашим аналитикам нет нужды принимать во внимание процессы, которые привели к появлению этих данных. У нас все получится ровно так же, и даже лучше с подходом, «не предполагающим никакой модели вообще». Если бы Пирсон жил сегодня, в эпоху больших данных, он сказал бы ровно это: все ответы уже содержатся в самих данных. Конечно, утверждения Карлина нарушают все, о чем мы говорили в первой главе. Чтобы говорить о причинности, нам требуется ментальная модель реального мира. «Безмодельный подход» может привести нас на первую ступень Лестницы Причинности, но никак не дальше.

Райт, надо отдать ему должное, прекрасно понимал, как велики ставки, и написал недвусмысленно: «Заявляя, что подход, не предполагающий модели вообще — наилучшая альтернатива… Карлин с соавторами хотят не просто изменить метод путевого анализа, но лишить его цели и оценки относительной важности различных причин. Этот анализ невозможен без модели. Они предлагают тем, кому хочется провести такую оценку, подавить свое желание и заняться чем-нибудь другим».

Райт понимал, что защищает саму суть научного подхода и интерпретации данных. Сегодня я бы дал энтузиастам больших данных, избегающим моделей, тот же совет. Конечно, замечательно попытаться выудить всю информацию, которую данные способны нам сообщить, но надо понимать, насколько далеко это позволит нам уйти. А уйти оно позволит не дальше первой ступени Лестницы Причинности и никогда не сможет дать ответ даже на такой простой вопрос: какова относительная важность различных действующих факторов?

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию