Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Рис. 52. Каузальная диаграмма для примера с менделевой рандомизацией
Как обычно, к вышесказанному есть и оговорка. Второе исследование, опубликованное в том же году, отметило, что у людей с менее опасным вариантом гена ЛПНП низкий уровень холестерина сохраняется в течение всей их жизни. Менделева рандомизация говорит нам, что, сокращая ваш уровень ЛПНП на 34 % в течение всей вашей жизни, снижает ваш риск умереть от инфаркта наполовину. Но статины не способны снижать ваш уровень «плохого» холестерина подобным образом — они действуют только с того дня, с которого вы начали их принимать. Если вам 60 лет, у ваших артерий уже 60 лет износа. По этой причине весьма вероятно, что менделева рандомизация переоценивает истинную пользу статинов.
Однако, начав снижать уровень холестерина смолоду — посредством диеты, или физкультуры, или даже статинов, — вы спустя время добьетесь значительных результатов.
С точки зрения каузального анализа вышесказанное преподает нам хороший урок: в любом исследовании интервенций нам следует выяснить, действительно ли та переменная, которой мы реально манипулируем (например, уровень ЛПНП в течение жизни), — это та же самая переменная, про которую мы думаем, что манипулируем ей (уровень ЛПНП в настоящий момент). Это входит в «искусный допрос природы».
Подытожим: инструментальные переменные — важный инструмент, они помогают нам выявить каузальную информацию, выходящую за пределы do-исчисления. Последнее настаивает на точечных оценках, а не на неравенствах и не работает в случаях вроде приведенного на рис. 52, в котором все, что нам удается получить, — это неравенства. Кроме того, важно понимать, что do-исчисление намного более гибко, чем метод инструментальных переменных. В do-исчислении нам не нужно делать никаких допущений относительно природы функций в каузальных моделях. Но если мы способны научно обосновать допущение о монотонности или линейности такой функции, тогда такой более специализированный инструмент, как инструментальные переменные, стоит принять к рассмотрению.
Методы инструментальных переменных можно распространить за пределы простых моделей из четырех переменных, как на рис. 49, но без опоры на каузальные диаграммы не получится уйти далеко. Например, в некоторых случаях несовершенная инструментальная переменная (т. е. такая, которая не вполне независима от конфаундера) используется после введения поправок по разумно подобранному набору вспомогательных переменных, блокирующих пути между инструментальной переменной и конфаундером. Мой бывший студент Карлос Брито, ныне профессор в Федеральном университете Сеары в Бразилии, полностью развил эту идею превращения неинструментальных переменных в инструментальные.
Вдобавок к этому Брито изучил множество случаев, в которых целый набор переменных успешно используется в качестве инструментальной. Хотя идентификация инструментальных наборов выходит за пределы do-исчисления, при этом все же используются каузальные диаграммы. Для исследователей, понимающих такой язык, возможные схемы экспериментов весьма разнообразны: им не нужно ограничивать себя только четырехпеременными моделями, показанными на рис. 49, 51 и 52. Наши возможности ограничены только нашим воображением.
Пути было два, и мир был широк
Однако я раздвоиться не мог.[2]
Знаменитые строчки Роберта Фроста отражают глубокое понимание поэтом контрфактивного. Мы не можем странствовать по двум дорогам одновременно, однако наш разум наделен способностями судить, что произошло бы, если бы мы выбрали другой путь. Вооружившись этим суждением, к концу поэмы Фрост оказывается доволен своим выбором, понимая, что «все остальное не играет роли».
Глава 8. Контрфактивные суждения: глубинный анализ миров, которые могли бы существовать
Если бы нос Клеопатры был немного короче, то изменился бы лик всей Земли.
Блез Паскаль
Готовясь перейти на следующий уровень Лестницы Причинности, давайте обобщим, что мы узнали на втором уровне. Мы видели, что существуют несколько способов гарантировать эффект интервенции в разных контекстах и при разных условиях. В главе 4 мы обсудили рандомизированные контролируемые исследования, широко цитируемый золотой стандарт медицинских испытаний. Также мы рассмотрели методы, подходящие для наблюдательных исследований, в который испытуемая и контрольная группы выбирается непроизвольно. Если нам удается измерить все переменные, которые блокируют черные входы, формула поправки черного входа используется, чтобы получить необходимый эффект. Если мы найдем путь через парадный ход, закрытый от конфаундеров, то сможем использовать поправку парадного хода. Если же мы готовы принять линейность или монотонность, то применим инструментальные переменные (предполагая, что соответствующая переменная найдется на диаграмме или будет создана экспериментально). А действительно предприимчивые исследователи проложат другие маршруты к вершине горы Интервенции, используя do-исчисление или его алгоритмическую версию.
Во всех этих случаях мы имели дело с эффектом воздействия на исследуемую выборку или на типичного индивида, взятого из этой выборки (усредненный эффект от причинно-следственной взаимосвязи). Но пока мы упустили из обсуждения причинно-следственную связь на личном уровне — уровне отдельных событий или индивидов. Одно дело — сказать, что курение вызывает рак, но совсем другое — заявить, что ваш дядя Джо, который выкуривал по пачке сигарет 30 лет подряд, остался бы в живых, если бы не курил. Разница одновременно очевидна и глубока: никого из тех, кто, подобно дяде Джо, курил 30 лет и умер, нельзя наблюдать в альтернативной реальности, где они не курили 30 лет.
Ответственность и вина, сожаление и доверие — эти понятия служат ходовой валютой в причинно-следственных рассуждениях. Чтобы как-то их истолковать, у нас должна быть возможность сравнить то, что действительно случилось, с тем, что случилось бы гипотетически в какой-то альтернативной ситуации. Как я утверждал в главе 1, способность представлять альтернативные, несуществующие миры отделила нас от протолюдей и, более того, от всех остальных существ на планете. Любое другое существо видит то, что есть. Наш дар, который порой может быть проклятием, — видеть то, что могло бы быть.
Эта глава показывает, как использовать данные наблюдений и экспериментов, чтобы добывать информацию о контрфактивных сценариях. Она объясняет, как представлять причины индивидуального уровня на диаграммах причинности — задача, которая вынудит нас объяснить некоторые составные элементы диаграмм, о которых мы еще не говорили. Также я коснусь тесно связанного с ними понятия возможных результатов, или модели Неймана — Рубина, изначально предложенной в 1920-х годах Ежи Нейманом, польским статистиком, который позже стал профессором Калифорнийского университета в Беркли. Однако этот подход к причинному анализу получил развитие только в середине 1970-х, когда Дональд Рубин начал писать о потенциальных результатах.
Я покажу, как контрфактивность возникает естественным образом в контексте, описанном в последних нескольких главах, — в путевых диаграммах Сьюалла Райта и их расширении на структурные модели причинности (Structural Causal Models; SCM). Мы получили хорошее представление об этом в главе 1 на примере расстрельной команды, в котором было показано, как отвечать на контрфактивные вопросы