Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Пример преобразования, сохраняющего значение, — алгебраическое преобразование, превращающее y = ax+ b в ax = y — b. Отношения между X и Y остаются прежними, меняется только формат.
Мы уже знакомы с некоторыми легитимными преобразованиями do-выражений. Так, правило 1 гласит, что, когда мы наблюдаем переменную W, которая не имеет отношения к Y (возможно, является условной по отношению к другим переменным Z), вероятностное распределение Y не изменится. В главе 3 мы видели, что переменная пожар нерелевантна для состояния переменной тревога, если мы знаем состояние переменной-медиатора (дым). Это утверждение о нерелевантности переводится как символическая манипуляция: P (Y | do (X), Z, W) = P (Y | do (X), Z). Постулированное выше уравнение правомерно, если набор переменных Z блокирует все пути от W к Y после того как мы удалили все стрелки, ведущие к Х. В примере пожар → дым → тревога W = пожар, Z = дым и Y = тревога, а Z блокирует все пути от W к Y (в этом случае у нас нет переменной X).
Следующая легитимная трансформация знакома нам по обсуждению критерия черного хода. Мы знаем, что, если набор переменных Z блокирует все пути черного хода от X к Y, поправка по Z, do (X) эквивалентна see (X).
Следовательно, мы можем написать P (Y | do (X), Z) = P (Y | X, Z), если Z удовлетворяет критериям черного хода. Примем это как правило 2 нашей системы аксиом. Хотя это, вероятно, менее самоочевидное правило, чем правило 1, в простейших случаях это принцип общей причины Ханса Рейхенбаха, измененный таким образом, чтобы мы не путали схождения с конфаундерами. Другими словами, мы говорим, что после того, как введены поправки по достаточному набору переменных, снимающих осложнения, любая оставшаяся корреляция представляет собой истинное каузальное воздействие.
Правило 3 очень простое: оно более-менее сводится к тому, что мы можем убрать do (X) из P (Y | do (X)) в любых случаях, в которых нет каузальных путей от X к Y, т. е. P (Y | do (X)) = P (Y), если нет пути от X к Y, состоящего только из стрелок, направленных вперед. Перефразируем это правило следующим образом: если мы делаем нечто, что не влияет на Y, вероятностное распределение Y не изменяется. Помимо того, что правила 1–3 столь же самоочевидны, как и аксиомы Евклида, их можно также доказать математически, используя наше «бесстрелочное» определение do-оператора и базовые законы вероятности. Обратите внимание, что правила 1 и 2 включают условные вероятности, связанные со вспомогательными переменными Z, отличными от X и Y. Эти переменные допустимо считать контекстом, в котором исчисляется вероятность. Иногда уже само присутствие этого контекста делает преобразования законными. В правиле 3 также могут присутствовать вспомогательные переменные, но я опустил их для простоты.
Отмечу, что у каждого правила имеется простая синтаксическая интерпретация. Правило 1 разрешает добавить или удалить наблюдения. Правило 2 разрешает замену интервенции на наблюдение или наоборот. Правило 3 разрешает добавлять или удалять интервенции. Все эти разрешения действуют при определенных условиях, которые в каждом конкретном случае должны быть подтверждены каузальными диаграммами.
Теперь мы готовы продемонстрировать, как правила 1–3 позволяют нам преобразовывать одну формулу в другую до тех пор, пока (если только мы окажемся достаточно сообразительны) не получим выражение, которое нам нужно. Хотя это займет довольно много места, я думаю, что нужно все-таки наглядно показать вам, как с помощью последовательного применения правил do-исчисления получается формула парадного входа (рис. 44). Вам нет необходимости внимательно следить за каждым шагом, я показываю вам вывод формулы, чтобы вы ощутили вкус do-исчисления.
Наше путешествие начнется с целевого выражения P (Y | do (X)). Мы вводим вспомогательные переменные и трансформируем целевое выражение так, чтобы оно не содержало оператора do и совпадало, конечно, с формулой поправок парадного входа. Каждый наш шаг обосновывается каузальной диаграммой, связывающей X, Y и вспомогательные переменные, или в некоторых случаях субдиаграммами, в которых стерты стрелки, соответствующие интервенциям. Эти обоснования изображаются справа.
К do-исчислению я испытываю особые чувства. С помощью этих трех скромных правил мне удалось вывести формулу парадного входа. Это было первое каузальное воздействие, которое получилось оценить иными средствами, чем поправки по конфаундерам. Я был убежден, что без do-исчисления этого никто не сможет сделать, поэтому представил эту задачу как вызов на семинаре по статистике в Калифорнийском университете в Беркли в 1993 году и даже предложил приз в 100 долларов тому, кто ее решит. Пол Холланд, присутствовавший на семинаре, написал мне, что предложил задачу в качестве проекта своим студентам и пошлет мне решение, когда оно будет готово (коллеги рассказывали мне, что на конференции в 1995 году он таки представил длинное решение, так что, возможно, я должен ему 100 долларов, если найду его доказательство). Экономисты Джеймс Хекман и Родриго Пинто предприняли следующую попытку доказать формулу парадного входа, используя только «стандартные инструменты», в 2015 году. Им это удалось, хотя и ценой восьми страниц сложных выкладок.
В ресторане вечером накануне этой беседы я записал доказательство (очень похожее на то, что приведено на рис. 44) на салфетке для Дэвида Фридмана. Позже он написал мне, что потерял ту салфетку, не может восстановить доказательство, и спросил меня, не сохранилось ли у меня копии. На следующий день Джейми Робинс написал мне из Гарварда, сообщив, что слышал о «задаче на салфетке» от Фридмана и готов вылететь в Калифорнию ближайшим рейсом, чтобы вывести доказательство вместе со мной.
Рис. 44. Вывод формулы поправок парадного входа по правилам do-исчисления
Я был очень рад поделиться с Робинсом секретами do-исчисления и полагаю, что его поездка в Лос-Анджелес в том году сыграла ключевую роль в том, с каким энтузиазмом он воспринял каузальные диаграммы. Благодаря ему и