Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Поправка парадного входа была приятным сюрпризом и означала, что do-исчислению есть что предложить людям. Тем не менее в тот момент я еще не знал наверняка, достаточно ли всего трех правил do-исчисления. Не упустили ли мы четвертое правило, которое помогло бы нам решать задачи, неразрешимые с помощью только этих трех?
В 1994 году, когда я впервые предложил общественности do-исчисление, я выбрал эти три правила потому, что они были достаточны во всех известных мне случаях. Я не знал, выведут ли они меня как нить Ариадны из абсолютно любого лабиринта, или когда-нибудь мне попадется лабиринт такой дьявольской сложности, что выбраться из него я не смогу. Конечно, я надеялся на лучшее. Я предполагал, что в тех случаях, когда каузальное воздействие вообще возможно оценить по данному набору данных, последовательность шагов, использующих эти три правила, позволит сократить do-оператор. Но я не в состоянии был это доказать.
У такого типа задач есть множество предшественников в математике и логике. Это свойство в математической логике обычно называют функциональной полнотой. У обладающей полнотой системы аксиом есть следующее свойство: этих аксиом достаточно для выведения любого истинного утверждения данного языка. Некоторые очень хорошие системы аксиом тем не менее не обладают функциональной полнотой: таковы, например, аксиомы Филипа Давида, описывающие условную независимость в теории вероятности.
В этом современном мифе о лабиринте роль Ариадны для моего блуждающего Тезея сыграли две группы исследователей: Имин Хуан и Марко Вальторта из Университета Южной Каролины, а также мой собственный студент Илья Шпицер из Калифорнийского университета в Лос-Анджелесе. Обе группы одновременно и независимо доказали, что правил 1–3 достаточно, для того чтобы выбраться из любого лабиринта, из которого в принципе есть выход. Я не уверен в том, что весь мир, затаив дыхание, ждал доказательства функциональной полноты этих аксиом, потому что большинству исследователей в то время хватало просто критериев черного хода и парадного входа. Тем не менее обе команды получили награды в номинации лучших студенческих работ на конференции «Неопределенность в искусственном интеллекте», проходившей в 2006 году.
Однако признаюсь, что я как раз ждал этого решения, затаив дыхание. Оно сообщает нам, что если мы не в состоянии найти способ оценить вероятность P (Y | do (X)) с помощью правил 1–3, то решения не существует. В этом случае мы знаем, что без рандомизированного контролируемого исследования не обойтись. Оно также говорит нам, какие дополнительные допущения или эксперименты нужны для того, чтобы каузальное воздействие стало возможно оценить.
Перед тем как объявить окончательную победу, нам нужно обсудить одну проблему с do-исчислением. Как и любые вычислительные методы, оно помогает нам выстроить доказательство, но не найти решение. С ним замечательно легко проверить истинность решения, но для поиска решений оно не так хорошо. Если вы знаете правильную последовательность преобразований, легко продемонстрировать другим (знакомым с правилами 1–3), что do-оператор можно сократить. Однако, если правильная последовательность вам неизвестна, не так-то легко обнаружить ее или даже определить, что она вообще существует. Используя аналогию с геометрическими доказательствами, нам надо решить, какие дополнительные построения потребуются нам на следующем шаге. Окружность с центром в точке А? Прямая, параллельная АВ? Число возможностей безгранично, а аксиомы сами по себе не дают намека, что делать дальше. Мой школьный учитель геометрии говорил, что нужно посмотреть на ситуацию через «математические очки».
В математической логике это называется проблемой принятия решений. Многие логические системы страдают от неустранимой проблемы принятия решений. Например, если у нас есть кучка костяшек домино различных размеров, у нас нет определенного способа решить, возможно ли сложить из них квадрат заданного размера. Но когда расклад уже заявлен, очень просто подтвердить, является ли он решением.
К счастью (опять) для do-исчисления, с проблемой принятия решений удалось справиться. Илья Шпицер, основываясь на более ранней работе другого моего студента по имени Цзинь Тянь, нашел алгоритм, который определяет, существует ли решение в «полиномиальном времени». Это до некоторой степени технический термин, но, продолжая нашу аналогию с поиском выхода из лабиринта, это означает, что у нас появляется намного более эффективный способ поиска выхода, чем случайное блуждание по всем доступным путям.
Алгоритм Шпицера для поиска всех каузальных воздействий не устраняет потребности в do-исчислении. На самом деле мы нуждаемся в нем даже больше, и по нескольким независимым причинам. В первую очередь, оно нужно нам для того, чтобы продвинуться дальше исследований, использующих только наблюдения. Допустим, что все складывается наихудшим образом и наша каузальная модель не допускает оценки каузального воздействия P (Y | do (X)) исключительно из данных, полученных в результате наблюдений. Предположим, что мы также не в состоянии провести рандомизированное контролируемое исследование со случайно назначаемыми X. Сообразительный исследователь спросит, удастся ли нам тогда оценить P (Y | do (X)), рандомизируя какую-либо другую переменную, скажем Z, которая лучше поддается контролю, чем X.
Например, если мы хотим узнать воздействие уровня холестерина (X) на сердечно-сосудистые заболевания (Y), мы можем манипулировать диетой испытуемых (Z) вместо того, чтобы пытаться прямо контролировать уровень холестерина у них в крови. Таким образом, мы задаемся вопросом, реально ли найти такую суррогатную переменную Z, которая позволит получить ответ на вопрос о причинах. На языке do-исчисления вопрос звучит так: возможно ли найти такое Z, чтобы преобразовать P (Y | do (X)) в выражение, в котором Z, а не X подвергается do-оператору. Это совершенно отдельная задача, не подпадающая под алгоритм Шпицера. К счастью, для нее тоже есть полный ответ — новый алгоритм, открытый Элиасом Баренбоймом в моей лаборатории в 2012 году.
Еще больше подобных задач возникает, когда мы рассматриваем проблемы транспортабельности или внешней валидности данных, выясняя, будет ли экспериментальный результат сохранять валидность в других условиях, отличающихся от изученных по нескольким ключевым параметрам. Этот более амбициозный набор вопросов бьет уже в самое сердце научной методологии, потому что наука не существует без обобщений. Однако вопрос обобщения не двигался с места по крайней мере два столетия. Инструментов для нахождения решения попросту не было.
В 2015 году Баренбойм и я представили в Национальную академию наук публикацию, в которой проблема решается в случае, если вы можете выразить свои допущения относительно двух сред с помощью каузальных диаграмм. В этих случаях правила do-исчисления обеспечивают систематический подход к определению того, насколько каузальные воздействия, определенные в опытных условиях, помогут нам оценить воздействия в интересующих нас целевых условиях.
Еще одна причина, по которой do-исчисление остается