Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Чтобы не оставлять читателя под впечатлением, что do-исчисление хорошо только для теории и для решения головоломок на досуге, я закончу эту секцию практической задачей, которую поставили недавно два ведущих статистика Нэнни Вермут и Дэвид Кокс. Она показывает, как дружеская подсказка «Попробуй do-исчисление» может помочь экспертам в области статистики решать сложнейшие практические задачи.
Приблизительно в 2005 году Вермут и Кокс заинтересовались так называемой проблемой последовательных решений, или курса лечения, меняющегося во времени, с которой часто приходится сталкиваться, например, при лечении СПИДа. В этом случае типично, что лечение проводится продолжительное время, и в каждый период времени врачи изменяют силу и дозировку медикаментозных средств в последующих назначениях, исходя из состояния здоровья пациента. В свою очередь, на состояние здоровья пациента влияет лечение, назначенное ему в прошлом.
Рис. 45. Новая «задача на салфетке»?
Таким образом, в итоге у нас получается сценарий вроде того, что изображен на рис. 46, где показаны два отрезка времени и два назначения врача. Первое назначение (X) рандомизировано, а второе (Z) назначается в ответ на наблюдение (W), которое зависит от X. Задача Кокса и Вермут состояла в том, чтобы из данных, полученных в таком режиме лечения, предсказать воздействие Х на исход Y, предполагая, что Z остается постоянным во времени вне зависимости от наблюдений W.
Рис. 46. Пример меняющегося во времени курса лечения, по Вермут и Коксу
Джейми Робинс впервые обратил мое внимание на проблему меняющегося во времени курса лечения в 1994 году, и с помощью do-исчисления мы получили общее решение, включающее серийную версию формулы поправок черного хода. Вермут и Кокс, не зная об этом методе, назвали свою проблему «непрямое осложнение» и опубликовали три работы, посвященные ее анализу (2008, 2014 и 2015). Не сумев решить ее в общем виде, они прибегли к линейной аппроксимации, но даже в линейном виде решение показалось им сложным и неудобным, потому что стандартными методами регрессии решить эту задачу нельзя.
К счастью, когда муза шепнула мне в ухо «Попробуй do-исчисление», я заметил, что их задача решается в три строчки вычислений. Логика решения такова. Нам нужно вычислить P (Y | do (X), do (Z)), в то время как нам доступны данные в виде P (Y | do (X), Z, W) и P (W | do (X)). Это отражает тот факт, что в исследовании, откуда получены наши данные, Z не контролируется извне, а следует за W согласно некоему (неизвестному) протоколу. Таким образом, наша задача — преобразовать искомое выражение в другое выражение, отражающее условия исследования, при которых do-оператор применяется только к X, но не к Z. Оказывается, что одно только применение трех правил do-исчисления позволяет этого добиться. В этой истории нет никакой морали, кроме глубокого почтения к возможностям математики по решению сложнейших задач, иногда влекущих за собой практические последствия.
Гобелен, сотканный наукой, или невидимые музыканты Do-оркестра
Я уже упоминал роль некоторых моих студентов в создании великолепного гобелена do-исчисления. Как и любой гобелен, со стороны он производит впечатление цельности и законченности, за которыми не видно, какими трудами он был создан и как много рук участвовало в процессе. В этом случае потребовалось более двух десятилетий и участие нескольких моих студентов и коллег.
Первым был Томас Верма, с которым я познакомился, когда он был еще подростком 16 лет. Его отец привел его однажды в мой офис и сказал: «Займите его чем-нибудь». Он был слишком талантлив и никому из преподавателей математики в высшей школе не удавалось найти что-нибудь достаточно интересное для него. То, чего он добился, по-настоящему потрясало воображение. Верма в итоге доказал то, что стало впоследствии известно как свойство d-сепарации (т. е. тот факт, что можно использовать правила блокирования путей для определения, какие независимые наборы переменных должны сохраняться в данных). Поразительно, но он сообщил мне, что доказал свойство d-сепарации, считая, что это была уже давно решенная задача, которую задают в качестве домашнего задания для студентов! Иногда быть молодым и наивным оказывается полезно.
Он внес свой вклад в правило 1 do-исчисления и в идею, что перекрывание путей остается на первой ступени Лестницы Причинности.
Сила доказательства Верма не была бы настолько высоко оценена, если бы не комплементарный ему результат, показывающий, что его нельзя улучшить. Другими словами, каузальная диаграмма не подразумевает никакие другие наборы независимых переменных, кроме тех, которые выявляются блокированием путей. Этот этап закончил другой студент, Дэн Гейгер. Он перешел в мою лабораторию из другой исследовательской группы в Калифорнийском университете в Лос-Анджелесе, после того как я пообещал ему, что он сразу получит степень кандидата наук, если сможет доказать две теоремы. Он выполнил свою часть обещания — выполнил свою и я! Теперь он декан отделения компьютерных наук в израильском Технионе[1], моей альма-матер.
Но Дэн был не единственным студентом, кого мне удалось переманить с другого факультета. Однажды в 1997 году, одеваясь в раздевалке бассейна университета, я разговорился с парнем-китайцем по соседству. Он писал кандидатскую по физике, и, как было тогда в моих обычаях, я агитировал его переключиться на искусственный интеллект, где происходит вся «движуха». Убедить его до конца не удалось, но уже на следующий день мне пришло письмо на электронную почту от его друга Цзинь Тяня, в котором тот сообщал, что хотел бы переключиться с физики на науку о компьютерах, и спрашивал, не найдется ли у меня для него интересного проекта на лето? Через два