Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Графические методы, возникнув в 90-е годы прошлого века, полностью упростили проблему конфаундеров. В частности, скоро мы познакомимся с методом критерия черного хода, который недвусмысленно определяет, какие переменные в каузальной диаграмме являются деконфаундерами. Если исследователь в состоянии получить данные по этим переменным, он может скорректировать их влияние и предсказать результаты действия, даже не осуществляя его.
На самом деле Революция Причинности идет дальше. В некоторых случаях мы вправе ввести поправку по конфаундерам даже тогда, когда у нас нет данных по достаточному массиву деконфаундеров. В этих случаях целесообразно использовать другие формулы корректировки — не общепринятые, которые работают только с критерием черного хода — и убрать всю систематическую ошибку. Эти впечатляющие разработки мы прибережем для главы 7.
Хотя вмешивающиеся переменные известны очень давно во всех областях науки, понимание, что эта проблема требует каузальных, а не статистических решений, пришло относительно недавно. Даже совсем недавно, в 2001 году, рецензенты отклонили мою статью, настаивая на том, что «проблема вмешивающихся переменных целиком лежит в плоскости традиционной статистики». К счастью, за последнее десятилетие число таких редакторов резко сократилось. Теперь образовался практически всеобщий консенсус, по крайней мере среди философов, эпидемиологов и представителей общественных наук, в том, что: 1) проблема конфаундеров нуждается в каузальном решении и такое решение есть; 2) каузальные диаграммы — это полный и систематический метод для нахождения таких решений. Эпоха сложностей с конфаундерами подошла к концу!
Леденящий ужас конфаундеров
В 1998 году в статье, опубликованной в «Медицинском журнале Новой Англии», сообщалось, что обнаружена связь между регулярными занятиями спортивной ходьбой и снижением смертности среди мужчин-пенсионеров. Исследователи использовали данные программы «Здоровье сердца» в Гонолулу, которая наблюдала за здоровьем 8 тысяч мужчин японского происхождения с 1965 года.
Исследователи во главе с Робертом Эбботом, специалистом по биологической статистике, хотели выяснить, живут ли дольше мужчины, занимающиеся физкультурой более регулярно. Они взяли выборку в 707 человек из более крупной группы в 8 тысяч, в которой все были достаточно здоровы физически для пеших прогулок. Группа Эббота выяснила, что за 12-летний период уровень смертности был в два раза выше среди мужчин, которые в день проходили менее мили (далее «малоходящие») по сравнению с теми, кто проходил больше 2 миль в день («многоходящие»). Точнее, среди малоходящих умерло 43,0 %, в то время как среди многоходящих — только 21,5 %.
Однако, поскольку экспериментаторы не выбирали случайным образом, кому из испытуемых предписывается ходить много, а кому мало, нам приходится учитывать возможность искажений из-за вмешивающихся факторов. Наиболее очевидный из них — возраст: более молодые пенсионеры, вероятно, более склонны к физическим нагрузкам, и одновременно вероятность смерти для них меньше. Таким образом, у нас получается каузальная диаграмма вроде той, что изображена на рис. 22.
Классическая вилка в узле «Возраст», говорит нам о том, что возраст — вмешивающаяся переменная для ходьбы и смертности. Я уверен, что вы в состоянии придумать и другие конфаундеры. Вероятно, малоходящие менее подвижны не случайно, им просто трудно много ходить. Следовательно, состояние здоровья тоже может быть конфаундером. Подобный поиск вмешивающихся факторов способен продолжаться до бесконечности. Не исключено, что малоходящие больше пьют? Или чаще переедают?
Хорошие новости: исследователи постарались учесть все эти моменты. Они подсчитали и внесли поправки на такие факторы, как возраст, состояние здоровья, потребление алкоголя, особенности диеты и многие другие. Так, действительно оказалось, что многоходящие в среднем чуть моложе. Исследователи внесли поправки по возрасту и обнаружили, что разница в смертности между много- и малоходящими все еще остается значительной (41 % для малоходящих при 24 % для многоходящих).
Несмотря на это, исследователи все же были крайне осторожны в своих выводах. В конце статьи они писали: «Конечно, прямое влияние сознательных попыток увеличить расстояние, проходимое за день, на долголетие физически способных к ходьбе мужчин невозможно вывести из данных нашей работы». Используя язык главы 1, они отказываются что-либо говорить о вероятности выживания в следующие 12 лет при условии, что вы занимаетесь ходьбой — do (ходьба).
Рис. 22. Каузальная диаграмма для примера с ходьбой
Отдавая должное Эбботу и его группе, надо сказать, что у них действительно были причины для такой осторожности. Это было первое исследование на указанную тему, и выборка была относительно невелика и однородна. Тем не менее такая осторожность отражает более общую точку зрения, выходящую за пределы гомогенности и размеров выборки. Исследователей приучили полагать, что работы, основанные на наблюдениях (такие, где испытуемые сами выбирают экспериментальные воздействия), не могут выявить действие каузальных факторов. Я считаю, что эта осторожность избыточна. Зачем еще прилагать усилия и вводить поправки по всем конфаундерам, если не для того, чтобы избавиться от ложной части связи и таким образом лучше понять каузальную часть? Вместо того чтобы говорить: «Конечно, мы не можем», как поступили они, нам следует провозгласить, что, разумеется, мы в состоянии кое-что сказать о намеренной интервенции. Если мы верим, что команда Эббота идентифицировала все важные конфаундеры, мы должны верить и тому, что намеренные занятия ходьбой непременно продлевают жизнь (по крайней мере, в случае японских мужчин).
Это прогностическое умозаключение, основанное на предположении, что никакие другие конфаундеры не играют сколько-нибудь значительной роли в выявленных отношениях переменных, — очень важная информация. Она точно сообщает потенциальному спортсмену, какого рода неопределенность остается, если принять это утверждение по номиналу. Она говорит, что остаточная неопределенность не выше, чем вероятность, что существуют дополнительные осложнители, которые не были приняты во внимание. Она также ценна тем, что определяет направление будущих исследований, которые должны сосредоточиться на этих других факторах (если они существуют), а не на тех, которые были нейтрализованы в данной работе. Короче говоря, знать набор допущений, которые стоят за данным выводом, не менее важно, чем пытаться обойти эти допущения при помощи РКИ, с которым как мы сейчас увидим, много своих сложностей.
Искусное дознание природы: почему РКИ работают
Как я уже говорил выше, есть одно обстоятельство, при котором ученые перестают избегать говорить о причинности: это происходит тогда, когда им удается провести рандомизированное контролируемое исследование. Вы можете прочитать об этом в Википедии или в тысяче других мест: «РКИ часто считается золотым стандартом клинических испытаний». За это нам надо благодарить Р. Э. Фишера, так что весьма любопытно, что человек, очень близкий к нему, пишет о том, какие умозаключения привели его к