Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Инструментальные переменные были известны до Революции Причинности, но каузальные диаграммы привнесли новую ясность в то, как они работают. Сноу воспользовался инструментальной переменной имплицитно, хотя у него и не было количественной формулы. Сьюалл Райт, несомненно, понимал пользу путевых диаграмм в этом случае; формула b = rZY / rZX может быть напрямую выведена из его метода путевых коэффициентов.
Похоже, что первым ученым помимо самого Сьюалла Райта, кто сознательно воспользовался инструментальными переменными, был не кто иной, как… его собственный отец Филип Райт!
Вспомним, что Филип Райт был экономистом, работавшим в организации, которая впоследствии станет Брукингским институтом. Его интересовало, как объем производства некоего товара изменится, если будет введена пошлина, которая поднимет на товар цену и предположительно увеличит объем производства. На экономическом языке его интересовала эластичность предложения.
В 1928 году Райт написал объемную монографию, посвященную подсчетам эластичности предложения для льняного масла. В замечательном приложении к этой работе он анализирует вопрос с помощью путевых диаграмм. Это был смелый ход: вспомним, что ни один экономист в мире тогда не видел и не слышал ничего подобного (на самом деле Райт-старший подстраховался и подтвердил свои подсчеты также и с помощью более традиционных методов).
На рис. 50 показана несколько упрощенная версия диаграммы Райта. В отличие от большинства диаграмм в книге, которую вы читаете, на этой имеются стрелки, идущие в обе стороны, но я бы советовал читателю не слишком нервничать по этому поводу. С помощью некоторых математических трюков мы легко сможем заменить цепь спрос → цена → предложение одной стрелкой спрос → предложение, и диаграмма тогда станет выглядеть как рис. 49 (хотя экономистам она будет после этого казаться менее приемлемой). Важно отметить, что Филип Райт осознанно ввел переменную урожай (льняного масла) с акра в качестве инструментальной, прямо влияющей на предложение, но не коррелирующей со спросом. Затем он применил метод анализа, подобный тому, который я только что привел, чтобы вычислить как влияние предложения на цену, так и влияние цены на предложение.
Историки науки спорят между собой о том, кто изобрел инструментальные переменные — метод, который стал очень популярен в современной эконометрике. Я не сомневаюсь в том, что Филип Райт позаимствовал идею путевых коэффициентов у своего сына. До этого ни один экономист не настаивал на различии между каузальными коэффициентами и коэффициентами регрессии, все они были в лагере Карла Пирса и Генри Найлза и считали, что причинность — это не более чем частный случай корреляции. Кроме этого, никто до Сьюалла Райта не предлагал способа вычисления коэффициентов регрессии на языке путевых коэффициентов с последующим выворачиванием процесса наизнанку, чтобы получить каузальные коэффициенты из регрессии. Это изобретение принадлежало исключительно Сьюаллу.
Вполне естественно, что некоторые историки экономики предположили, что все математическое приложение к этой монографии было написано Сьюаллом. Однако анализ стиля показал, что на самом деле автором был Филип.
Рис. 50. Упрощенная версия каузальной диаграммы «предложение — цена» Райта-старшего
С моей точки зрения, такое детективное расследование дополнительно украшает эту историю. Оно показывает, что Филип взял на себя труд разобраться в теории сына и выразить ее уже на своем языке.
Теперь переместимся из 50-х годов XIX века и 20-х ХХ-го в наши дни и посмотрим на инструментальные переменные за работой на примере, который я выбрал случайно из буквально многих десятков подобных.
«Хороший» и «плохой» холестерин
Помните ли вы момент, когда ваш семейный доктор впервые начал употреблять выражения «плохой» и «хороший» холестерин? Это могло случиться в 1990-е, когда препараты, снижающие уровень «плохого» холестерина (липопротеина низкой плотности, ЛПНП) в крови впервые появились на фармацевтическом рынке. Эти вещества, называемые статинами, вскоре стали приносить фармацевтическим компаниям доходы во многие миллиарды долларов.
Первым модифицирующим холестерин препаратом, испытанным с помощью рандомизированного контролируемого исследования, был холестирамин. Программа по предотвращению сердечно-сосудистых заболеваний, начатая в 1973 году и завершенная в 1984 году, показала сокращение холестерина в крови у мужчин, принимавших холестирамин, на 12,6 % и 19 %-ное снижение риска инфаркта. Поскольку речь идет об РКИ, вы можете подумать, что методы, описанные в этой главе, здесь не понадобятся, потому что они специально созданы для того, чтобы заменять РКИ в ситуациях, когда доступны только данные, полученные в результате наблюдений. Но это не так. В этом исследовании, как нередко случается с РКИ, проводимыми на людях, экспериментаторы столкнулись с проблемой неподчинения: испытуемые, которым случайным образом был назначен лекарственный препарат, на самом деле его не принимали. Это сокращает видимую эффективность препарата, поэтому логично попытаться ввести поправки по непослушным испытуемым. Но, как обычно, здесь тут же обнаруживается страшная личина конфаундеров. Если неподчинившиеся испытуемые отличаются от послушных по какому-либо важному признаку (возможно, у них еще до начала эксперимента хуже с сердцем?), мы не можем предсказать, как повлиял бы на них препарат, если бы они следовали инструкциям.
В этой ситуации у нас получается каузальная диаграмма, как на рис. 51. Переменная назначение (Z) будет равна 1, если в результате случайного жребия пациенту выпало принимать препарат, и равна 0, если он будет получать плацебо. Переменная прием будет равна 1, если пациент принимал препарат, и равна 0, если нет. Для удобства мы также используем бинарное определение для переменной холестерин с исходом 1, если холестерин пациента снизился на определенную фиксированную величину. Обратите внимание, что в этом случае наши переменные бинарные, а не численные. Это сразу же означает, что мы не можем в этом случае использовать линейную модель, а следовательно, и применять формулу для инструментальных переменных, выведенную ранее. Тем не менее в таких случаях мы часто заменяем допущение о линейности более слабым допущением о монотонности, которое я объясню ниже.
Но прежде