Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл
Шрифт:
Интервал:
Закладка:
Ранее мы видели, что введение поправок по медиатору неправомерно, если мы хотим оценить общее воздействие одной переменной на другую. Но в случае дискриминации, согласно решению суда, имеет значение не общее, а прямое воздействие. Таким образом, решение Бикеля и Хаммеля оправдано: при допущениях, показанных на рис. 56 они совершенно верно разделили данные по отдельным факультетам, и их результаты представляют собой обоснованную оценку прямого воздействия пола на зачисление. Им удалось успешно справиться с задачей, несмотря на то что терминология прямых и непрямых воздействий не была доступна Бикелю в 1973 году.
Рис. 56. Каузальная диаграмма для парадокса с зачислением в Калифорнийский университет в Беркли (простая версия)
Однако самое интересное в этой истории — не исходная статья, написанная Бикелем и Хаммелем, а дискуссия, которая последовала за ней. После публикации статьи Уильям Крускал из Университета Чикаго написал Бикелю письмо, утверждая, что их объяснение на самом деле не снимает обвинений с Беркли. На самом деле Крускал задался вопросом, насколько вообще любое исследование, основанное исключительно на наблюдениях (в противоположность РКИ) на это способно.
Для меня их переписка — просто невероятное явление. Не так часто нам удается увидеть, как два великих ума сражаются с концепцией (в данном случае с причинностью), для описания которой у них нет адекватного словаря. Позднее Бикель продолжит тему и выиграет «грант гения» от Фонда Макартуров в 1984 году. Но в 1975 году он был еще только в начале своей карьеры, и для него было одновременно честью и вызовом схлестнуться с Крускалом, настоящим великаном в американском статистическом сообществе.
В своем письме к Бикелю Крускал указал на то, что в отношениях между факультетом и результатом зачисления может быть неизмеримый осложнитель, такой как место проживания. Он предоставил численный пример, представляющий гипотетический университет с двумя факультетами, дискриминирующими по полу, в которых данные в результате полностью совпадают с данными в примере Бикеля. Он добился этого, предположив, что оба факультета принимают всех мужчин, живущих в том же штате, и всех женщин из других штатов, и отвергают всех мужчин из других штатов и женщин из того же штата, и это у них единственный критерий для принятия решения о зачислении. Разумеется, такая политика зачисления студентов будет грубым, азбучным примером дискриминации. Но поскольку общие числа принятых и отвергнутых абитуриентов каждого пола были точно такими же, как в примере Бикеля, то по логике последнего пришлось бы признать, что дискриминации нет. Согласно Крускалу, факультеты только кажутся невиновными, потому что Бикель вводил поправки лишь по одной переменной вместо двух.
Крускал указал пальцем на самое слабое место в статье Бикеля: отсутствие четко оправданного критерия, по каким переменным вводить поправки. Крускал не предложил никакого решения, и на самом деле в его письме чувствуется отчаяние от неверия, что оно в принципе реально.
В отличие от Крускала, мы можем нарисовать диаграмму и ясно увидеть, в чем заключается проблема. На рис. 57 представлена диаграмма, соответствующая контрпримеру Крускала. Не кажется ли она вам чем-то знакомой? Так и должно быть! Это совершенно та же диаграмма, что и нарисованная в 1926 году Барбарой Бёркс, только переменные в ней другие.
Тут просится на язык американская пословица «Великие умы мыслят схоже», но, возможно, вернее было бы сказать, что великие проблемы привлекают внимание великих умов.
Крускал утверждал, что при анализе в этой ситуации нужно вводить поправки как по переменной факультет, так и по штату проживания, и взгляд на рис. 57 объясняет, почему это так. Чтобы заблокировать все пути, кроме прямого, мы должны стратифицировать данные по факультетам. Таким образом мы закроем непрямые пути пол → факультет → результаты зачисления. Но, сделав это, мы открываем побочный путь пол → факультет ← штат проживания → результаты зачисления из-за переменной схождения факультет. Если мы также введем поправки по переменной штат проживания, то закроем этот путь, и поэтому все оставшиеся корреляции должны быть обусловлены прямым (дискриминационным) путем пол → результаты зачисления. За отсутствием диаграмм Крускалу пришлось убеждать Бикеля числами, и на самом деле его числа показали то же самое. Если мы вообще не вводим никаких поправок, то процент зачисляемых женщин ниже. Если мы вводим поправки по факультету, то у женщин процент зачисления кажется выше. Если мы вводим поправки и по факультету, и по штату проживания, числа снова покажут более низкий процент зачисления для женщин.
Рис. 57. Каузальная диаграмцма для парадокса зачислений в Калифорнийский университет в Беркли (версия Крускала)
Подобные аргументы показывают нам, почему концепция опосредования вызывала ранее (и до сих пор вызывает) такие подозрения. Она выглядит нестабильной и неуловимой. Результаты зачисления оказываются настроены против женщин, потом против мужчин, потом снова против женщин. В своем ответе Крускалу Бикель продолжал настаивать, что поправка по месту, где принимаются решения (факультет) чем-то отличается от поправки по критерию этого решения (штат проживания). Однако 100 %-ной уверенности, судя по всему, у него по этому поводу не было. Он спрашивает несколько беспомощно: «Здесь я вижу нестатистический вопрос: что такое перекос?» Почему знак перекоса меняется в зависимости от того, как мы его измеряем? На самом деле его идея принципиального различия между перекосом и дискриминацией была верна. Перекос, искажение — это скользкое статистическое понятие, которое может исчезнуть, если нарезать данные не вдоль, а поперек. Дискриминация, как причинностная концепция, отражает реальность, и поэтому должна оставаться неизменной вне зависимости от способа обработки данных.
Фраза, которой не хватало в словаре у них обоих, — «оставаться постоянной». Чтобы заблокировать непрямой путь от пола к результатам зачисления, мы должны зафиксировать значение переменной факультет и «покрутить» переменную пол. Когда переменная факультет принимает фиксированное значение, мы (фигурально выражаясь) не даем абитуриентам выбирать, на какой факультет