Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл

Читать онлайн Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 25 26 27 28 29 30 31 32 33 ... 116

Перейти на страницу:

вопросе нет подводных камней, и я надеюсь, что ответ почти очевиден.

Поскольку половина двух третей — одна третья, выходит, что одна третья клиентов заказывает чай и пирожные. Чтобы проиллюстрировать это числами, предположим, что мы занесли в таблицу заказы следующих 12 посетителей, которые войдут в дверь.

Как показывает табл. 1, (1, 5, 6, 7, 8, 9, 10, 12) заказали чай и половина из них заказала пирожные (1, 5, 8, 12). Таким образом, доля клиентов, которые заказали и чай, и пирожные действительно равна ½ ∙ =, ровно как мы и предсказывали до того, как увидели конкретные данные.

Таблица 1. Вымышленные данные для примера с чаем и пирожными

Отправная точка для байесовского правила — заметить, что данные можно было проанализировать в обратном порядке, т. е. мы могли бы заметить, что клиентов (1, 2, 5, 8, 12) заказали пирожные, а из них (1, 5, 8, 12) заказали чай. Таким образом, доля клиентов, которые заказали и чай, и пирожные, будет вычисляться так: ∙ =. Конечно, не случайно у нас получился один и тот же результат; мы просто вычислили одно и то же разными способами. Порядок, в котором клиенты объявляют свои заказы, не играет никакой роли.

Чтобы сделать из этого общее правило, пусть P (T) обозначает вероятность того, что посетитель закажет чай, а P (S) — вероятность того, что он закажет пирожные (помните, что вертикальная линия обозначает «при том что»). Подобным образом, P (T | S) обозначает вероятность заказа посетителем чая при том, что мы уже знаем о заказе им пирожных.

Сначала мы вычисляем следующее:

P (S and T) = P (S | T) P (T).

Второй расчет выглядит так:

P (S and T) = P (T | S) P (S).

Как говорил Евклид 2 300 лет назад, две величины, каждая из которых равна третьей, также равны между собой. Это означает, что справедливо и следующее:

P (S | T) P (T) = P (T | S) P (S)

Это безобидное с виду уравнение стало известно как «правило Байеса». Если посмотреть на него внимательнее, то обнаружится, что оно предлагает общее решение для проблемы обратной вероятности. Оно говорит: если мы знаем вероятность S при T, P (S | T), то мы сможем вычислить вероятность T при S, P (T | S) — конечно, при условии, что P (T) и P (S) нам известны. Это, пожалуй, самая важная функция правила Байеса в статистике: мы можем напрямую оценить условную вероятность в одном направлении, где наше суждение надежнее, и применить математику, чтобы получить условную вероятность в другом направлении, для которого наше суждение довольно туманно. Уравнение тоже играет эту роль в байесовских сетях; мы сообщаем компьютеру прямые вероятности, а компьютер выдает обратные вероятности, когда это необходимо.

Чтобы увидеть, как правило Байеса действует в примере с чайной, предположим, что вы не потрудились вычислить P (T | S) и оставили таблицу с данными дома. Однако вы почему-то помните, что половина из заказавших чай также заказала пирожные. Тут ваш босс задает неожиданный вопрос: «Какая доля заказавших пирожные также заказала и чай?» Нет повода для паники — вы можете вычислить это на основании иных вероятностей. Правило Байеса говорит, что P (T | S) () = (½) (), поэтому ваш ответ — P (T | S) =, потому что — единственное значение для P (T | S), которое сделает уравнение верным.

Также мы можем посмотреть на правило Байеса как на способ по-новому оценить нашу веру в определенную гипотезу. Это чрезвычайно важно понимать, потому что человеческие представления о событиях в будущем во многом опираются на частоту похожих событий в прошлом. Например, когда клиентка заходит в кафе, мы, ориентируясь на поведение похожих клиенток в прошлом, думаем, что, вероятно, она закажет чай. Но, если она сначала попросит пирожное, наша уверенность даже возрастет. Более того, возможно, мы предложим: «И чаю к пирожным?» Правило Байеса просто позволяет нам подкрепить эти рассуждения цифрами. Из табл. 1 видно, что предыдущая вероятность заказа чая (когда клиентка только вошла и еще ничего не заказала) равна. Но если клиентка заказывает пирожные, у нас появляется дополнительная информация о ней, которой не было раньше. В этом случае вероятность заказа чая (когда уже заказаны пирожные) выглядит так: P (T | S) =.

С математической точки зрения в этом и состоит правило Байеса. Оно кажется почти банальным. Здесь нет ничего, кроме понятия условной вероятности и небольшой дозы древнегреческой логики. Вы можете задать оправданный вопрос: как такая небольшая «фишка» сделала Байеса известным и почему люди спорили о ней 250 лет. В конце концов, математические факты должны разрешать противоречия, а не создавать их.

Здесь я должен признаться, что в примере с чайной, выводя правило Байеса из полученных данных, я опустил два весьма существенных возражения — одно философское и одно практическое. Философское возражение происходит из интерпретации вероятностей как степени веры, которую мы подспудно использовали в случае с чайной. Кто вообще сказал, что убеждения действуют или должны действовать как пропорциональные отношения данных?

Загвоздка в этом философском споре состоит в том, можно ли полноценно перевести выражение «при том, что я знаю» на язык вероятностей. Даже если мы согласимся, что безусловные вероятности вроде P (S), P (T) и P (S and T) отражают мою степень убежденности в этих предложениях, кто может сказать, что если оценить степень моей веры в T, она будет равна отношению P (S and T) /P (T), как утверждает правило Байеса? Будет ли «при том, что известно T» одним и тем же во всех случаях, где встретилось T? Язык вероятностей, выраженный в таких символах как P (S), создавался, чтобы выразить понятие частоты в азартных играх. Но выражение «при том, что известно» — эпистемологическое и должно управляться логикой знания, а не логикой частоты и пропорций.

С философской точки зрения достижение Томаса Байеса состоит в том, что он предложил формальное определение условной вероятности как P (S | T) = P (S and T) /P (T). По общему признанию, его эссе имеет довольно размытые формулировки; у него нет термина для условной вероятности, и вместо него он использует громоздкий оборот «вероятность второго [события] в условиях предположения, что первое произойдет». Только в 1880-х годах было признано, что отношение «при условии, что» заслуживает собственный символ, и только в