Умная толпа - Говард Рейнгольд
Шрифт:
Интервал:
Закладка:
Теория игр основывается на ряде допущений: противоборстве игроков, обязательности участия, зависимости победы от итогов предпринимаемых в соответствии с правилами поведения и непременной «рациональности» действий всех игроков при выборе стратегии, обеспечивающей им максимальный выигрыш вне зависимости от последствий для остальных. Такие правила, естественно, не отражают в должной мере самой жизни и все же привлекают экономистов тем, что позволяют описывать поведение наблюдаемых явлений, таких как рынок, гонка вооружений, картели* и транспорт.
* Картель — объединение людей, компаний или государств в целях ограничения конкуренции и регулирования цен, объемов производства и продаж в какой-либо отрасли в целях поддержания цен на приемлемом уровне; картели могут быть национальными и международными; иногда картели называют трастами; самый крупный в мире картель — ОПЕК, объединяющий страны-экспортеры нефти.
После Второй мировой войны фон Нейман присоединился к математикам и экономистам, занятым мозговым штурмом теории игр в обычном здании недалеко от побережья в Санта-Монике. Корпорация RAND была первым «мозговым трестом», где прошедшие проверку на благонадежность интеллектуалы размышляли о немыслимом, как высказался сотрудник RAND Герман Кан о занятом разработкой стратегии термоядерной войны коллективе ученых [29]. Поскольку гонка вооружений была тесно связана с блефом и контрблефом теории игр, новое поприще стало привлекательным для первых разработчиков стратегии ядерной войны. В 1950 году ученые RAND создали четыре основополагающие игры в понимании Моргенштерна и фон Неймана: «Игру с трусом» (Chicken game), «Охоту на оленя» (Stag hunt), «Тупик» (Deadlock) и «Дилемму заключенного» (Prisoner's dilemma). Они часто подаются в виде рассказов, однако в действительности допускают точное математическое описание.
Игра с трусом широко представлена в фильмах о несовершеннолетних преступниках: двое добиваются помилования, и тот, кто первым отступает, проигрывает. Тупик представляет собой бесконечный обман: все игроки отказываются сотрудничать. Последние две игры более занимательны. Охоту на оленя впервые описал Жан-Жак Руссо в 1755 году: «Если охотились на оленя, то каждый хорошо понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то не приходилось сомневаться, что этот охотник без зазрения совести пустится за ним вдогонку и, настигнув свою добычу, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей» [30]. Охота на оленя — классический пример задачи обеспечения общественного блага при искушении человека поддаться своекорыстию. Должен ли охотник остаться с товарищами и сделать ставку на менее благоприятный случай доставить крупную добычу всему племени либо покинуть товарищей и вверить себя более надежному случаю, сулящему его собственной семье зайца?
Четвертая игра, выношенная в стенах RAND, привела к междисциплинарному понятию фокальной точки Шеллинга. Саму игру в январе 1950 года придумали ученые корпорации RAND Мерилл Микс Флуд и Мелвин Дрешер [31], а в мае того же года она обрела свое имя после ознакомительной лекции по теории игр, прочитанной на отделении психологии Станфордского университета одним консультантом из RAND. Такер (а это был он) так описывал игру: «Двое мужчин, обвиненных в совместном нарушении закона, содержатся в полицейском участке раздельно. Каждому сказано, что: 1) если один признается, а другой нет, то первый получит награду, а второй будет оштрафован; 2) если признаются оба, штраф грозит обоим. Вместе с тем, каждый вполне может рассчитывать на то, что: 3) если никто из них не признается, они оба выйдут сухими из воды» [32].
Со временем народная молва изменила данное Такером изображение дилеммы заключенного. Угроза тюремного заключения выглядит куда убедительней сулимой награды. Вспомним, что заключенные содержатся раздельно и не могут общаться, так что каждому остается лишь гадать, как поступит другой. Заключенный, донесший на своего напарника, освобождается, а тот, соответственно, получает три года. Если же оба решат свидетельствовать друг против друга, то получают по два года тюрьмы. Если же ни один из них не станет доносить, оба получают по году тюрьмы. Так как это теория игр, то каждого игрока волнует лишь собственное благополучие. I Рассуждая рационально, каждый придет к выводу, что донос уменьшит на год срок его заключения независимо от поведения другого. Отказ от доносительства не даст игроку свалять дурака — смолчать, когда другой предаст. Но ведь если они оба откажутся давать показания, то отделаются лишь годом тюрь— I мы. Вот в чем задача: каждый, действуя в собственных интересах, добивается нежелательного для себя результата.
Математическое представление игры сведено в таблицу, где строки и столбцы отображают стратегию каждого из игроков. Пары чисел в ячейках указывают на платежи. В соответствии с 1 исходными посылами исследователей RAND платежи таковы, что награда за обоюдное сотрудничество с полицией (в общем случае означающее кооперацию, солидарность, учет общих интересов, разрешение конфликта, альтруистическое поведение) превышает штраф за обоюдное молчание (в общем случае здесь подразумевается отказ от сотрудничества, усиление конфронтации, обман, нарушение принятых норм, правил, обязательств, эгоистическое поведение); оба же этих платежа превышают платеж дурака за его сотрудничество при молчании другого игрока, но меньше платежа-соблазна за молчание одного при сотрудничестве (с полицией) другого игрока. Все четыре общественные игры-дилеммы корпорации RAND оказываются разновидностью одной исходной модели: обратив платеж дурака и платеж-соблазн, из «Дилеммы заключенного» получаем «Игру с трусом», а поменяв местами платеж-награду и платеж-соблазн, имеем уже дело с «Охотой на оленя».
В сотрудничает В отказывается от сотрудничества
А сотрудничает 2,2 0,3
А отказывается от сотрудничества 3,0 1,1
В 1979 году политолог Роберт Аксельрод «интересовался кооперацией, что явилось поворотным шагом в истории теории умных толп:
«Все началось с простого вопроса: когда при оценивании надо сотрудничать, а когда проявлять своекорыстие? Надо ли продолжать оказывать любезность приятелю, не отвечающему тем же? Надо ли одному предпринимателю срочно помочь другому, находящемуся на грани разорения? Насколько жестко надо США начать Советский Союз за враждебное действие, и какой образ поведения могут избрать США, чтобы добиться сотрудничества со стороны Советского Союза? Есть простое средство изображения обстоятельств, способных породить подобные вопросы, и связано оно с привлечением повторяющейся игры „дилемма заключенного“. Дания игра позволяет игрокам выгадывать от обоюдного сотрудничества, но также дает возможность одному игроку использовать другого или же обоим отказаться от сотрудничества» [33].
Игра «Дилемма заключенного» дает любопытные закономерности при ее многократном повторении. Хотя игроки не могут сообщать о своих намерениях при совершении текущего хода, история предыдущих решений позволяет оценивать намерения другого игрока. Согласно Аксельроду «как раз возможность повторной встречи и создает предпосылки к сотрудничеству». Иначе говоря, сделанный сегодня Выбор не только определяет исход данного хода, но и может посиять и на последующие решения игроков. Будущее способы бросить тень на настоящее и тем самым воздействовать на текшее положение дел». «Репутация» — еще одно средство разглядеть ту самую «тень будущего».
Аксельрод предложил «Соревнование на ЭМ по дилемме заключенного» среди вычислительных программ. (В турнире участвовали 63 программы. Каждая пара программ проводила Друг с другом серии по 200 игр. Точное число игр авторам программ не сообщалось. Присланные программы одержали как простые стратегии, так и весьма изощренные, использующие методы прогнозирования и искусственный интеллект. Победителем объявлялась программа, набравшая в турнире больше всего очков.) Каждая программа на каждом своем шаге выбирает сотрудничество или отказ от него, тем самым зарабатывая очки согласно платежной матрице данной игры. Каждая программа могла учитывать предысторию хода противника. Входные данные Аксельрод брал у представителей теории игр из экономики, психологии, социологии, политологии и математики. Он использовал четырнадцать таких наборов входных данных, прогоняя их неоднократно на ЭВМ случайным образом. «К моему удивлению, — пишет Аксельрод, — победителем оказалась самая простая программа — „Услуга за услугу“ {Tit for tat), присланная Анатолем Рапопортом*. Стратегия «Услуги за услугу» строилась незатейливо: начинать надо с сотрудничества, а затем повторять действия противной стороны на предыдущем шаге». Если противник на первом ходу сотрудничает, следующим ходом «Услуга за услугу» тоже сотрудничает; если же противник первым ходом отказывается сотрудничать, отказом на следующем ходу отвечает и «Услуга за услугу». Когда же противник от отказа переходит к сотрудничеству, то же самое следующим ходом делает «Услуга за услугу», как бы прощая его.