Санкт-Петербургский парадокс

Оглавление:

Санкт-Петербургский парадокс
Санкт-Петербургский парадокс

Видео: Санкт-Петербургский парадокс

Видео: Санкт-Петербургский парадокс
Видео: САНКТ-ПЕТЕРБУРГСКИЙ ПАРАДОКС == Vital Math 2024, Март
Anonim

Входная навигация

  • Содержание входа
  • Библиография
  • Академические инструменты
  • Friends PDF Preview
  • Информация об авторе и цитировании
  • Вернуться к началу

Санкт-Петербургский парадокс

Впервые опубликовано вт 30 июля 2019 г.

Санкт-Петербургский парадокс был введен Николаем Бернулли в 1713 году. Он продолжает оставаться надежным источником новых загадок и идей в теории принятия решений.

Стандартная версия Санкт-Петербургского парадокса происходит от игры в Санкт-Петербурге, в которую играют следующим образом: Честная монета подбрасывается до тех пор, пока она не выпадет в голову в первый раз. В этот момент игрок выигрывает ($ 2 ^ n,), где n - это количество раз, когда была подброшена монета. Сколько нужно платить за игру? Теоретики принятия решений советуют нам применять принцип максимизации ожидаемой ценности. Согласно этому принципу, значение неопределенной перспективы представляет собой сумму, полученную путем умножения значения каждого возможного результата на его вероятность, а затем сложения всех терминов (см. Статью о нормативных теориях рационального выбора: ожидаемая полезность). В петербургской игре легко определить денежные значения результатов и их вероятности. Если монета приземляется головы на первый бросок, вы выигрываете $ 2,если он выпадет головой на втором броске, вы выиграете 4 доллара, а если это произойдет на третьем броске, вы выиграете 8 долларов и так далее. Вероятности исходов: (frac {1} {2}), (frac {1} {4}), (frac {1} {8}),…. Таким образом, ожидаемая денежная стоимость петербургской игры

(begin {align} frac {1} {2} cdot 2 + / frac {1} {4} cdot 4 + / frac {1} {8} cdot 8 + / cdots & = 1 + 1 +1+ / cdots \& = / sum_ {n = 1} ^ { infty} left (frac {1} {2} right) ^ n / cdot 2 ^ n \& = / infty. / Конец {Выравнивание})

(Некоторые скажут, что сумма приближается к бесконечности, а не к бесконечности. Мы обсудим это различие в разделе 2.)

«Парадокс» заключается в том, что наша лучшая теория рационального выбора, по-видимому, влечет за собой то, что было бы рационально платить любую конечную плату за единственную возможность сыграть в игру в Санкт-Петербурге, даже если почти наверняка игрок будет выиграть очень скромную сумму. Вероятность (frac {1} {2}) того, что игрок выиграет не более 2 долларов, и (frac {3} {4}) того, что он или она выиграет не более 4 долларов.

В строгом логическом смысле петербургский парадокс не является парадоксом, потому что формального противоречия не возникает. Однако утверждать, что рациональный агент должен платить миллионы или даже миллиарды за игру, кажется абсурдом. Таким образом, кажется, что у нас, по крайней мере, есть контрпример к принципу максимизации ожидаемой ценности. Если рациональность вынуждает нас ликвидировать все наши активы для единой возможности сыграть в петербургскую игру, то это кажется непривлекательным, чтобы быть рациональным.

  • 1. История петербургского парадокса
  • 2. Современный петербургский парадокс
  • 3. Нереалистичные предположения?
  • 4. Ограниченная функция полезности?
  • 5. Игнорировать малые вероятности?
  • 6. Теория относительной ожидаемой полезности
  • 7. Игра в Пасадене
  • Библиография
  • Академические инструменты
  • Другие интернет-ресурсы
  • Связанные Записи

1. История петербургского парадокса

Санкт-Петербургский парадокс назван в честь одного из ведущих научных журналов восемнадцатого века, Commentarii Academiae Scientiarum Imperialis Petropolitanae [Документы Императорской Академии наук в Петербурге], в котором Даниэль Бернулли (1700–1782) опубликовал статью под названием « Образцы Theoriae Novae de Mensura Sortis »[« Изложение новой теории измерения риска »] в 1738 году. Даниэль Бернулли узнал о проблеме от своего брата Николая II (1695–1726), который предложил раннюю, но излишне сложную версию о парадоксе в письме к Пьеру Ремону де Монтморту 9 сентября 1713 г. (об этом и связанных письмах см. J. Bernoulli 1975). Николай попросил де Монтморта представить пример, в котором обычные кости бросаются до тех пор, пока не выпадет 6:

[W] hat - это ожидание B… если A обещает B дать ему несколько монет в этой прогрессии 1, 2, 4, 8, 16 и т. Д. Или 1, 3, 9, 27 и т. Д., Или 1, 4, 9, 16, 25 и т. Д. Или 1, 8, 27, 64 вместо 1, 2, 3, 4, 5 и т. Д., Как заранее. Хотя по большей части эти проблемы несложные, вы найдете что-то самое любопытное. (Н. Бернулли в Монтморт, 9 сентября 1713 г.)

Кажется, что Монтморт не сразу получил точку Николая. Монтморт ответил, что эти проблемы

не имеют трудностей, единственная задача состоит в том, чтобы найти сумму ряда, числители которого находятся в прогрессии квадратов, кубов и т. д., знаменатели находятся в геометрической прогрессии. (Монтморт Н. Бернулли, 15 ноября 1713 г.)

Однако он никогда не выполнял никаких расчетов. Если бы он имел, он обнаружил бы, что ожидаемое значение первой серии (1, 2, 4, 8, 16 и т. Д.):

(sum_ {n = 1} ^ { infty} frac {5 ^ {n-1}} {6 ^ n} cdot 2 ^ {n-1}.)

Для этой серии

(lim_ {n / to / infty} left | / frac {a_ {n + 1}} {a_n} right | / gt 1,)

таким образом, применяя тест отношения, легко проверить, что ряд расходится. (Этот тест был открыт д'Аламбертом в 1768 году, поэтому, возможно, было бы несправедливо критиковать Монтморта за то, что он этого не видел.) Однако математический аргумент, представленный самим Николаем, также был немного отрывочным и не впечатлил современных математиков. Хорошей новостью является то, что его заключение было правильным:

отсюда следует, что B должен дать A бесконечную сумму и даже больше, чем бесконечность (если это разрешено говорить таким образом), чтобы он мог использовать преимущество, чтобы дать ему несколько монет в этой прогрессии 1, 2, 4 8, 16 и т. Д. (Н. Бернулли в Монтморт, 20 февраля 1714 г.)

Следующий важный вклад в дебаты был внесен Крэмером в 1728 году. Он прочитал об оригинальной проблеме Николая в книге, изданной Монтмортом, и предложил более простую и более изящную формулировку в письме к Николаю:

Чтобы упростить задачу, я предположу, что A подбрасывает в воздух денежную единицу, B обязуется дать ему монету, если сторона голов падает на первый бросок, 2, если это только второй, 4, если это 3-й бросок, 8, если это 4-й бросок и т. Д. Парадокс состоит в том, что вычисление дает для эквивалента, что A должен дать B бесконечную сумму, что кажется абсурдным. (Крамер Н. Бернулли, 21 мая 1728 г.)

В том же письме Крамер предложил решение, которое произвело революцию в возникающей области теории решений. Крамер отметил, что не рациональная денежная стоимость должна определять выбор рационального агента, а скорее «использование», которое «люди здравого смысла» могут извлечь из денег. По словам Крамера, двадцать миллионов не стоят больше десяти миллионов, потому что десяти миллионов достаточно для удовлетворения всех желаний, которые может разумно иметь агент:

математики ценят деньги пропорционально их количеству, а здравомыслящие люди - пропорционально тому, как они могут их использовать. То, что делает математическое ожидание бесконечным, - это огромная сумма, которую я могу получить, если сторона Голов упадет только очень поздно, 100-й или 1000-й бросок. Теперь эта сумма, если я рассуждаю как разумный человек, для меня не больше, не доставляет мне большего удовольствия, не привлекает меня больше, чтобы принять игру, чем если бы это было всего 10 или 20 миллионов монет. (21 мая 1728 г.)

Смысл Крамера в этом отрывке может быть обобщен. Предположим, что верхняя граница значения результата равна (2 ^ m.). Если так, то этот результат будет получен, если монета приземлится головой на m- й бросок. Это означает, что ожидаемое значение всех бесконечно многих возможных исходов, при которых монета подбрасывается более чем m раз, будет конечным: это (2 ^ m) раз вероятность того, что это произойдет, поэтому оно не может превышать (2 ^ т). К этому мы должны добавить агрегированное значение первых m возможных результатов, которое, очевидно, конечно. Поскольку сумма любых двух конечных чисел конечна, ожидаемое значение крамерской версии петербургской игры конечно.

Крамер понимал, что было бы спорным утверждать, что существует верхняя граница, за которой дополнительные богатства не имеют значения вообще. Тем не менее, он указал, что его решение работает, даже если ценность денег строго увеличивается, но относительный рост становится все меньше и меньше (21 мая 1728 года):

Если кто-то хочет предположить, что моральная ценность товара была как квадратный корень из математических величин… мое моральное ожидание будет

(frac {1} {2} cdot / sqrt {1} + / frac {1} {4} cdot / sqrt {2} + / frac {1} {8} cdot / sqrt {4} + / frac {1} {16} cdot / sqrt {8} ldots)

Это первое четкое утверждение того, что современные теоретики и экономисты, принимающие решения, называют уменьшающейся предельной полезностью: дополнительная полезность большего количества денег никогда не равна нулю, но чем вы богаче, тем меньше вы получаете от дальнейшего увеличения своего богатства. Крамер правильно рассчитал, что ожидаемая полезность («моральная ценность») игры в Санкт-Петербурге составит около 2,9 единиц для агента, чья полезность денег определяется корневой функцией.

Даниэль Бернулли предложил очень похожую идею в своей знаменитой статье 1738 года, упомянутой в начале этого раздела. Даниэль утверждал, что полезность агента для агента равна логарифму денежной суммы, что влечет за собой то, что невероятные, но крупные денежные призы будут вносить меньший вклад в ожидаемую полезность игры, чем более вероятные, но меньшие денежные суммы. Когда его статья собиралась быть опубликованной, брат Даниэля Николай упомянул ему, что Крамер предложил очень похожую идею в 1728 году (в письме, цитированном выше). В окончательном варианте текста Даниил открыто признал это:

Действительно, я обнаружил, что теория [Крамера] настолько похожа на мою, что кажется удивительным, что мы независимо достигли такого близкого согласия по этому вопросу. (Даниэль Бернулли 1738 [1954: 33])

2. Современный петербургский парадокс

Замечание Крэмера о снижении предельной полезности денег агентом решает первоначальную версию петербургского парадокса. Однако современные теоретики решений соглашаются, что это решение слишком узкое. Парадокс можно восстановить, увеличив значения результатов до того момента, когда агент полностью возместит свою уменьшающуюся предельную полезность денег (см. Menger 1934 [1979]). Таким образом, версия петербургского парадокса, обсуждаемая в современной литературе, может быть сформулирована следующим образом:

Честная монета подбрасывается, пока не поднимется головой. В этот момент игрок выигрывает выигрыш в размере (2 ^ n) единиц полезности на шкале личных полезностей игрока, где n - это число раз, когда монета была подброшена.

Обратите внимание, что ожидаемая полезность этой азартной игры бесконечна, даже если предельная полезность агента для денег уменьшается. Мы можем оставить это открытым именно то, из чего состоят призы. Это не должно быть денег.

Стоит подчеркнуть, что ни один из призов в питерской игре не имеет бесконечной ценности. Независимо от того, сколько раз монета подбрасывается, игрок всегда выигрывает определенное количество полезности. Ожидаемая полезность петербургской игры не конечна, но фактический результат всегда будет конечным. Таким образом, было бы ошибкой отвергать парадокс, утверждая, что никакие реальные призы не могут иметь бесконечной полезности. Для построения парадокса не требуется никаких реальных бесконечностей, только потенциальные. (Для обсуждения различия между фактической и потенциальной бесконечностью см. Линнебо и Шапиро 2019.) При обсуждении парадокса Санкт-Петербурга часто полезно интерпретировать термин «бесконечная полезность» как «не конечный», но оставить его философам. математики, чтобы определить, является ли она или просто приближается к бесконечности.

Некоторые авторы обсуждают именно то, что является проблематичным, утверждая, что ожидаемая полезность модифицированной петербургской игры бесконечна (читай: не конечна). Является ли это просто фактом, что справедливая цена ставки «слишком высока», или есть что-то еще, что вызывает беспокойство? Джеймс М. Джойс отмечает, что

Ставка на бесконечную полезность будет строго предпочтительнее любого из ее выигрышей, поскольку последние все конечны. Это абсурдно, учитывая, что мы ограничиваем свое внимание игроками, которые ценят ставки только в качестве средства для увеличения своего состояния. (Джойс 1999: 37)

Похоже, Джойс считает, что агент, который платит справедливую цену ставки, наверняка будет знать, что ей действительно будет хуже после уплаты комиссии. Однако, это, кажется, предполагает, что фактические бесконечности действительно существуют. Если существуют только потенциальные бесконечности, то игрок не может «заплатить» бесконечную плату за игру. Если это так, мы могли бы, возможно, истолковать Джойс как напоминание о том, что независимо от того, какую конечную сумму на самом деле выигрывает игрок, ожидаемая полезность всегда будет выше, а это означает, что было бы рационально платить еще больше. Теоретики решений анализируют понятие рациональных средств и целей, согласно которому рационально делать все, что является лучшим средством для достижения цели. Игрок, таким образом, знает, что выплата больше, чем тот, который на самом деле выигрывает, не может быть лучшим средством для достижения максимальной полезности. Это наблюдение позволяет нам усилить первоначальный «парадокс» (в котором нет формального противоречия) в более сильную версию, состоящую из трех несовместимых утверждений:

  1. Сумма полезности, которую рационально платить за игру в петербургскую игру, не конечна.
  2. Игрок знает, что фактическое количество полезности, которую он или она выиграет, конечно.
  3. Нерационально платить за игру сознательно больше, чем выиграть.

Многие обсуждения петербургского парадокса были сосредоточены на (1). Как мы увидим в следующих двух разделах, многие ученые утверждают, что ценность петербургской игры по тем или иным причинам конечна. Редкое исключение - это Hájek и Nover. Они предлагают следующий аргумент для принятия (1):

Санкт-петербургскую игру можно рассматривать как предел последовательности усеченных петербургских игр с последовательно увеличивающимися конечными точками усечения - например, игра отменяется, если десятые броски не достигли голов; к одиннадцатому броску; к двенадцатому броску; Если мы примем рассуждения о доминировании, то эти последовательные усечения могут направлять нашу оценку ценности игры в Санкт-Петербурге: она ограничена каждым из их значений, эти границы монотонно растут. Таким образом, у нас есть принципиальная причина для того, чтобы признать, что играть в петербургскую игру стоит конечной суммы. (Hájek and Nover 2006: 706)

Хотя они прямо не говорят об этом, Хайек и Новер, вероятно, отвергнут (3). Наименее спорным утверждение, возможно, (2). Конечно, вполне логично, что монета держит приземляющиеся хвосты каждый раз, когда ее подбрасывают, даже если бесконечная последовательность хвостов имеет вероятность 0. (Обсуждение этой возможности см. В Williamson 2007.) Некоторые события с вероятностью 0 действительно происходят, и в неисчислимых вероятностных пространствах невозможно, чтобы у всех результатов была вероятность больше 0. Даже в этом случае, если монета держит приземляющиеся хвосты каждый раз, когда ее подбрасывают, агент выигрывает 0 единиц полезности. Таким образом, (2) все еще остается в силе.

3. Нереалистичные предположения?

Некоторые авторы утверждают, что петербургская игра должна быть отклонена, потому что она основывается на предположениях, которые никогда не могут быть выполнены. Например, Джеффри (1983: 154) утверждает, что «любой, кто предлагает агенту сыграть в азартную игру в Санкт-Петербурге, является лжецом, поскольку он притворяется, что у него бесконечно большой банк». Подобные возражения были высказаны в восемнадцатом веке Буффоном и Фонтеном (см. Dutka 1988).

Тем не менее, не ясно, почему мнение Джеффри о реальных ограничениях было бы актуальным. Что плохого в оценке высоко идеализированной игры, у нас мало оснований полагать, что мы когда-нибудь сможем играть? Hájek and Smithson (2012) указывают, что парадокс Санкт-Петербурга заразителен в следующем смысле: если вы приписываете некоторую ненулевую вероятность гипотезе о том, что обещание банка является правдоподобным, ожидаемая полезность будет бесконечной, независимо от того, насколько низка ваша вера в гипотезе есть. Любые ненулевые вероятности, умноженные на бесконечность, равны бесконечности, поэтому любой вариант, в котором вы играете в петербургскую игру с ненулевой вероятностью, имеет бесконечную ожидаемую полезность.

Также стоит иметь в виду, что петербургская игра может быть не такой нереальной, как утверждает Джеффри. Тот факт, что у банка нет неограниченной суммы денег (или других активов), доступных для того, чтобы подбросить монету, не должен быть проблемой. Все, что имеет значение, - это то, что банк может дать надежное обещание игроку, что правильная сумма будет предоставлена в течение разумного периода времени после завершения переворота. Сколько денег у банка в хранилище, когда игрок играет в игру, не имеет значения. Это важно, потому что, как отмечено в разделе 2, сумма, которую фактически выигрывает игрок, всегда будет конечной. Таким образом, мы можем представить, что игра работает следующим образом: сначала мы подбрасываем монету, и как только мы узнаем, какую конечную сумму банк должен игроку, генеральный директор позаботится о том, чтобы банк собрал достаточно денег.

Если это не убеждает игрока, мы можем представить, что центральный банк выдает пустой чек, в котором игрок получает нужную сумму, как только подбрасывает монету. Поскольку чек выдается центральным банком, он не может отскочить. Новые деньги создаются автоматически, когда чеки, выпущенные центральным банком, вводятся в экономику. Джеффри отклоняет эту версию петербургской игры со следующим аргументом:

[Представьте себе, что] Казначейство предоставляет победителю новый чек на миллиард миллиардов долларов. Из-за результирующей инфляции предельные желательности таких высоких выплат, вероятно, будут достаточно низкими, чтобы перспективы игры были конечными [полезными]. (Джеффри 1983: 155)

Джеффри, вероятно, прав в том, что «чёткий новый миллиардный миллиардный счет» вызовет некоторую инфляцию, но, похоже, это то, что мы могли бы учитывать при разработке игры. Все, что имеет значение, это то, что коммунальные услуги в схеме выплат являются линейными.

Читатели, которые не убеждены в этом аргументе, могут захотеть представить версию петербургской игры, в которой игрок подключен к машине опыта Нозика (см. Раздел 2.3 в разделе о гедонизме). По своей конструкции эта машина может производить любые приятные впечатления, которые пожелает агент. Поэтому, как только монета была подброшена n раз, Машина опыта сгенерирует приятный опыт стоимостью (2 ^ n) единиц полезности в шкале личной полезности игрока. Ауманн (1977) отмечает, без явного упоминания Машины опыта, что:

Выплаты не обязательно должны быть выражены в терминах фиксированного конечного числа товаров или в терминах товаров вообще […] лотерейный билет […] может быть какой-то открытой деятельностью - такой, которая может привести к ощущениям, которые он до сих пор не испытал. Примерами могут быть религиозные, эстетические или эмоциональные переживания, такие как вход в монастырь, восхождение на гору или участие в исследованиях с возможно впечатляющими результатами. (Aumann 1977: 444)

Возможным примером типа опыта, который имеет в виду Ауманн, может быть количество дней, проведенных на Небесах. Не ясно, почему время, проведенное на Небесах, должно иметь предельную полезность.

Еще один тип практического беспокойства касается временного измерения петербургской игры. Брито (1975) утверждает, что подбрасывание монеты может просто занять слишком много времени. Если каждый переворот занимает n секунд, мы должны убедиться, что можно будет перевернуть его достаточно много раз, прежде чем игрок умрет. Очевидно, что если существует верхний предел того, сколько раз монета может быть подброшена, ожидаемая полезность также будет конечной.

Прямая реакция на это беспокойство - представить, что переворот произошел вчера и был записан на видео. Первый бросок произошел ровно в 23:00, второй - (frac {60} {2}) минут спустя, третий - (frac {60} {4}) минут после второго и т. Д. Видео еще не было доступно никому, но как только игрок заплатит плату за игру, оно станет общедоступным. Обратите внимание, что монета в принципе могла быть перевернута бесконечно много раз в течение одного часа. (Это пример «суперзадачи»; см. Запись о суперзадачах.)

Это правда, что этот случайный эксперимент требует, чтобы монета подбрасывалась быстрее и быстрее. В какой-то момент нам пришлось бы вращать монету быстрее скорости света. Это не является логически невозможным, хотя это предположение нарушает закон природы. Если вы считаете это проблематичным, мы можем вместо этого представить, что кто-то бросает дротик в действительную линию между 0 и 1. Вероятность того, что дротик достигнет первой половины интервала, (left [0, / frac {1} { 2} right),) is (frac {1} {2}.) И вероятность того, что дротик попадет в следующую четверть, (left (frac {1} {2}, / frac { 3} {4} right),) is (frac {1} {4}) и т. Д. Если таким образом генерируются «броски монет», то случайный эксперимент закончится совсем скоро. Чтобы избежать беспокойства о том, что ни один дротик в реальном мире не является бесконечно острым, мы можем определить точку, в которой дротик попадает в действительную линию, следующим образом: Пусть a будет областью дротика. Точка, в которой дротик попадает в интервал [0,1], определяется так, что половина области a находится справа от некоторой вертикальной линии через a, а другая половина - от левой вертикальной линии. Точка, в которой вертикальная линия пересекает интервал [0,1], является результатом случайного эксперимента.

В современной литературе о петербургском парадоксе практические заботы часто игнорируются либо потому, что можно представить сценарии, в которых они не возникают, либо потому, что высоко идеализированные проблемы решения с неограниченными утилитами и бесконечными пространствами состояний считаются интересными в их собственное право.

4. Ограниченная функция полезности?

Стрелка (1970: 92) предполагает, что функцию полезности рационального агента следует «принимать за ограниченную функцию…, поскольку такое предположение необходимо, чтобы избежать парадокса [Санкт-Петербурга]». Бассет (1987) делает аналогичную точку зрения; см. также Самуэльсон (1977) и МакКленнен (1994).

Арроу считает, что коммунальные услуги должны быть ограничены, чтобы избежать парадокса Санкт-Петербурга, и что традиционные аксиоматические объяснения принципа ожидаемой полезности гарантируют это. Например, известные аксиоматизации, предложенные Рамси (1926), фон Нейманом и Моргенштерном (1947) и Сэвиджем (1954), влекут за собой ограниченную функцию полезности лица, принимающего решения. (См. Раздел 2.3 в записи о теории решений для обзора аксиоматизации фон Неймана и Моргенштерна.)

Если функция полезности ограничена, то ожидаемая полезность петербургской игры, конечно, будет конечной. Но почему аксиомы теории ожидаемой полезности гарантируют, что функция полезности ограничена? Главное предположение заключается в том, что рационально допустимые преференции по сравнению с лотереями являются непрерывными. Чтобы объяснить значение этой аксиомы, полезно ввести некоторые символы. Пусть ({pA, (1-p) B }) - лотерея, в которой A с вероятностью p и B с вероятностью (1-p). Выражение (A / previousq B) означает, что агент считает, что B, по крайней мере, так же хорош, как A, то есть слабо предпочитает B A. Более того, (A / sim B) означает, что A и B равновероятны, а (A / prec B) означает, что B предпочтительнее A. Рассматривать:

Аксиома непрерывности: Предположим, (A / previousq B / previousq C). Тогда существует вероятность (p / in [0,1]) такая, что ({pA, (1-p) C } sim B)

Чтобы объяснить, почему эта аксиома влечет за собой то, что ни один объект не может иметь бесконечное значение, предположим для сведения, что A - это проверка приза на сумму $ 1, B - проверка на сумму $ 2, а C - это приз, которому агент назначает бесконечную полезность. Предпочтение лица, принимающего решение, это (A / prec B / prec C), но нет такой вероятности p, что ({pA, (1-p) C / sim B). Всякий раз, когда p отлично от нуля, лицо, принимающее решение, строго предпочитает ({pA, (1-p) C }) B, а если p равно 0, лицо, принимающее решение, будет строго предпочитать B. Так как ни один объект (лотерея или результат) не может иметь бесконечное значение, а функция полезности определяется утилитами, которые он назначает этим объектам (лотереи или результаты), функция полезности должна быть ограничена.

Решает ли это петербургский парадокс? Ответ зависит от того, считаем ли мы, что рациональный агент, предложивший сыграть в петербургскую игру, имеет какую-либо причину принять аксиому непрерывности. Возможное мнение состоит в том, что у любого, кому предлагается сыграть в петербургскую игру, есть причина отклонить аксиому непрерывности. Поскольку петербургская игра имеет бесконечную полезность, у агента нет оснований оценивать лотереи в порядке, предусмотренном этой аксиомой. Как объяснено в Разделе 3, мы можем представить безгранично ценные выгоды.

Некоторые могут возразить, что аксиома непрерывности, а также другие аксиомы, предложенные фон Нейманом и Моргенштерном (а также Рамси и Сэвиджем), важны для определения полезности математически точным способом. Поэтому было бы бессмысленно говорить о полезности, если мы отвергаем аксиому непрерывности. Эта аксиома является частью того, что значит сказать, что что-то полезнее, чем что-то еще. Хорошим ответом может стать разработка теории полезности, в которой предпочтения по сравнению с лотереями не используются для определения смысла концепции; см. Люс (1959) для раннего примера такой теории. Другим ответом может быть разработка теории полезности, в которой аксиома непрерывности явно отвергается; см. Скала (1975).

5. Игнорировать малые вероятности?

В 1777 году Буффон утверждал, что рациональное лицо, принимающее решения, должно игнорировать возможность выиграть много денег в петербургской игре, потому что вероятность этого очень мала. По словам Буффона, некоторые достаточно невероятные результаты «морально невозможны» и поэтому должны игнорироваться. С технической точки зрения это решение очень простое: парадокс Санкт-Петербурга возникает из-за того, что лицо, принимающее решения, желает объединить бесконечно много чрезвычайно ценных, но крайне невероятных результатов, поэтому, если мы ограничим набор «возможных» результатов, исключив в достаточной степени Невероятные, ожидаемая полезность, конечно, будет конечной.

Но почему следует игнорировать малые вероятности? И как мы проводим грань между малыми вероятностями, которые не вызывают беспокойства, и другими, которые не вызывают беспокойства? Дутка резюмирует длинный ответ Буффона следующим образом:

Чтобы получить подходящее пороговое значение, [Буффон] отмечает, что мужчина в возрасте 56 лет, считая, что его здоровье хорошее, не учитывает вероятность того, что он умрет в течение 24 часов, хотя таблицы смертности показывают, что шансы против в этот период он умирает только с 10189 до 1. Таким образом, Буффон принимает вероятность события в 1/10000 или меньше как вероятность, которую можно игнорировать. (Дутка 1988: 33)

Это убедительный аргумент? По мнению Буффона, мы должны игнорировать некоторые малые вероятности, потому что такие люди, как он (мужчины 56 лет), фактически игнорируют их. Таким образом, Буффон может быть обвинен в попытке вывести «должно» из «есть». Чтобы избежать возражений Хьюма «не должно быть из-за», Буффону пришлось бы добавить предпосылку к тому, что повседневная реакция людей на риск всегда рациональна. Но почему мы должны принять такую предпосылку?

Другое возражение заключается в том, что если мы игнорируем малые вероятности, то нам иногда придется игнорировать все возможные исходы события. Рассмотрим следующий пример: обычная колода карт состоит из 52 карт, поэтому ее можно разместить ровно в 52! различные пути. Таким образом, вероятность любого данного расположения составляет около 1 в (8 / cdot 10 ^ {67}). Это очень малая вероятность. (Если добавить в колоду шесть карт, то число возможных порядков превысит количество атомов в известной наблюдаемой вселенной.) Однако каждый раз, когда мы перетасовываем колоду карт, мы знаем, что именно одна из возможные результаты будут реализованы, так почему мы должны игнорировать все такие невероятные результаты?

Николас Дж. Дж. Смит (2014) защищает современную версию решения Буффона. Он основывает свой аргумент на следующем принципе:

Рационально пренебрежимо малые вероятности (RNP): для любой лотереи, участвующей в любой проблеме решения, с которой сталкивается любой агент, существует (epsilon> 0), так что агенту не нужно рассматривать результаты этой лотереи с вероятностью меньше (epsilon) приход к полностью рациональному решению. (Смит 2014: 472)

Смит отмечает, что порядок квантификаторов в RNP имеет решающее значение. Утверждается, что для каждой лотереи существует некоторый порог вероятности (epsilon), ниже которого все вероятности следует игнорировать, но было бы ошибкой думать, что одна и та же (epsilon) применима к каждой лотерее, Это важно, потому что в противном случае мы могли бы утверждать, что RNP позволяет объединять тысячи или миллионы отдельных событий с вероятностью меньше (epsilon.). Очевидно, было бы бессмысленно игнорировать, скажем, полмиллиона один-в-один миллион событий. Принимая во внимание, что соответствующий (epsilon) может варьироваться от случая к случаю, это беспокойство может быть отклонено.

Смит также отмечает, что если мы игнорируем вероятности, меньшие чем (epsilon,), то мы должны увеличить некоторые другие вероятности, чтобы все вероятности суммировались до одной, как того требуют аксиомы вероятности (см. Раздел 1 в записи о интерпретации вероятности). Смит предлагает принцип для систематической работы.

Однако, почему мы должны принять RNP? Каков аргумент в пользу принятия этого противоречивого принципа, помимо того, что он разрешил бы петербургский парадокс? Аргумент Смита выглядит следующим образом:

Не может требоваться бесконечная точность: скорее, в любом данном контексте должна существовать некоторая конечная терпимость - некоторый положительный порог, такой, что игнорирование всех результатов, вероятности которых лежат ниже этого порога, считается удовлетворением нормы…. Существует норма теории принятия решений, которая гласит игнорировать результаты, вероятность которых равна нулю. Поскольку в этой норме упоминается конкретное значение вероятности (ноль), именно в такой норме имеет смысл ввести допуск: ноль плюс или минус (epsilon) (который становится равным нулю плюс (epsilon,) все вероятности находятся в диапазоне от 0 до 1)… идея (RNP) заключается в том, что в любом реальном контексте, в котором должно быть принято решение, никогда не нужно быть бесконечно точным в этом смысле - что это никогда не имеет значения. Существует (для каждой проблемы решения, каждая лотерея в ней,и каждый агент) некоторый порог, так что агент не будет иррациональным, если она просто проигнорирует результаты, вероятности которых лежат ниже этого порога. (Смит 2014: 472–474)

Предположим, мы принимаем утверждение, что бесконечная точность не требуется в теории принятия решений. Это повлечет за собой, согласно аргументу Смита, что рационально допустимо игнорировать вероятности, меньшие чем (epsilon). Тем не менее, чтобы гарантировать, что лицо, принимающее решение, никогда не заплатит целое состояние за игру в Санкт-Петербурге, кажется, что Смиту придется отстаивать более сильное утверждение о том, что лица, принимающие решения, рационально должны игнорировать малые вероятности, то есть, что не допускается игнорируй их. Лица, принимающие решения, которые согласны с мнением Смита, рискуют заплатить очень большую сумму за игру в Санкт-Петербург, не делая ничего, что RNP считает иррациональным. Этот момент важен, потому что, возможно, труднее показать, что лица, принимающие решения, рационально обязаны избегать «бесконечной точности» в решениях, в которых это достижимая и полностью реалистичная цель, такая как игра в Санкт-Петербурге. Критика RNP и обсуждение некоторых смежных вопросов см. Hájek (2014).

Еще одно возражение против RNP было предложено Йоавом Айзексом (2016). Он показывает, что RNP вместе с дополнительным принципом, одобренным Смитом (Weak Consistency), влечет за собой то, что лицо, принимающее решения, иногда принимает произвольно большой риск за произвольно небольшое вознаграждение.

Лара Бучак (2013) предлагает, что, возможно, является более элегантной версией этого решения. Ее предложение состоит в том, что мы должны приписывать экспоненциально меньший вес малым вероятностям при вычислении значения опциона. Возможная весовая функция r, обсуждаемая Бучаком: (r (p) = p ^ 2.). Таким образом, ее предложение состоит в том, что если вероятность (frac {1} {8}), то вы выиграете $ 8 в В дополнение к тому, что у вас уже есть, и ваша полезность денег возрастает линейно, тогда вместо умножения вашего выигрыша в полезности на (frac {1} {8},) вы должны умножить его на ((frac {1} {8}) ^ 2 = / frac {1} {64}.) Более того, если есть вероятность (frac {1} {16}) того, что вы выиграете $ 16 в дополнение к тому, что у вас уже есть, вам следует умножьте ваш выигрыш на (frac {1} {256},) и так далее. Это означает, что малые вероятности вносят очень незначительный вклад в ожидаемую полезность, взвешенную с учетом риска.

Предложение Бучака смутно напоминает знакомую идею о том, что наша предельная полезность денег уменьшается. Как подчеркивают Крамер и Даниэль Бернулли, больше денег всегда лучше, чем меньше, но полезность, получаемая с каждого лишнего доллара, уменьшается. Согласно Бучаку, вес, который мы должны присвоить вероятности исхода, также является нелинейным: малые вероятности значат меньше, чем меньше, и их относительная значимость уменьшается в геометрической прогрессии:

Интуиция, лежащая в основе анализа предельной полезности неприятия риска, заключалась в том, что добавление денег к результату имеет меньшую ценность, чем больше денег уже содержится в результате. Интуиция, лежащая в основе нынешнего анализа неприятия риска, состоит в том, что добавление вероятности к результату имеет большую ценность, тем более вероятно, что результат уже получен. (Бучак 2014: 1099.)

Бучак отмечает, что этот шаг сам по себе не решает петербургский парадокс. По причинам, аналогичным тем, которые Менгер (1934 [1979]) упоминает в своем комментарии к решению Бернулли, парадокс может быть вновь введен путем корректировки результатов таким образом, чтобы сумма возрастала линейно (подробнее см. Buchak 2013: 73–74). Buchak есть, по этой причине, а также стремятся к РНПУ, то есть спорное предположение, что будет некоторая вероятность настолько мала, что не имеет никакого значения для общей стоимости азартной игры.

Другое беспокойство заключается в том, что, поскольку Бучак отвергает принцип максимизации ожидаемой полезности и заменяет его принципом максимизации ожидаемой полезности, взвешенной по риску, многие теоретики решения о наличии возражений, выдвинутые против нарушений принципа ожидаемой полезности, могут быть подняты против ее принципа как хорошо. Например, если вы принимаете принцип максимизации ожидаемой полезности с учетом риска, вы должны отказаться от аксиомы независимости. Это влечет за собой то, что вы можете быть использованы в каком-то умно разработанном прагматическом аргументе. См. Briggs (2015) для обсуждения некоторых возражений против теории Бучака.

6. Теория относительной ожидаемой полезности

В петроградской игре Коливана (2008) игрок выигрывает на 1 доллар больше, чем в петербургской игре, независимо от того, сколько раз подбрасывается монета. Таким образом, вместо того, чтобы выиграть 2 вспомогательных юнита, если монета приземляется головами при первом броске, игрок выигрывает 3; и так далее. Смотрите таблицу 1.

Таблица 1

Вероятность (Гидроразрыва {1} {2}) (Гидроразрыва {1} {4}) (Гидроразрыва {1} {8})
Санкт-Петербург 2 4 8
Петроградский (2 + 1) (4 + 1) (8 + 1)

Кажется очевидным, что петроградская игра стоит больше, чем петербургская. Однако не легко объяснить, почему. Обе игры имеют бесконечную ожидаемую полезность, поэтому принцип ожидаемой полезности дает неправильный ответ. Неверно, что петроградская игра стоит больше, чем петербургская, потому что ее ожидаемая полезность выше; две игры имеют одинаковую ожидаемую полезность. Это показывает, что принцип ожидаемой полезности не всегда применим ко всем рискованным вариантам, что само по себе является интересным наблюдением.

Игра в Петрограде стоит больше, чем игра в Санкт-Петербурге, потому что результаты игры в Петрограде преобладают над результатами игры в Санкт-Петербурге? В этом контексте доминирование означает, что игрок всегда будет выигрывать на 1 доллар больше, независимо от того, какое состояние мира оказывается истинным, то есть независимо от того, сколько раз подбрасывается монета. Проблема в том, что легко представить версии петроградской игры, к которой принцип доминирования не применим. Представьте, например, версию петроградской игры, которая точно такая же, как в таблице 1, за исключением того, что для какого-то очень невероятного результата (скажем, если монета впервые приземляется на 100- й день)флип) игрок выигрывает на 1 единицу меньше, чем в петербургской игре. Эта игра, петроградская, не доминирует в петербургской игре. Однако, поскольку почти наверняка игроку удастся выиграть в Петроградской игре, теория правдоподобных решений должна объяснить, почему игра в Петроградском стоит больше, чем игра в Санкт-Петербурге.

Коливан утверждает, что мы можем решить эту загадку, представив новую версию теории ожидаемой полезности под названием «Относительная теория ожидаемой полезности» (REUT). Согласно REUT мы должны рассчитать разницу в ожидаемой полезности между двумя вариантами для каждого возможного результата. Формально, относительная ожидаемая полезность ((reu)) действия (A_k) над (A_l) равна

(reu (A_k, A_l) = / sum_ {i = 1} ^ n p_i (u_ {ki} - u_ {li}).)

Согласно Коливану, рационально выбирать (A_k) над (A_l) тогда и только тогда, когда (reu (A_k, A_l) gt 0).

REUT Коливана четко объясняет, почему игра в Петрограде стоит больше, чем игра в Санкт-Петербурге, потому что относительная ожидаемая полезность равна 1. REUT также объясняет, почему игра в Петроградском стоит больше, чем игра в Санкт-Петербурге: разница в ожидаемой полезности равна (1 - (frac {1} {2}) ^ {100}), что> 0.

Однако Петерсон (2013) отмечает, что REUT не может объяснить, почему ленинградская игра стоит больше, чем ленинградская (см. Таблицу 2). Ленинградская игра - это версия петроградской игры, в которой игрок, помимо получения конечного количества единиц полезности, также получает возможность играть в игру в Санкт-Петербурге (SP), если монета выпадает во втором раунде. В ленинградской игре игрок получает возможность сыграть в петербургскую игру (SP), если монета приземляется в третьем раунде.

Таблица 2

Вероятность (Гидроразрыва {1} {2}) (Гидроразрыва {1} {4}) (Гидроразрыва {1} {8}) (Гидроразрыва {1} {16})
Ленинград 2 4 (8+ / textrm {SP}) 16
Ленинградский 2 (4+ / textrm {SP}) 8 16

Очевидно, что ленинградская игра стоит больше, чем ленинградская, потому что вероятность того, что игрок получит возможность играть в SP в качестве бонуса (который имеет бесконечную ожидаемую полезность), выше. Однако REUT не может объяснить, почему. Разница в ожидаемой полезности для состояния, которое возникает с вероятностью (frac {1} {4}) в таблице 2, составляет (- / infty), и это (+ / infty) для возникающего состояния с вероятностью (frac {1} {8}.) Следовательно, потому что (p / cdot / infty = / infty) для всех положительных вероятностей (p) и “(infty - / infty \»)”Не определено в стандартном анализе, REUT не может применяться к этим играм.

Барта (2016) предлагает более сложную версию теории Коливана, предназначенную для решения проблем, изложенных выше. Он предлагает агенту сравнить «проблемную» игру с лотереей между двумя другими играми. Если, например, «Петроград - это игра, в которой игрок всегда выигрывает на 2 единицы больше, чем в игре в Санкт-Петербурге, независимо от того, сколько раз подбрасывается монета, то игрок может сравнить игру в Петрограде с лотереей между «Петроград +». и питерская игра. Определяя, по каким вероятностям па лотерею, в которой играет Петроград +с вероятностью р и игры в Санкт - Петербурге с вероятностью (1-р) лучше, чем играть в игру питерцев наверняка можно установить меру относительной стоимости Петроград по сравнению с Петроградским + или Санкт - Петербурга. (Для получения дополнительной информации см. Раздел 5 в Bartha 2016. См. Также обсуждение Колойваном и Гайеком 2016 года теории Барты.)

Давайте также упомянем еще один, довольно простой вариант исходной игры в Санкт-Петербурге, в которую играют следующим образом (см. Петерсон 2015: 87): управляемая монета приземляется с вероятностью 0,4, и игрок выигрывает призовой фонд (2 ^ n) единицы полезности, где n - это количество раз, которое подбрасывали монету. Эта игра, московская игра, с большей вероятностью принесет длинную последовательность бросков и поэтому стоит больше, чем игра в Санкт-Петербурге, но ожидаемая полезность обеих игр одинакова, поскольку обе игры имеют бесконечную ожидаемую полезность. Может быть заманчиво сказать, что московская игра более привлекательна, потому что московская игра стохастически доминирует над игрой в Санкт-Петербурге. (То, что одна игра стохастически доминирует над другой игрой, означает, что для каждого возможного результата,первая игра имеет, по меньшей мере, такую же высокую вероятность получения выигрыша, по меньшей мере, как u единиц полезности, как вторая игра; и для некоторых u первая игра дает u с большей вероятностью, чем вторая.) Однако принцип стохастического доминирования неприменим к играм, в которых существует небольшой риск того, что игрок выиграет приз, стоимость которого немного меньше, чем в другой игре., Мы можем, например, представить, что если монета приземляется на 100й переворачивать игра Москва платит одну единицу меньше, чем игра в Санкт - Петербурге; в этом сценарии ни одна из игр не доминирует над другой. Несмотря на это, все же кажется разумным настаивать на том, что игра, которая почти наверняка принесет лучший результат (в смысле, объясненном выше), стоит больше. Задача состоит в том, чтобы объяснить почему надежным и не произвольным образом.

7. Игра в Пасадене

Парадокс Пасадены, введенный Nover и Hájek (2004), вдохновлен игрой в Санкт-Петербурге, но график выплат отличается. Как обычно, честная монета подбрасывается n раз, пока в первый раз не поднимется. Если n нечетно, игрок выигрывает ((2 ^ n) / n) единиц полезности; однако, если n четное, игрок должен заплатить ((2 ^ n) / n) единиц. Сколько нужно платить за игру?

Если мы суммируем термины во временном порядке, в котором происходят результаты, и вычислим ожидаемую полезность обычным способом, мы обнаружим, что игра в Пасадене стоит:

(begin {align} frac {1} {2} cdot / frac {2} {1} - / frac {1} {4} cdot / frac {4} {2} + / frac {1} {8} cdot / frac {8} {3} & - / frac {1} {16} cdot / frac {16} {4} + / frac {1} {32} cdot / frac {16} { 5} - / cdots \& = 1 - / frac {1} {2} + / frac {1} {3} - / frac {1} {4} + / frac {1} {5} - / cdots & = / sum_n / frac {(- 1) ^ {n-1}} {n} end {align})

Эта бесконечная сумма сходится к ln 2 (около 0,69 единиц полезности). Однако Новер и Хайек отмечают, что мы получили бы совершенно другой результат, если бы мы изменили порядок, в котором суммируются одни и те же числа. Вот один из многих возможных примеров этого математического факта:

(begin {align} 1 - / frac {1} {2} - / frac {1} {4} + / frac {1} {3} - / frac {1} {6} - / frac {1} {8} + / frac {1} {5} - / frac {1} {10} & - / frac {1} {12} + / frac {1} {7} - / frac {1} {14} - / frac {1} {16} cdots \& = / frac {1} {2} (ln 2). / Конец {Выравнивание})

Это, конечно, не новость для математиков. Бесконечная сумма, производимая игрой в Пасадене, известна как ряд переменных гармоник, который является условно сходящимся рядом. (Ряд (a_n) условно сходится, если (sum_ {j = 1} ^ { infty} a_n) сходится, но (sum_ {j = 1} ^ { infty} lvert a_n / rvert.) или в (- / infty).

Идея Новера и Хайека состоит в том, что кажется произвольным суммировать термины в игре Пасадена во временном порядке, производимом подбрасыванием монеты. Чтобы понять почему, полезно представить слегка измененную версию игры. В своей оригинальной статье Nover и Hájek просят нас представить, что:

Мы бросаем честную монету, пока она не приземлится в первый раз. Мы записали на последовательных карточках вашу выплату за каждый возможный исход. Карты читаются следующим образом: (Верхняя карта) Если первая = головы на броске # 1, мы платим вам 2 доллара. […] Случайно мы сбрасываем карточки, и, взяв их и складывая на столе, мы обнаруживаем, что они были переставлены. Неважно, вы говорите - очевидно, игра не изменилась, поскольку график выплат остается прежним. В конце концов, игра правильно и полностью определяется условными обозначениями на карточках, и мы просто изменили порядок, в котором представлены условия. (Nover and Hájek 2004: 237–239)

В описанных здесь обстоятельствах у нас, похоже, нет оснований отдавать предпочтение какому-либо определенному порядку, в котором можно суммировать члены бесконечного ряда. То же самое относится к ожидаемой игре Пасадена (ln 2) или (frac {1} {2} (ln 2)) или (frac {1} {3}) или (- / инфты) или 345,68? Все эти предложения кажутся одинаково произвольными. Более того, то же самое относится и к игре «Альтадена», в которой каждый выигрыш увеличивается на один доллар. Игра Altadena явно лучше, чем игра Pasadena, но сторонники теории ожидаемой полезности, похоже, не могут объяснить, почему.

Литература по игре Пасадена обширна. См., Например, Hájek and Nover (2006), Fine (2008), Smith (2014) и Bartha (2016). Особенно влиятельное решение связано с Ишвараном (2008). Он вводит различие между сильной и слабой версией принципа ожидаемой полезности, вдохновленное хорошо известным различием между сильной и слабой версиями закона больших чисел. Согласно строгому закону больших чисел средняя полезность игры сходится к ожидаемой полезности с вероятностью один, поскольку число итераций уходит в бесконечность. Слабый закон больших чисел гласит, что для достаточно большого набора испытаний вероятность может быть сделана сколь угодно малой, чтобы средняя полезность не отличалась от ожидаемой полезности более чем на какое-то небольшое заранее определенное количество. Таким образом, согласно принципу слабой ожидаемой полезности,

заранее фиксируя достаточно большое количество n игр, можно практически гарантировать, что средняя выплата за игру будет произвольно близка к ln 2,

в то время как сильная версия принципа предполагает, что

если один игрок продолжит решать, играть снова или выйти, то он почти наверняка может гарантировать столько прибыли, сколько он хочет, независимо от (постоянной) цены за игру. (Ишваран 2008: 635)

По мнению Ишварана, принцип слабой ожидаемой полезности должен определять выбор агента и что справедливая цена за него равна 2.

Тем не менее, решение Ишварана не может быть распространено на другие игры с немного другими схемами выплат. Барта (2016: 805) описывает версию игры Пасадена, которая не имеет ожидаемой ценности. В этой игре Arroyo игрок выигрывает (- 1 ^ {n + 1} (n + 1)) с вероятностью (p_n = / frac {1} / {(n + 1)}). Если мы вычислим ожидаемую полезность в том порядке, в котором получены результаты, мы получим тот же результат, что и для игры в Пасадене: (1 - / frac {1} {2} + / frac {1} {3} - / frac {1} {4} cdots) По причинам, объясненным (и доказанным) Бартой, игра Арройо не имеет слабой ожидаемой полезности.

Стоит также помнить, что подобные Пасадене сценарии могут возникать в не вероятностных контекстах (см. Peterson 2013). Представьте, например, бесконечную совокупность, в которой полезность отдельного числа j равна (frac {(- 1) ^ {j-1}} {j}). Какова общая полезность этого населения? Или представьте, что вы счастливый обладатель картины Джексона Поллока. Арт-дилер говорит вам, что общая эстетическая ценность картины - это сумма некоторых ее частей. Вы нумеруете точки на картине произвольными номерами 1, 2, 3,… (возможно, записывая числа на карточках, а затем бросая все карточки на пол); эстетическое значение каждой точки j равно (frac {(- 1) ^ {j-1}} {j}). Какова общая эстетическая ценность картины? Эти примеры являются не вероятностными версиями проблемы Пасадены,к которому принцип ожидаемой полезности неприменим. Нет никакой неопределенности ни о каком состоянии природы; лицо, принимающее решения, точно знает, на что похож мир. Это означает, что различие Ишварана между слабыми и сильными ожиданиями неприменимо.

Хотя некоторые из этих проблем могут показаться несколько эзотерическими, мы не можем их игнорировать. Все подобные Пасадене проблемы подвержены той же проблеме заражения, что и игра в Санкт-Петербурге (см. Раздел 2). Хаек и Смитсон предлагают следующую красочную иллюстрацию:

Вы можете выбрать между пиццей и китайским на ужин. Желательность каждого варианта зависит от того, как вы взвешиваете вероятностно различные сценарии (сожженная пицца, идеально приготовленная пицца,… китайский с пересыпью, китайский с превосходным вкусом…) и используемые вами коммунальные услуги. Позвольте нам оговорить, что ни один из вариантов не доминирует над другим, однако выбор должен быть совершенно простым для вас. Но это не так, если ожидания пиццы и китайцев оскверняются даже незначительным [sic] доверием к игре в Пасадене. Если дверь открыта для него просто трещина, она пинает дверь и затопляет все ожидаемые коммунальные расчеты. Вы даже не можете выбирать между пиццей и китайским. (Hájek and Smithson 2012: 42, emph. Добавлен.)

Коливан (2006) предлагает, чтобы мы укусили пулю в игре Пасадена и признали, что она не имеет ожидаемой полезности. Проблема заражения показывает, что если бы мы это сделали, нам пришлось бы признать, что принцип максимизации ожидаемой полезности применим практически к любым решениям. Более того, поскольку проблема заражения одинаково применима ко всем играм, обсуждаемым в этой статье (Санкт-Петербург, Пасадена, Арройо и т. Д.), Кажется, что все эти проблемы могут потребовать единого решения.

В течение сотен лет теоретики решений соглашались, что рациональные агенты должны максимизировать ожидаемую полезность. Обсуждение в основном было сосредоточено на том, как интерпретировать этот принцип, особенно для вариантов, в которых причинная структура мира необычна. Однако до недавнего времени никто серьезно не сомневался в том, что принцип максимизации ожидаемой полезности является правильным принципом для применения. Богатая и растущая литература по многим головоломкам, вдохновленным петербургским парадоксом, указывают на то, что это могло быть ошибкой. Возможно, принцип максимизации ожидаемой полезности следует заменить каким-то совершенно другим принципом?

Библиография

  • Александр, JM, 2011, «Ожидания и возможность выбора», Mind, 120 (479): 803–817. DOI: 10,1093 / ум / fzr049
  • Эрроу, Кеннет Дж., 1970, «Очерки теории несения риска», Амстердам: Северная Голландия.
  • Ауманн, Роберт Дж., 1977, «Санкт-Петербургский парадокс: обсуждение некоторых недавних комментариев», Журнал экономической теории, 14 (2): 443–445. DOI: 10,1016 / 0022-0531 (77) 90143-0
  • Барта, Пол Ф. А., 2016, «Обойтись без ожиданий», Mind, 125 (499): 799–827. DOI: 10,1093 / ум / fzv152
  • Бассетт, Гилберт В., 1987, «Петербургский парадокс и ограниченная полезность», История политической экономии, 19 (4): 517–523. DOI: 10,1215 / 00182702-19-4-517
  • Бернулли, Даниэль, 1738 г. [1954 г.], «Образцы теорий новых сорта», Commentarii Academiae Scientiarum Imperialis Petropolitanae, 5: 175–192. Перевод на английский язык, 1954 год, «Изложение новой теории измерения риска», Econometrica, 22 (1): 23–36. DOI: 10,2307 / 1909829
  • Бернулли, Якоб, 1975, Die Werke von Jakob Бернулли, группа III, Базель: Биркхойзер. Перевод этого письма Ричарда Дж. Пулскэма из писем Николаса Бернулли, касающихся игры «Санкт-Петербург», доступен онлайн.
  • Бриггс, Рэйчел, 2015, «Затраты на отказ от принципа верности», Канадский философский журнал, 45 (5–6): 827–840. DOI: 10,1080 / 00455091.2015.1122387
  • Брито Д. Л., 1975, «Теория Беккера о распределении времени и Санкт-Петербургский парадокс», Журнал экономической теории, 10 (1): 123–126. DOI: 10,1016 / 0022-0531 (75) 90067-8
  • Бучак, Лара, 2013, риск и рациональность, Нью-Йорк: издательство Оксфордского университета. DOI: 10,1093 / acprof: осо / 9780199672165.001.0001
  • –––, 2014, «Риск и компромиссы», Erkenntnis, 79 (S6): 1091–1117. DOI: 10.1007 / s10670-013-9542-4
  • Буффон, GLL, 1777, «Essai d'Arithmdéétique Motale», в дополнениях к Histoire Naturelle. Перепечатано в Oeuvres Philosophiques de Buffon, Париж, 1954.
  • Чалмерс, Дэвид Дж., 2002, «Санкт-Петербургский парадокс с двумя оболочками», Анализ, 62 (2): 155–157. DOI: 10,1093 / Analys / 62.2.155
  • Чен, Эдди Кеминг и Даниэль Рубио, готовящиеся к изданию «Сюрреалистические решения», Философские и феноменологические исследования, впервые онлайн: 5 июня 2018 года. Doi: 10.1111 / phpr.12510
  • Коливан, Марк, 2006, «Нет ожиданий», Mind, 115 (459): 695–702. DOI: 10,1093 / ум / fzl695
  • –––, 2008, «Теория относительных ожиданий»: «Философский журнал», 105 (1): 37–44. DOI: 10.5840 / jphil200810519
  • Colyvan, Mark and Alan Hájek, 2016, «Делать самоубийства без ожиданий»: Mind, 125 (499): 829–857. DOI: 10,1093 / ум / fzv160
  • Коуэн, Тайлер и Джек Хай, 1988, «Время, ограниченная полезность и Санкт-Петербургский парадокс», Теория и решение, 25 (3): 219–223. DOI: 10.1007 / BF00133163
  • Дутка, Жак, 1988, «О Санкт-Петербургском парадоксе», Архив истории точных наук, 39 (1): 13–39. DOI: 10.1007 / BF00329984
  • Ишваран, Кенни, 2008, «Сильные и слабые ожидания», Mind, 117 (467): 633–641. DOI: 10,1093 / ум / fzn053
  • Fine, Terrence L., 2008, «Оценка азартных игр в Пасадене, Альтадене и Санкт-Петербурге», Mind, 117 (467): 613–632. DOI: 10,1093 / ум / fzn037
  • Хаек, Алан, 2014, «Неожиданные ожидания», Mind, 123 (490): 533–567. DOI: 10,1093 / ум / fzu076
  • Hájek, Alan и Harris Nover, 2006, «Озадаченные ожидания», Mind, 115 (459): 703–720. DOI: 10,1093 / ум / fzl703
  • –––, 2008, «Сложные ожидания», Mind, 117 (467): 643–664. DOI: 10,1093 / ум / fzn086
  • Hájek, Alan и Michael Smithson, 2012, «Рациональность и неопределенные вероятности», Synthese, 187 (1): 33–48. DOI: 10.1007 / s11229-011-0033-3
  • Айзекс, Йоав, 2016, «Вероятности, которыми нельзя рационально пренебрегать», Mind, 125 (499): 759–762. DOI: 10,1093 / ум / fzv151
  • Джеффри, Ричард С., 1983, «Логика решения», 2-е издание, Чикаго: Университет Чикагской Прессы.
  • Джордан, Джефф, 1994, «Петербургский парадокс и пари Паскаля», Философия, 23 (1–4): 207–222. DOI: 10.1007 / BF02379856
  • Джойс, Джеймс М., 1999, Основы теории причинных решений, Кембридж: издательство Кембриджского университета.
  • Лауэрс, Люк и Питер Валлентин, 2016, «Теория принятия решений без ожидаемой конечной стандартной стоимости», «Экономика и философия», 32 (3): 383–407. DOI: 10,1017 / S0266267115000334
  • Линнебо, Ойстейн и Стюарт Шапиро, 2019, «Фактическая и потенциальная бесконечность: фактическая и потенциальная бесконечность», Noûs, 53 (1): 160–191. DOI: 10.1111 / nous.12208
  • Люс, Р. Дункан, 1959, «О возможных психофизических законах», Психологический обзор, 66 (2): 81–95. DOI: 10,1037 / h0043178
  • МакКленнен, Эдвард Ф., 1994, «Ставка Паскаля и теория конечных решений», в «Азартные игры над Богом: очерки о пари Паскаля», Джефф Джордан (ред.), Бостон: Роуман и Литтлфилд, 115–138.
  • Menger, Karl, 1934 [1979], «Das Unsicherheitsmoment in der Wertlehre: Betrachtungen im Anschluß an das sogenannte Petersburger Spiel», Zeitschrift für Nationalökonomie, 5 (4): 459–485. В 1979 г. переведено как «Роль неопределенности в экономике» в «Избранных статьях Менгера по логике и основам», «Дидактика, экономика», «Dordrecht: Springer Netherlands», 259–278. doi: 10.1007 / BF01311578 (de) doi: 10.1007 / 978-94-009-9347-1_25 (en)
  • Nover, Harris and Alan Hájek, 2004, «Vexing Expectations», Mind, 113 (450): 237–249. DOI: 10,1093 / ум / 113.450.237
  • Петерсон, Мартин, 2011, «Новый поворот в петербургском парадоксе»: «Философский журнал», 108 (12): 697–699. DOI: 10.5840 / jphil20111081239
  • –––, 2013, «Обобщение головоломки Пасадены: обобщение головоломки Пасадены», Диалектика, 67 (4): 597–603. DOI: 10.1111 / 1746-8361.12046
  • –––, 2009 [2017], Введение в теорию принятия решений, Кембридж: издательство Кембриджского университета; второе издание 2017 г. doi: 10.1017 / CBO9780511800917 doi: 10.1017 / 9781316585061
  • –––, 2019, «Интервальные ценности и рациональный выбор», Экономика и философия, 35 (1): 159–166. DOI: 10,1017 / S0266267118000147
  • Ramsey, Frank Plumpton, 1926 [1931], «Правда и вероятность», напечатано в «Основах математики и других логических очерках», RB Braithwaite (ed.), London: Kegan Paul, Trench, Trubner & Co., 156–198. Перепечатано в «Философии вероятности: современные чтения», Энтони Игл (ред.), Нью-Йорк: Routledge, 2011: 52–94. [Ramsey 1926 [1931] доступен онлайн]
  • Самуэльсон, Пол А., 1977, «Св. Петербургские парадоксы: пороченые, рассеченные и исторически описанные », журнал экономической литературы, 15 (1): 24–55.
  • Сэвидж, Леонард Дж., 1954, Основы статистики, (Wiley Publications in Statistics), Нью-Йорк: Wiley. Второе издание, Courier Corporation, 1974.
  • Skala, Heinz J., 1975, Неархимедова теория полезности, Dordrecht: D. Reidel.
  • Smith, Nicholas JJ, 2014, «Является ли оценочная композиционность требованием рациональности?», Mind, 123 (490): 457–502. DOI: 10,1093 / ум / fzu072
  • фон Нейман, Джон и Оскар Моргенштерн, 1947, Теория игр и экономического поведения, второе пересмотренное издание, Принстон, Нью-Джерси: издательство Принстонского университета.
  • Вейрих, Павел, 1984, «Петербургская азартная игра и риск», Теория и решение, 17 (2): 193–202. DOI: 10.1007 / BF00160983
  • Уильямсон, Тимоти, 2007, «Насколько вероятна бесконечная последовательность голов?», Анализ, 67 (295): 173–180. DOI: 10.1111 / j.1467-8284.2007.00671.x

Академические инструменты

значок сеп человек
значок сеп человек
Как процитировать эту запись.
значок сеп человек
значок сеп человек
Предварительный просмотр PDF-версию этой записи в обществе друзей SEP.
значок Inpho
значок Inpho
Посмотрите эту тему в Проекте интернет-философии онтологии (InPhO).
Фил документы
Фил документы
Расширенная библиография для этой записи в PhilPapers со ссылками на ее базу данных.

Другие интернет-ресурсы

[Пожалуйста, свяжитесь с автором с предложениями.]

Рекомендуем: