Оглавление:
- Нормативные теории рационального выбора: ожидаемая полезность
- 1. Определение ожидаемой полезности
- 2. Аргументы в пользу теории ожидаемой полезности
- 3. Препятствия в теории ожидаемой полезности
- 4. Приложения
- Библиография
- Академические инструменты
- Другие интернет-ресурсы

Видео: Нормативные теории рационального выбора: ожидаемая полезность

2023 Автор: Noah Black | [email protected]. Последнее изменение: 2023-06-03 13:34
Входная навигация
- Содержание входа
- Библиография
- Академические инструменты
- Friends PDF Preview
- Информация об авторе и цитировании
- Вернуться к началу
Нормативные теории рационального выбора: ожидаемая полезность
Впервые опубликовано пт 8 августа 2014 г.; существенная редакция чт 15 августа 2019 г.
Мы часто должны принимать решения в условиях неопределенности. Получение степени в области биологии может привести к прибыльной занятости или к безработице и разрушению долга. Назначение врача может привести к раннему выявлению и лечению заболевания, или это может быть пустой тратой денег. Теория ожидаемой полезности - это объяснение того, как рационально выбирать, когда вы не уверены, какой результат будет результатом ваших действий. Его основной лозунг: выбрать акт с максимальной ожидаемой полезностью.
В этой статье обсуждается теория ожидаемой полезности как нормативная теория, то есть теория о том, как люди должны принимать решения. В классической экономике теория ожидаемой полезности часто используется как описательная теория, то есть теория о том, как люди принимают решения, или как теория прогнозирования, то есть теория, которая, хотя и может не точно моделировать психологические механизмы принятие решений, правильно предсказывает выбор людей. Теория ожидаемой полезности делает ошибочные прогнозы о решениях людей во многих реальных ситуациях выбора (см. Kahneman & Tversky 1982); однако это не определяет, должны ли люди принимать решения на основе ожидаемых соображений полезности.
Ожидаемая полезность действия - это средневзвешенная полезность каждого из его возможных результатов, где полезность результата измеряет степень, в которой этот результат является предпочтительным или предпочтительным по сравнению с альтернативами. Полезность каждого результата взвешивается в соответствии с вероятностью того, что действие приведет к этому результату. Раздел 1 раскрывает это базовое определение ожидаемой полезности в более строгих терминах и обсуждает его связь с выбором. В разделе 2 обсуждаются два типа аргументов для теории ожидаемой полезности: теоремы о представлении и долгосрочные статистические аргументы. В разделе 3 рассматриваются возражения против теории ожидаемой полезности; В разделе 4 обсуждаются его применения в философии религии, экономики, этики и эпистемологии.
-
1. Определение ожидаемой полезности
- 1.1 Условные вероятности
- 1.2 Результат Утилиты
-
2. Аргументы в пользу теории ожидаемой полезности
- 2.1 Долгосрочные аргументы
- 2.2. Теоремы о представлении
-
3. Возражения против теории ожидаемой полезности
- 3.1 Максимизация ожидаемой полезности невозможна
- 3.2 Максимизация ожидаемой полезности иррациональна
-
4. Приложения
- 4.1 Экономика и государственная политика
- 4.2 Этика
- 4.3 Эпистемология
- 4.4 Закон
- Библиография
- Академические инструменты
- Другие интернет-ресурсы
- Связанные Записи
1. Определение ожидаемой полезности
Концепция ожидаемой полезности лучше всего иллюстрируется на примере. Предположим, я планирую долгую прогулку, и мне нужно решить, взять ли с собой зонтик. Я бы предпочел не носить зонтик в солнечный день, но я бы предпочел встретить дождь с зонтом, а не без него. Мне доступны два действия: взять мой зонт и оставить его дома. Какой из этих актов я должен выбрать?
Это неформальное описание проблемы можно переформулировать, немного более формально, с точки зрения трех видов сущностей. Во-первых, есть результаты - объекты неинструментальных предпочтений. В этом примере мы могли бы выделить три результата: либо я остаюсь сухим и не обремененным; Я в итоге высохла и обременена громоздким зонтиком; или я в конечном итоге мокрый. Во-вторых, существуют состояния - вещи вне контроля лица, принимающего решение, которые влияют на результат решения. В этом примере есть два состояния: либо идет дождь, либо нет. Наконец, есть акты - объекты инструментальных предпочтений лица, принимающего решения, и, в некотором смысле, вещи, которые она может сделать. В примере есть два действия: я могу принести зонтик; или оставь это дома. Теория ожидаемой полезности дает возможность ранжировать действия в зависимости от их выбора:чем выше ожидаемая полезность, тем лучше выбрать акт. (Поэтому лучше выбрать действие с наибольшей ожидаемой полезностью - или одно из них, если несколько действий связаны.)
Следуя общему соглашению, я сделаю следующие предположения о взаимосвязи между действиями, состояниями и результатами.
- Состояния, действия и результаты - это предложения, то есть наборы возможностей. Существует максимальный набор возможностей, (Omega), из которых каждое состояние, действие или результат является подмножеством.
- Набор действий, набор состояний и набор результатов являются разделами на (Omega). Другими словами, действия и состояния индивидуализированы, так что каждая возможность в (Omega) - это та, где получает ровно одно состояние, агент выполняет ровно одно действие, и наступает ровно один результат.
- Акты и состояния являются логически независимыми, поэтому ни одно государство не исключает возможности выполнения какого-либо действия.
- Я предположу на данный момент, что, учитывая состояние мира, каждое действие имеет ровно один возможный результат. (Раздел 1.1 кратко обсуждает, как можно ослабить это предположение.)
Таким образом, пример зонтика может быть изображен в следующей матрице, где каждый столбец соответствует состоянию мира; каждый ряд соответствует акту; и каждая запись соответствует результату, который возникает, когда действие совершается в состоянии мира.
состояния | |||
идет дождь | не идет дождь | ||
акты | возьми зонтик | обремененный, сухой | обремененный, сухой |
оставить зонтик | влажный | бесплатно, сухой |
Настроив базовую структуру, я теперь могу строго определить ожидаемую полезность. Ожидаемая полезность действия (A) (например, взятие моего зонтика) зависит от двух особенностей проблемы:
- Значение каждого результата, измеряемое действительным числом, называется утилитой.
- Вероятность каждого исхода условна на (А).
Учитывая эти три фрагмента информации, ожидаемая полезность (A) определяется как:
[EU (A) = \ sum_ {o \ in O} P_ {A} (o) U (o))
где (O) - множество результатов, (P_ {A} (o)) - вероятность исхода (o), условная на (A), и (U (o)) является утилитой (o).
В следующих двух подразделах будут распакованы функция условной вероятности (P_A) и функция полезности (U).
1.1 Условные вероятности
Термин (P_ {A} (o)) представляет вероятность (o) данного (A) - примерно, насколько вероятно, что результат (o) произойдет, если предположить, что Агент выбирает акт (А). (Для аксиом вероятности, см. Запись о интерпретациях вероятности.) Чтобы понять, что это значит, мы должны ответить на два вопроса. Во-первых, какая интерпретация вероятности уместна? И, во-вторых, что значит назначать вероятность в предположении, что агент выбирает акт (А)?
Предполагаемые теоретики полезности часто интерпретируют вероятность как измерение индивидуальной степени убежденности, так что суждение (E) вероятно (для агента) в той степени, в которой этот агент уверен в (E) (см., Например, Рамси 1926, Savage 1972, Jeffrey 1983). Но ничто в формализме теории ожидаемой полезности не навязывает нам эту интерпретацию. Вместо этого мы могли бы интерпретировать вероятности как объективные шансы (как у фон Неймана и Моргенштерна 1944 г.) или как степени веры, которые подтверждаются доказательствами, если бы мы думали, что это лучшее руководство к рациональным действиям. (См. Запись о интерпретациях вероятности для обсуждения этих и других вариантов.)
Какова вероятность того, что агент выберет (A)? Здесь есть два основных типа ответа, соответствующих теории доказательных решений и теории причинных решений.
Согласно доказательной теории принятия решений, одобренной Джеффри (1983), соответствующая предположительная вероятность (P_ {A} (o)) является условной вероятностью (P (o \ mid A)), определяемой как отношение двух безусловные вероятности: (P (A \ amp o) / P (A)).
Против определения ожидаемой полезности Джеффри, Спон (1977) и Леви (1991) возражают, что лицо, принимающее решение, не должно назначать вероятности самим обдумываемым действиям: когда вы свободно решаете, следует ли совершать действие (А), вы не должны ' не принимать во внимание ваши убеждения о том, будете ли вы выполнять (A). Если Спон и Леви правы, то соотношение Джеффри не определено (поскольку его знаменатель не определен).
Нозик (1969) выдвигает еще одно возражение: определение Джеффри дает странные результаты в проблеме Ньюкомба. Предсказатель вручает вам закрытую коробку, содержащую либо 0, либо 1 миллион долларов, и предлагает вам открытую коробку, содержащую дополнительно 1000 долларов. Вы можете либо отказаться от открытого ящика («один ящик»), либо взять открытый ящик («два ящика»). Но здесь есть одна загвоздка: предсказатель предсказал ваш выбор заранее, и все ее прогнозы точны на 90%. Другими словами, вероятность того, что вы один ящик, учитывая, что она предсказывает вам один ящик, составляет 90%, а вероятность того, что вы два ящика, учитывая, что она предсказывает вам два ящика, составляет 90%. Наконец, содержимое закрытого бокса зависит от прогноза: если предиктор думал, что вы выберете два бокса, она ничего не кладет в закрытый бокс, в то время как, если она думает, что вы используете один ящик, она вложит 1 миллион долларов в закрытый бокс. Матрица для вашего решения выглядит так:
состояния | |||
1 миллион долларов в закрытой коробке | 0 долларов в закрытом ящике | ||
акты | один ящик | $ 1 млн | $ 0 |
два ящика | $ 1001000 | $ 1000 |
Два бокса доминируют над одним боксом: в каждом штате два бокса дают лучший результат. Тем не менее, согласно определению Джеффри об условной вероятности, у одного бокса ожидаемая полезность выше, чем у двух. Существует высокая условная вероятность найти 1 миллион долларов в закрытом ящике, учитывая, что у вас один ящик, поэтому у одного бокса высокая ожидаемая полезность. Аналогично, существует высокая условная вероятность того, что вы ничего не найдете в закрытом боксе, учитывая, что у вас два бокса, поэтому для двух боксов ожидаемая полезность низкая.
Теория причинных решений является альтернативным предложением, которое решает эти проблемы. Это не требует (но все еще разрешает) действия, чтобы иметь вероятности, и это рекомендует два бокса в проблеме Ньюкомба.
Причинно-следственная теория принятия решений существует во многих вариантах, но я рассмотрю репрезентативную версию, предложенную Сэвиджем (1972), в которой вычисляется (P_ {A} (o)) путем суммирования вероятностей состояний, которые в сочетании с актом (A), привести к результату (o). Пусть (f_ {A, s} (o)) - это a результатов, который отображает (o) в 1, если (o) является результатом выполнения (A) в состоянии s, отображает (o) до 0 в противном случае. затем
[P_ {A} (o) = \ sum_ {s \ in S} P (s) f_ {A, s} (o))
По предложению Savage, два бокса имеют более высокую ожидаемую полезность, чем один бокс. Этот результат сохраняется независимо от того, какие вероятности вы назначаете штатам до вашего решения. Пусть (x) - это вероятность, которую вы присваиваете состоянию, что закрытое поле содержит 1 миллион долларов. По словам Сэвиджа, ожидаемые утилиты для одного и двух боксов, соответственно:
[x { cdot} U ({$ 1,000,000}) + (1 - x) { cdot} U ($ 0))
и
[x { cdot} U ({$ 1 001 000}) + (1 - x) { cdot} U ({$ 1000}))
Пока большие денежные суммы назначаются строго большим коммунальным услугам, вторая сумма (полезность двух боксов) гарантированно будет больше первой (полезность однобоксовых).
Сэвидж предполагает, что каждого действия и состояния достаточно, чтобы однозначно определить результат. Но есть случаи, когда это предположение нарушается. Предположим, вы предлагаете продать мне следующую игру: вы бросите монету; если монета попадает в головы, я выигрываю 100 долларов; и если монета упадет в хвост, я потеряю 100 долларов. Но я отказываюсь от азартных игр, и монету никогда не бросают. Не было бы никакого результата, если бы подброшенная монета могла бы выиграть 100 долларов, а я мог потерять 100 долларов.
Мы можем обобщить предложение Сэвиджа, позволив (f_ {A, s}) быть функцией вероятности, которая отображает результаты в реальные числа в интервале ([0, 1]). Льюис (1981), Скайрмс (1980) и Собел (1994) приравнивают (f_ {A, s}) к объективной вероятности того, что (o) будет результатом, если получено состояние (s) и Агент выбрал действие (А).
В некоторых случаях - наиболее известная проблема Ньюкомба - определение Джеффри и определение ожидаемой полезности Сэвиджа расходятся. Но когда выполняются следующие два условия, они соглашаются.
- Акты вероятностно независимы от государств. В формальных терминах для всех актов (A) и состояний (s) [P (s) = P (s \ mid A) = \ frac {P (s \ amp A)} {P (A)}.) (Это условие нарушается в задаче Ньюкомба.)
- Для всех результатов (o), актов (A) и состояний (s), (f_ {A, s} (o)) равна условной вероятности заданной (o) (A) и (s); в формальных терминах, [f_ {A, s} (o) = P (o \ mid A \ amp s) = \ frac {P (o \ amp A \ amp s)} {P (A \ amp s)}.) (Необходимость в этом условии возникает, когда действия и состояния не могут однозначно определить результат; см. Льюис 1981.)
1.2 Результат Утилиты
Термин (U (o)) представляет полезность результата (o) - примерно, насколько ценно (o). Формально, (U) - это функция, которая присваивает вещественное число каждому из результатов. (Единицы, связанные с (U), обычно называются утилитами, поэтому, если (U (o) = 2), мы говорим, что (o) стоит 2 метки.) Чем больше полезность, тем больше ценный результат.
Какую ценность измеряют в утилитах? Утилиты обычно не считаются денежными единицами, такими как доллары, фунты или иены. Бернулли (1738) утверждал, что у денег и других товаров предельная полезность уменьшается: поскольку агент становится богаче, каждый последующий доллар (или золотые часы, или яблоко) для нее менее ценен, чем последний. Он приводит следующий пример: для богача имеет смысл рационально, но не для нищего, платить 9 000 дукатов в обмен на лотерейный билет, который дает 50% шанс на 20 000 дукатов и 50% шанс на ничто. Поскольку лотерея дает обоим мужчинам одинаковый шанс на каждый денежный приз, призы должны иметь разные значения в зависимости от того, беден ли игрок или богат.
Классические утилитаристы, такие как Бентам (1789), Милль (1861) и Сиджвик (1907), интерпретировали полезность как меру удовольствия или счастья. Для этих авторов сказать, что (A) имеет большую полезность, чем (B) (для агента или группы агентов), значит сказать, что (A) приносит больше удовольствия или счастья, чем (B).) (для этого агента или группы агентов).
Одно из возражений против такого толкования полезности заключается в том, что не может быть ни одного блага (или вообще какого-либо блага), которого рациональность требует от нас искать. Но если мы понимаем «полезность» достаточно широко, чтобы включить все потенциально желаемые цели - удовольствие, знания, дружбу, здоровье и т. Д. - не ясно, что существует единственно правильный способ сделать компромисс между различными товарами, чтобы каждый результат получил утилита. Не может быть хорошего ответа на вопрос о том, содержит ли жизнь аскетического монаха более или менее хорошее, чем жизнь счастливого распутника, но назначение утилит этим опциям заставляет нас сравнивать их.
Современные теоретики принятия решений обычно интерпретируют полезность как меру предпочтения, поэтому сказать, что (A) имеет большую полезность, чем (B) (для агента), значит просто сказать, что агент предпочитает (A) (В). Для этого подхода крайне важно, чтобы предпочтения сохранялись не только между результатами (такими как количество удовольствия или комбинации удовольствия и знания), но и между неопределенными перспективами (такими как лотерея, которая платит 1 миллион долларов, если конкретная монета приземляется, и приводит к часу болезненных ударов током, если монета приземляется хвостами). Раздел 2 этой статьи подробно рассматривает формальную связь между предпочтением и выбором.
Теория ожидаемой полезности не требует, чтобы предпочтения были корыстными или корыстными. Кто-то может предпочесть отдавать деньги на благотворительность, а не тратить деньги на щедрые обеды или жертвовать своей жизнью ради того, чтобы позволить своему ребенку умереть. Сен (1977) предполагает, что психология каждого человека лучше всего представлена с использованием трех ранжирований: одно представляет узкий личный интерес человека, второе представляет личный интерес человека, истолкованный в более широком смысле для объяснения чувства симпатии (например, страдания при наблюдении за другим человеком) страдать), а третья представляет обязательства человека, которые могут потребовать от нее действовать в широком понимании своих личных интересов.
Брум (1991) интерпретирует утилиты как измерение объективных улучшений и ухудшений, а не личных предпочтений: сказать, что (A) имеет большую полезность, чем (B), значит сказать, что (A) объективно лучше чем (B), или что рациональный человек предпочел бы (A) (B). Так же, как в формализме теории вероятностей нет ничего, что требует от нас использования субъективных, а не объективных вероятностей, так и в формализме теории ожидаемой полезности нет ничего, что требовало бы от нас использовать субъективные, а не объективные значения.
Те, кто интерпретирует полезности с точки зрения личных предпочтений, сталкиваются с особой проблемой: так называемая проблема межличностных сравнений полезности. Принимая решение о том, как распределять общие ресурсы, мы часто хотим знать, сделают ли наши действия Алису лучше, чем Боб, и если да, то насколько лучше. Но если полезность является мерой индивидуального предпочтения, нет никакого ясного, значимого способа сделать эти сравнения. Утилиты Алисы составлены из предпочтений Алисы, утилиты Боба составлены из предпочтений Боба, и нет никаких предпочтений, охватывающих Алису и Боба. Мы не можем предположить, что полезность Алисы 10 эквивалентна полезности Боба 10, так же как мы не можем предположить, что получение оценки A в дифференциальных уравнениях эквивалентно получению оценки A в плетении корзин.
Сейчас самое время подумать, какие функции функции полезности несут значимую информацию. Сравнения информативны: если (U (o_1) gt U (o_2)) (для человека), то (o_1) лучше (или предпочтительнее) (o_2). Но не только сравнения являются информативными - функция полезности должна нести другую информацию, если ожидаемая теория полезности должна давать значимые результаты.
Чтобы понять почему, рассмотрим зонтичный пример еще раз. На этот раз я заполнил вероятность для каждого состояния и полезность для каждого результата.
состояния | |||
идет дождь ((P = 0,6)) | дождя нет ((P = 0.4)) | ||
акты | возьми зонтик | обремененный, сухой ((U = 5)) | обремененный, сухой ((U = 5)) |
оставить зонтик | мокрый ((U = 0)) | свободный, сухой ((U = 10)) |
Ожидаемая полезность взятия зонтика
(begin {align} EU (take) & = P _ { take} (encumbered, \ dry) cdot 5 \& \ quad + P _ { take} (wet) cdot 0 \& \ quad + P _ { take} (free, dry) cdot 10 \& = 5 \ end {align})
в то время как ожидаемая полезность оставления зонтика
(begin {align} EU (уйти) & = P _ { уйти} (обременены, \ dry) cdot 5 \& \ quad + P _ { уйти} (wet) cdot 0 \& \ quad + P _ { left} (free, dry) cdot 10 \& = 4 \ end {align})
Поскольку (EU (take) gt EU (уйти)), теория ожидаемой полезности говорит мне, что лучше взять зонт, чем оставить его.
Но теперь предположим, что мы меняем утилиты результатов: вместо использования (U) мы используем (U ').
состояния | |||
идет дождь ((P = 0,6)) | дождя нет ((P = 0.4)) | ||
акты | возьми зонтик | обремененный, сухой ((U '= 4)) | обремененный, сухой ((U '= 4)) |
оставить зонтик | мокрый ((U '= 2)) | свободный, сухой ((U '= 8)) |
Новая ожидаемая полезность взятия зонтика
(begin {align} EU '(take) & = P _ { take} (обременен, \ dry) cdot 4 \& \ quad + P _ { take} (wet) cdot 2 \& \ quad + P _ { take} (free, dry) cdot 8 \& = 4 \ end {align})
в то время как новая ожидаемая полезность оставить зонтик
(begin {align} EU '(уйти) & = P _ { уйти} (обременен, \ dry) cdot 4 \& \ quad + P _ { уйти} (wet) cdot 2 \& \ quad + P _ { left} (free, dry) cdot 8 \& = 4.4 \ end {align})
Поскольку (EU '(take) lt EU' (уйти)), теория ожидаемой полезности говорит мне, что оставлять зонтик лучше, чем брать его.
Функции полезности (U) и (U ') ранжируют результаты абсолютно одинаково: свободно, сухо - лучше всего; обремененные, сухие ряды в середине; и мокрый это хуже всего. Тем не менее, теория ожидаемой полезности дает разные советы в двух версиях проблемы. Таким образом, должна существовать некоторая существенная разница между предпочтениями, соответствующим образом описываемыми (U), и предпочтениями, соответствующим образом описываемыми (U '). В противном случае теория ожидаемой полезности непостоянна и может изменить свой совет, если подать различные описания одной и той же проблемы.
Когда две служебные функции представляют собой одно и то же базовое положение вещей? Теория измерения отвечает на этот вопрос, характеризуя допустимые преобразования функции полезности - способы ее изменения, которые оставляют все ее значимые признаки без изменений. Если мы характеризуем допустимые преобразования функции полезности, мы тем самым указали, какие из ее функций имеют смысл.
Защитники теории ожидаемой полезности обычно требуют, чтобы полезность измерялась линейной шкалой, где допустимые преобразования - это все и только положительные линейные преобразования, т. Е. Функции (f) вида
[f (U (o)) = x { cdot} U (o) + y)
для действительных чисел (x \ gt 0) и (y).
Положительные линейные преобразования конечных полезностей никогда не повлияют на вердикты теории ожидаемой полезности: если (A) имеет большую ожидаемую полезность, чем (B), где полезность измеряется функцией (U), то (A) также будет иметь большую ожидаемую полезность, чем (B), где полезность измеряется любым положительным линейным преобразованием (U).
2. Аргументы в пользу теории ожидаемой полезности
Почему выбирают действия, которые максимизируют ожидаемую полезность? Один из возможных ответов заключается в том, что теория ожидаемой полезности - это рациональная основа, то есть рациональность означает, что цель и конец, по существу, подразумевают максимизацию ожидаемой полезности. Однако для тех, кто находит этот ответ неудовлетворительным, есть еще два источника оправдания. Во-первых, существуют долгосрочные аргументы, которые основаны на доказательстве того, что максимизация ожидаемой полезности является выгодной политикой в долгосрочной перспективе. Во-вторых, существуют аргументы, основанные на теоремах представления, которые предполагают, что определенные рациональные ограничения на предпочтения влекут за собой то, что все рациональные агенты максимизируют ожидаемую полезность.
2.1 Долгосрочные аргументы
Одна из причин максимизации ожидаемой полезности заключается в том, что она обеспечивает хорошую политику в долгосрочной перспективе. Феллер (1968) приводит версию этого аргумента. Он опирается на два математических факта о вероятностях: сильные и слабые законы больших чисел. Оба эти факта касаются последовательностей независимых, одинаково распределенных испытаний - такой установки, которая возникает в результате неоднократных одних и тех же ставок на последовательность игр в рулетку или игры в кости. Как слабые, так и строгие законы больших чисел говорят, примерно, что в долгосрочной перспективе средняя полезность, полученная за одно испытание, в подавляющем большинстве случаев будет близка к ожидаемой ценности отдельного испытания.
Слабый закон больших чисел гласит, что там, где каждое испытание имеет ожидаемое значение (mu), для любых сколь угодно малых действительных чисел (epsilon \ gt 0) и (delta \ gt 0), существует некоторое конечное число испытаний (n), такое, что для всех (m), больших или равных (n), с вероятностью не менее (1- \ delta), средний выигрыш игрока за первые (m) испытания попадут в рамки (epsilon) (mu). Другими словами, в долгосрочной перспективе подобной азартной игры средняя прибыль за испытание, скорее всего, станет произвольно близкой к ожидаемому значению азартной игры в течение ограниченного периода времени. Таким образом, в конечном итоге среднее значение, связанное с азартной игрой, в подавляющем большинстве случаев будет близко к ожидаемому значению.
Строгий закон больших чисел гласит, что там, где каждое испытание имеет ожидаемое значение (mu), для любого сколь угодно малого действительного числа (epsilon \ gt 0) при увеличении числа испытаний вероятность того, что Средний выигрыш игрока за пробу в пределах (epsilon) от (mu) сходится к 1. Другими словами, когда число повторений азартной игры приближается к бесконечности, средний выигрыш за пробу станет сколь угодно близко к Ожидаемое значение азартной игры с вероятностью 1. Таким образом, в долгосрочной перспективе среднее значение, связанное с азартной игрой, практически наверняка равно ее ожидаемому значению.
Есть несколько возражений против этих долгосрочных аргументов. Во-первых, многие решения не могут повторяться в течение неограниченного числа аналогичных испытаний. Например, решения о том, какую карьеру делать, на ком жениться и где жить, принимаются в лучшем случае небольшое число раз. Кроме того, когда эти решения принимаются более одного раза, разные испытания включают разные возможные результаты с разными вероятностями. Не ясно, почему долгосрочные соображения относительно повторных азартных игр должны иметь отношение к этим вариантам с одним случаем.
Во-вторых, аргумент опирается на два предположения о независимости, одно или оба из которых могут оказаться неверными. Одно предположение гласит, что вероятности различных испытаний являются независимыми. Это верно в отношении азартных игр в казино, но не верно в отношении других вариантов, в которых мы хотим использовать теорию принятия решений, например, вариантов медицинского лечения. Мой остающийся больной после одного курса антибиотиков повышает вероятность того, что я останусь больным после следующего курса, так как это увеличивает вероятность того, что устойчивые к антибиотикам бактерии распространятся по моему телу. Аргумент также требует, чтобы утилиты различных испытаний были независимыми, поэтому выигрыш приза за одно испытание вносит одинаковый вклад в общую полезность лица, принимающего решение, независимо от того, что она выигрывает в других испытаниях. Но это предположение нарушается во многих реальных случаях. Из-за уменьшающейся предельной полезности денег выигрыш в 10 миллионов долларов в десяти играх в рулетку не стоит в десять раз больше, чем выигрыш в 1 миллион долларов в одной игре в рулетку.
Третья проблема заключается в том, что сильные и слабые законы больших чисел модально слабы. Ни один из этих законов не предусматривает, что если бы игра повторялась бесконечно (при соответствующих допущениях), средний выигрыш от полезности за испытание был бы близок к ожидаемой полезности игры. Они устанавливают только то, что средний выигрыш за одну пробу с высокой вероятностью будет близок к ожидаемой полезности игры. Но высокая вероятность - даже вероятность 1 - не уверенность. (Стандартная теория вероятностей отвергает Принцип Курно, в котором говорится, что события с низкой или нулевой вероятностью не произойдут. Но см. Шафер (2005) для защиты принципа Курно.) Для любой последовательности независимых, одинаково распределенных испытаний, это возможно для среднего Платеж за коммунальные услуги в расчете на одно судебное разбирательство произвольно расходится с ожидаемой полезностью отдельного судебного разбирательства.
2.2. Теоремы о представлении
Второй тип аргумента для теории ожидаемой полезности опирается на так называемые теоремы о представлении. Мы следуем формулировке Zynda (2000) этого аргумента, слегка модифицированной, чтобы отразить роль утилит, а также вероятности. Аргумент имеет три предпосылки:
Условие рациональности.
Аксиомы теории ожидаемой полезности являются аксиомами рационального предпочтения.
Представимость.
Если предпочтения человека подчиняются аксиомам теории ожидаемой полезности, то его можно представить как обладающего степенью убежденности, подчиняющейся законам исчисления вероятности [и такой функции полезности, что она предпочитает действия с более высокой ожидаемой полезностью].
Состояние реальности.
Если человек может быть представлен как имеющий степени веры, которые подчиняются исчислению вероятности [и функции полезности, так что он предпочитает действия с более высокой ожидаемой полезностью], тогда у человека действительно есть степени веры, которые подчиняются законам исчисления вероятности [и действительно предпочитает действия с более высокой ожидаемой полезностью].
Эти предпосылки влекут за собой следующий вывод.
Если человек [не может предпочесть действия с более высокой ожидаемой полезностью], тогда он нарушает хотя бы одну из аксиом рационального предпочтения.
Если предпосылки верны, аргумент показывает, что что-то не так с людьми, чьи предпочтения расходятся с теорией ожидаемой полезности - они нарушают аксиомы рациональных предпочтений. Давайте рассмотрим каждую из предпосылок более подробно, начиная с ключевой предпосылки, представимости.
Функция вероятности и функция полезности вместе представляют собой набор предпочтений на случай, если следующая формула справедлива для всех значений (A) и (B) в области отношения предпочтений
[EU (A) gt EU (B) text {тогда и только тогда, когда} A \ text {предпочтительнее} B.)
Математические доказательства представимости называются теоремами о представлении. В разделе 2.1 рассматриваются три наиболее влиятельные теоремы о представлении, каждая из которых опирается на свой набор аксиом.
Независимо от того, какой набор аксиом мы используем, Условие Рациональности является спорным. В некоторых случаях предпочтения, которые кажутся рационально допустимыми - возможно, даже рационально необходимыми - нарушают аксиомы теории ожидаемой полезности. В разделе 3 подробно рассматриваются такие случаи.
Условие реальности также противоречиво. Хэмптон (1994), Зында (2000) и Мичам и Вайсберг (2011) все указывают на то, что представление с использованием функции вероятности и полезности не должно иметь функции вероятности и полезности. В конце концов, агент, который может быть представлен как максимизатор ожидаемой полезности со степенями веры, которые подчиняются исчислению вероятности, также может быть представлен как тот, кто не может максимизировать ожидаемую полезность со степенями веры, которые нарушают исчисление вероятности. Зачем думать, что ожидаемое представление полезности является правильным?
Есть несколько вариантов. Возможно, защитник теорем о представлении может оговорить, что иметь определенные степени веры и полезности - это просто иметь соответствующие предпочтения. Основная задача защитников этого ответа - объяснить, почему представления с точки зрения ожидаемой полезности объяснительно полезны, и почему они лучше, чем альтернативные представления. Или, возможно, вероятности и полезности являются хорошими теоретическими заменителями наших народных представлений о вере и точными научными заменителями наших народных представлений. Мичам и Вайсберг оспаривают этот ответ, утверждая, что вероятности и полезность являются плохим резервом для наших народных представлений. Третья возможность, предложенная Зындой, заключается в том, что факты о степени веры осуществляются независимо от предпочтений агента,и предоставить принципиальный способ ограничения диапазона допустимых представлений. Задача защитников такого типа ответа состоит в том, чтобы определить, что это за дополнительные факты.
Теперь я перехожу к рассмотрению трех влиятельных теорем о представлении. Эти теоремы о представлении отличаются друг от друга тремя философски значимыми способами.
Во-первых, разные теоремы о представлении расходятся во мнениях об объектах предпочтения и полезности. Они повторяются? Должны ли они быть полностью под контролем агента
Во-вторых, теоремы о представлении различаются по трактовке вероятности. Они не согласны с тем, какие объекты имеют вероятности, и могут ли одни и те же объекты иметь как вероятности, так и полезности.
В-третьих, хотя каждая теорема о представлении доказывает, что для подходящего порядка предпочтений существуют функции вероятности и полезности, представляющие порядок предпочтений, они отличаются тем, насколько уникальны эти функции вероятности и полезности. Другими словами, они различаются относительно того, какие преобразования функций вероятности и полезности допустимы.
2.2.1 Рэмси
Идея теоремы о представлении ожидаемой полезности восходит к Рамси (1926). (Его набросок теоремы о представлении впоследствии заполняется Брэдли (2004) и Эллиоттом (2017).) Рэмси предполагает, что предпочтения определены в области азартных игр, которые дают один выигрыш при условии, что предложение (P) верно, и другой приз при условии, что (P) является ложным. (Примеры азартных игр: в противном случае вы получаете одсы, если у вас есть ребенок и бутылка скотча; в противном случае вы получите двадцать долларов, если Боджак выиграет дерби в Кентукки, а в противном случае потеряет доллар.)
Рэмси называет суждение этически нейтральным, когда «два возможных мира, различающихся только в отношении [его истинности], всегда имеют одинаковую ценность». Для этически нейтрального предложения вероятность 1/2 может быть определена с точки зрения предпочтения: такое предложение имеет вероятность 1/2 на случай, если вам безразлично, на какую сторону вы ставите. (Так что, если Боджак выигрывает Дерби в Кентукки, это этически нейтральное предложение, оно имеет вероятность 1/2 на случай, если вам безразлично выиграть двадцать долларов, если это правда, и потерять доллар в противном случае, и выиграть двадцать долларов, если оно ложно, и потерять доллар в противном случае.)
Размещая этически нейтральное суждение с вероятностью 1/2 вместе с богатым пространством призов, Рамси определяет числовые утилиты для призов. (Грубая идея заключается в том, что если вам безразлично получить средний приз (m) наверняка и азартную игру, которая дает лучший приз (b), если этически нейтральное предложение верно и худший приз (w) если он падает, то утилита (m) находится на полпути между утилитами (b) и (w).) Используя эти числовые утилиты, он затем использует определение ожидаемой полезности для определения вероятности для всех других предложений.
Грубая идея состоит в том, чтобы использовать богатство пространства призов, которое гарантирует, что для любой азартной игры (g), которая дает лучший приз (b), если (E) является истинным, а худший приз (w) если (E) является ложным, агент безразличен между (g) и каким-то средним призом (m). Это означает, что (EU (g) = EU (m)). Используя некоторую алгебру плюс тот факт, что (EU (g) = P (E) U (b) + (1-P (E)) U (w)), Рамсей показывает, что
[P (E) = \ frac {(1 - U (m)} {(U (b) - U (w))})
2.2.2 Фон Нейман и Моргенштерн
Фон Нейман и Моргенштерн (1944) утверждают, что предпочтения определены в области лотерей. Некоторые из этих лотерей постоянны и с уверенностью приносят один выигрыш. (Призы могут включать в себя банан, миллион долларов, долг в миллион долларов, смерть или новую машину.) В лотереях могут быть и другие лотереи в качестве призов, так что можно получить лотерею с 40% -ной вероятностью сдачи. банан, и 60% -ый шанс на выигрыш в 50-50 между миллионом долларов и смертью.) Область лотерей закрывается в процессе смешивания, так что если (L) и (L ') лотереи и (x) является действительным числом в интервале ([0, 1]), тогда существует лотерея (x L + (1-x) L '), которая дает (L) с вероятностью (x) и (L ') с вероятностью (1-x). Они показывают, что каждое отношение предпочтения, подчиняющееся определенным аксиомам, может быть представлено вероятностями, используемыми для определения лотерей, вместе с функцией полезности, которая является уникальной вплоть до положительного линейного преобразования.
2.2.3 Дикарь
Вместо того, чтобы принимать вероятности как должное, как это делают фон Нейман и Моргенштерн, Сэвидж (1972) определяет их с точки зрения предпочтений над действиями. Savage предлагает три отдельных домена. Вероятность придает событиям, которые мы можем рассматривать как разделение состояний, а полезность и внутреннее предпочтение - к результатам. Ожидаемая полезность и не свойственные предпочтения придают актам.
Для Savage действия, состояния и результаты должны удовлетворять определенным ограничениям. Акты должны быть полностью под контролем агента (поэтому публикация моей статьи в Mind не является актом, поскольку она частично зависит от решения редактора, которое я не контролирую). Результаты должны иметь одинаковую полезность независимо от того, в каком штате они находятся (поэтому «Я выигрываю фантастическую машину» не является результатом, поскольку полезность этой модной машины будет выше в тех штатах, где человек, которого я больше всего хочу впечатлить, желает, чтобы у меня была фантазия и меньше в штатах, где я теряю водительские права). Ни одно государство не может исключить выполнение какого-либо действия, и действие и государство вместе должны определенно определять результат. Для каждого результата (o) существует постоянное действие, которое дает (o) в каждом состоянии. (Таким образом, если мир во всем мире является результатом, есть акт, который приводит к миру во всем мире,независимо от состояния мира.) Наконец, он предполагает, что для любых двух актов (A) и (B) и любого события (E) существует смешанный акт (A_E \ amp B_ { sim E}), который дает тот же результат, что и (A), если (E) верно, и тот же результат, что и (B) в противном случае. (Таким образом, если мир во всем мире и конец света - оба результата, то существует смешанный акт, который приводит к миру во всем мире, если определенная монета приземляется, и конец света в противном случае.)))
Сэвидж постулирует отношение предпочтения над действиями и дает аксиомы, управляющие этим отношением предпочтения. Затем он определяет субъективные вероятности или степени веры в терминах предпочтений. Ключевым шагом является определение «по крайней мере так же вероятно, как» отношения между событиями; Я перефразирую здесь.
Предположим, что (A) и (B) являются постоянными актами, так что (A) предпочтительнее (B). Тогда (E), по крайней мере, так же вероятно, как (F), на тот случай, если агент предпочитает (A_E \ amp B _ { sim E}) (действие, которое дает (A), если (E) получает, а (B) в противном случае) (A_F \ amp B _ { sim F}) (акт, который дает (A), если (F) получает, и (B)) в противном случае), или же безразлично между (A_E \ amp B _ { sim E}) и (A_F \ amp B _ { sim F}).
Идея, лежащая в основе определения, заключается в том, что агент считает, что (E), по крайней мере, так же вероятно, как и (F), на тот случай, если он предпочтет сделать ставку не на (F), а на (E)).
Затем Сэвидж дает аксиомы, ограничивающие рациональные предпочтения, и показывает, что любой набор предпочтений, удовлетворяющий этим аксиомам, дает отношение «по крайней мере с вероятностью», которое может быть однозначно представлено функцией вероятности. Другими словами, существует одна и только одна функция вероятности (P) такая, что для всех (E) и (F), (P (E) ge P (F)) тогда и только тогда если (E), по крайней мере, так же вероятно, как (F). Каждое отношение предпочтения, подчиняющееся аксиомам Сэвиджа, представлено этой функцией вероятности (P) вместе с функцией полезности, которая является уникальной с точностью до положительного линейного преобразования.
Теорема о представлении Сэвиджа дает сильные результаты: начиная с одного порядка предпочтений, мы можем найти единственную функцию вероятности и узкий класс функций полезности, которые представляют этот порядок предпочтений. Недостатком, однако, является то, что Сэвидж должен строить невероятно сильные предположения о сфере действия.
Люси и Suppes (1965) указывают, что постоянные действия Сэвиджа неправдоподобны. (Вспомните, что постоянные действия дают одинаковый результат и одинаковую ценность в каждом штате.) Возьмите очень хороший результат - полное блаженство для всех. Есть ли действительно постоянный акт, который имеет такой результат в каждом возможном состоянии, включая состояния, где человеческая раса уничтожена метеором? Зависимость Сэвиджа от богатого пространства смешанных действий также проблематична. Дикарь должен был предположить, что любые два результата и любое событие, есть смешанное действие, которое дает первый результат, если событие происходит, и второй результат в противном случае? Есть ли действительно акт, который приносит полное блаженство, если каждый человек погибает от устойчивой к антибиотикам чумы, а в противном случае - полное страдание? Люс и Кранц (1971) предлагают способы переформулирования Savage 'Теорема о представлении, которая ослабляет эти предположения, но Джойс (1999) утверждает, что даже при ослабленных предположениях область действий остается невероятно богатой.
2.2.4 Болкер и Джеффри
Болкер (1966) доказывает теорему общего представления о математических ожиданиях, которую Джеффри (1983) использует в качестве основы для философского изложения теории ожидаемой полезности. Теорема Болкера предполагает одну область высказываний, которые являются объектами предпочтения, полезности и вероятности. Таким образом, утверждение о том, что сегодня пойдет дождь, имеет как полезность, так и вероятность. Джеффри интерпретирует эту полезность как новостную ценность предложения - меру того, насколько я счастлив или разочарован, узнав, что это предложение было правдой. По соглашению он устанавливает значение необходимого предложения в 0 - необходимое предложение вообще не новость! Точно так же, предложение, что я беру свой зонтик на работу, которое является действием, имеет как вероятность, так и полезность. Джеффри понимает, что это означает, что у меня есть степень веры в то, что я буду делать.
Болкер дает аксиомам, ограничивающим предпочтение, и показывает, что любые предпочтения, удовлетворяющие его аксиомам, могут быть представлены вероятностной мерой (P) и служебной мерой (U). Однако аксиомы Болкера не гарантируют, что (P) уникальна или что (U) уникальна с точностью до положительного линейного преобразования. Они также не позволяют нам определять сравнительную вероятность с точки зрения предпочтения. Вместо этого, где (P) и (U) совместно представляют порядок предпочтений, Болкер показывает, что пара (langle P, U \ rangle) является уникальной с точностью до дробного линейного преобразования.
В технических терминах, где (U) - функция полезности, нормализованная так, что (U (Omega) = 0), (inf) - наибольшая нижняя граница значений, назначенных (U), (sup) - это наименьшая верхняя граница значений, присвоенных (U), а (lambda) - параметр, попадающий между (- 1 / inf) и (- 1 / sup)), дробное линейное преобразование (langle P _ { lambda}, U _ { lambda} rangle) из (langle P, U \ rangle), соответствующее (lambda), определяется как:
(begin {align} P _ { lambda} & = P (x) (1 + \ lambda U (x)) \ U _ { lambda} & = U (x) ((1+ \ lambda) / (1 + \ lambda U (x)) end {align})
Обратите внимание, что дробные линейные преобразования пары вероятности и полезности могут не совпадать с исходной парой о том, какие предложения более вероятны, чем другие.
Джойс (1999) показывает, что с помощью дополнительных ресурсов теорема Болкера может быть изменена для определения уникального (P) и уникального (U) с точностью до положительного линейного преобразования. Нам нужно только дополнить порядок предпочтений примитивным отношением «более вероятно, чем», управляемым собственным набором аксиом и связанным с убеждением несколькими дополнительными аксиомами. Джойс модифицирует результат Болкера, чтобы показать, что с учетом этих дополнительных аксиом отношение «более вероятно, чем» представлено уникальным (P), а порядок предпочтений представлен (P) вместе с функцией полезности, которая уникальна с точностью до положительного линейного преобразования.
2.2.5 Резюме
Вместе эти четыре теоремы о представлении выше можно суммировать в следующей таблице.
теорема |
Объекты предпочтения |
Порядок строительства |
Допустимые преобразования: вероятность |
Допустимые преобразования: утилита |
Ramsey | авантюры | предпочтение → полезность → вероятность | идентичность | положительный линейный |
фон Нейман / Моргенштерн |
розыгрыши | (предпочтение и вероятность) → полезность | N / A | положительный линейный |
дикарь | акты | предпочтение → вероятность → полезность | идентичность | положительный линейный |
Джеффри / Bolker | предложения | предпочтение → (вероятность и полезность) | - дробный линейный - |
Обратите внимание, что порядок построения отличается между теоремами: Рамси строит представление вероятности, используя полезность, в то время как фон Нейман и Моргенштерн начинают с вероятностей и строят представление полезности. Таким образом, хотя стрелки представляют математические отношения представления, они не могут представлять метафизические отношения заземления. Условие реальности должно быть обосновано независимо от любой теоремы о представлении.
Правильно структурированные порядковые вероятности (отношения, выбранные «по крайней мере так же вероятно, как», «более вероятно, чем» и «одинаково вероятно»), находятся в однозначном соответствии с основными функциями вероятности. Наконец, серая линия от предпочтений к порядковым вероятностям указывает на то, что каждая функция вероятности, удовлетворяющая аксиомам Сэвиджа, представлена уникальной кардинальной вероятностью, но этот результат не выполняется для аксиом Джеффри.
Обратите внимание, что часто можно следовать стрелкам в кругах - от предпочтения до порядковой вероятности, от порядковой вероятности до кардинальной вероятности, от кардинальной вероятности и предпочтения до ожидаемой полезности и от ожидаемой полезности обратно к предпочтению. Таким образом, хотя стрелки представляют математические отношения представления, они не представляют метафизические отношения заземления. Этот факт свидетельствует о важности независимого обоснования теорем об условиях реальности, которые не могут оправдать теорию ожидаемой полезности без дополнительных предположений.
3. Препятствия в теории ожидаемой полезности
3.1 Максимизация ожидаемой полезности невозможна
Это подразумевает, может, но возможно ли по-человечески максимизировать ожидаемую полезность? Марч и Саймон (1958) указывают, что для вычисления ожидаемых полезностей агенту необходимо сложнейшее понимание доступных действий, возможных результатов и значений этих результатов, и что выбор наилучшего акта гораздо более сложен, чем выбор акта, который достаточно хорош. Подобные точки появляются в Lindblom (1959), Feldman (2006) и Smith (2010).
МакГи (1991) утверждает, что максимизация ожидаемой полезности математически невозможна даже для идеального компьютера с неограниченным объемом памяти. Чтобы максимизировать ожидаемую полезность, мы должны были бы принять любую ставку, которую нам предложили на арифметические истины, и отклонить любую ставку, которую нам предложили на ложные предложения на языке арифметики. Но арифметика неразрешима, поэтому никакая машина Тьюринга не может определить, является ли данное арифметическое предложение истинным или ложным.
Одним из ответов на эти трудности является подход ограниченной рациональности, который нацелен на замену теории ожидаемой полезности некоторыми более гибкими правилами. Другой заключается в том, чтобы утверждать, что требования теории ожидаемой полезности являются более податливыми, чем они кажутся (Burch-Brown 2014; см. Также Greaves 2016), или что соответствующий принцип «следует подразумевать, может» ложен (Srinivasan 2015).
3.2 Максимизация ожидаемой полезности иррациональна
Различные авторы привели примеры, в которых теория ожидаемой полезности, кажется, дает неправильные рецепты. В разделах 3.2.1 и 3.2.2 обсуждаются примеры, когда рациональность, по-видимому, допускает предпочтения, несовместимые с теорией ожидаемой полезности. Эти примеры показывают, что максимизация ожидаемой полезности не является необходимой для рациональности. В разделе 3.2.3 обсуждаются примеры, когда теория ожидаемой полезности допускает предпочтения, которые кажутся иррациональными. Эти примеры показывают, что максимизации ожидаемой полезности недостаточно для рациональности. В разделе 3.2.4 обсуждается пример, в котором теория ожидаемой полезности требует предпочтений, которые кажутся рационально запрещенными - вызов как необходимости, так и достаточности ожидаемой полезности для рациональности.
3.2.1. Контрпримеры, включающие транзитивность и полноту
Теория ожидаемой полезности подразумевает, что структура предпочтений отражает структуру отношения «больше чем» между действительными числами. Таким образом, согласно теории ожидаемой полезности, предпочтения должны быть транзитивными: если (A) предпочтительнее (B) (так что (U (A) gt U (B))), и (B) предпочтительнее (C) (так что (U (B) gt U (C))), тогда (A) должно быть предпочтительнее (C) (поскольку это должно быть (U (A) gt U (C))). Аналогично, предпочтения должны быть полными: для любых двух вариантов либо один должен быть предпочтительнее другого, либо агент должен быть безразличен между ними (из-за их двух утилит либо одна должна быть больше, либо две должны быть равными). Но есть случаи, когда рациональность, по-видимому, допускает (или, возможно, даже требует) сбоев транзитивности и сбоев полноты.
Примером предпочтений, которые не являются переходными, но, тем не менее, кажутся разумно допустимыми, является загадка Куинна о самоистязании (1990). Самозванец подключен к машине с диском с настройками, обозначенными от 0 до 1000, где настройка 0 ничего не делает, и каждая последующая настройка вызывает чуть более сильный удар током. Установка 0 безболезненна, в то время как установка 1000 вызывает мучительную агонию, но разница между любыми двумя смежными настройками настолько мала, что может быть незаметной. Циферблат оснащен храповым механизмом, так что его можно поворачивать вверх, но никогда не опускать. Предположим, что в каждом сеттинге самопредставителю предлагается $ 10 000 для перехода к следующему, чтобы за допущение сеттинга (n) он получал вознаграждение (n { cdot} {$ 10 000}). Допускается, что самоучитель предпочитает устанавливать (n + 1) вместо (n) для каждого (n) между 0 и 999 (поскольку разница в боли незаметна, а разница в денежном выражении Выплаты значительны), но я не предпочитаю устанавливать 1000 вместо 0 (поскольку боль от установки 1000 может быть настолько невыносимой, что никакие деньги не компенсируют это.
Также представляется разумно допустимым иметь неполные предпочтения. Для некоторых пар действий у агента может не быть продуманного представления о том, что он предпочитает. Рассмотрим Джейн, электрика, который никогда не задумывался о том, чтобы стать профессиональным певцом или профессиональным космонавтом. (Возможно, оба эти варианта невозможны, или, возможно, она считает, что оба они намного хуже, чем ее постоянная работа электриком). Ложно, что Джейн предпочитает стать певицей, чтобы стать космонавтом, и ложно, что она предпочитает стать космонавтом, чтобы стать певицей. Но также неверно, что ей безразлично стать певицей и стать космонавтом. Она предпочитает стать певицей и получать премию в размере 100 долларов, чтобы стать певицей, и если ей безразлично стать певцом и стать астронавтом,она была бы рационально вынуждена предпочесть стать певицей и получить бонус в 100 долларов, чтобы стать космонавтом.
Между двумя примерами, рассмотренными выше, есть одно ключевое отличие. Предпочтения Джейн могут быть расширены путем добавления новых предпочтений без удаления каких-либо из тех, которые у нее есть, таким образом, что позволяет нам представлять ее как максимизатор ожидаемой полезности. С другой стороны, нет способа расширить предпочтения самозванца, чтобы он мог быть представлен как максимизатор ожидаемой полезности. Некоторые из его предпочтений должны быть изменены. Один популярный ответ на неполные предпочтения состоит в том, чтобы утверждать, что, хотя рациональные предпочтения не должны удовлетворять аксиомам данной теоремы о представлении (см. Раздел 2.2), должна быть возможность расширить их так, чтобы они удовлетворяли аксиомам. Из этого более слабого требования к предпочтениям - что они могут быть расширены до порядка предпочтений, который удовлетворяет соответствующим аксиомам - можно доказать половину существования соответствующих теорем о представлении. Однако больше нельзя установить, что каждый порядок предпочтений имеет представление, которое является уникальным вплоть до допустимых преобразований.
Такой ответ не доступен в случае самоистязателя, чьи предпочтения не могут быть расширены для удовлетворения аксиом теории ожидаемой полезности. См. Запись о предпочтениях для более подробного обсуждения дела самоистязателя.
3.2.2. Контрпримеры, вовлекающие независимость
Allais (1953) и Ellsberg (1961) предлагают примеры предпочтений, которые не могут быть представлены ожидаемой функцией полезности, но тем не менее кажутся рациональными. Оба примера связаны с нарушением аксиомы независимости Сэвиджа:
Независимость Предположим, что (A) и (A ^ *) - два действия, которые дают одинаковые результаты в случае, если (E) ложно. Тогда для любого действия (B) нужно иметь
- (A) предпочтительнее (A ^ *) тогда и только тогда, когда (A_E \ amp B _ { sim E}) предпочтительнее (A ^ * _ E \ amp B _ { sim E})
- Агент безразличен между (A) и (A ^ *) тогда и только тогда, когда он безразличен между (A_E \ amp B _ { sim E}) и (A ^ * _ E \ amp B_ { sim E})
Другими словами, если два действия имеют одинаковые последствия, когда (E) ложно, то предпочтения агента между этими двумя действиями должны зависеть только от их последствий, когда (E) истинно. По определению Savage ожидаемой полезности, теория ожидаемой полезности влечет за собой независимость. И по определению Джеффри теория ожидаемой полезности влечет за собой независимость при наличии предположения о том, что государства вероятностно независимы от действий.
Первый контрпример, парадокс Allais, включает две отдельные проблемы решения, в которых билет с номером от 1 до 100 выбирается случайным образом. В первой задаче агент должен выбирать между этими двумя лотереями:
- Лотерея (А)
- • 100 миллионов долларов с уверенностью
- Лотерея (Б)
- • 500 миллионов долларов, если разыгран один из билетов 1–10
- • 100 миллионов долларов, если разыгран один из билетов 12–100
- • Ничего, если билет 11 разыгран
Во второй задаче решения агент должен выбрать между этими двумя лотереями:
- Лотерея (С)
- • 100 миллионов долларов, если разыгран один из билетов 1–11
- • Ничего другого
- Лотерея (Д)
- • 500 миллионов долларов, если разыгран один из билетов 1–10
- • Ничего другого
Кажется разумным предпочесть (A) (который предлагает 100 миллионов долларов) вместо (B) (где добавленная 10% -ная вероятность в 500 миллионов долларов более чем компенсируется риском ничего не получить). Также кажется разумным предпочесть (D) (10% -ный шанс при выигрыше в 500 миллионов долларов) вместо (C) (чуть больший шанс в 11% при намного меньшем выигрыше в $ 100 миллионов). Но вместе эти предпочтения (назовите их предпочтениями Allais) нарушают Независимость. Лотереи (A) и (C) приносят одинаковый приз в 100 миллионов долларов за билеты 12–100. Их можно конвертировать в лотереи (B) и (D), заменив приз в 100 миллионов долларов на 0 долларов.
Поскольку они нарушают Независимость, предпочтения Аллея несовместимы с теорией ожидаемой полезности. Эта несовместимость не требует каких-либо предположений об относительной полезности 0, 100 и 500 миллионов долларов. Если $ 500 млн. Имеет полезность (x), $ 100 млн. Имеет полезность (y), а $ 0 - полезность (z), ожидаемые полезности лотерей следующие.
(begin {align} EU (A) & = 0.11y + 0.89y \\ EU (B) & = 0.10x + 0.01z + 0.89y \\ EU (C) & = 0.11y + 0.89z \\ EU (D) & = 0,10x + 0,01z + 0,89z \ end {align})
Легко видеть, что условие, при котором (EU (A) gt EU (B)) в точности совпадает с условием, при котором (EU (C) gt EU (D)): оба неравенства получить на всякий случай (0.11y \ gt 0.10x + 0.01z)
Парадокс Эллсберга также связан с двумя проблемами решения, которые порождают нарушение принципа достоверности. В каждом из них шарик берется из урны, содержащей 30 красных шариков и 60 шариков белого или желтого цвета в неизвестных пропорциях. В первой задаче решения агент должен выбрать одну из следующих лотерей:
- Лотерея (R)
- • Выиграй $ 100, если нарисован красный шар
- • В противном случае потерять 100 долларов
- Лотерея (Ш)
- • Выиграй $ 100, если нарисован белый шар
- • В противном случае потерять 100 долларов
Во второй задаче решения агент должен выбрать одну из следующих лотерей:
- Лотерея (РГ)
- • Выиграй $ 100, если нарисован красный или желтый шар
- • В противном случае потерять 100 долларов
- Лотерея (WY)
- • Выиграй $ 100, если нарисован белый или желтый шар
- • В противном случае потерять 100 долларов
Кажется разумным предпочесть (R) (W), но в то же время предпочесть (WY) (RY). (Назовите эту комбинацию предпочтений предпочтениями Ellsberg.) Как и предпочтения Allais, предпочтения Ellsberg нарушают Независимость. Лотереи (W) и (R) приносят убыток в размере 100 долларов, если нарисован желтый шар; их можно конвертировать в лотереи (RY) и (WY), просто заменив эту потерю в 100 долларов на гарантированный выигрыш в 100 долларов.
Поскольку они нарушают независимость, предпочтения Эллсберга несовместимы с теорией ожидаемой полезности. Опять же, эта несовместимость не требует каких-либо предположений об относительной полезности выигрыша 100 долларов и потери 100 долларов. Нам также не нужны предположения о том, где между 0 и 1/3 вероятность выпадения желтого шара падает. Где выигрыш 100 долларов имеет полезность (w), а проигрыш 100 долларов - полезность (l), (begin {align} EU (R) & = \ tfrac {1} {3} w + P (W) l + P (Y) l \\ EU (W) & = \ tfrac {1} {3} l + P (W) w + P (Y) l \\ EU (RY) & = \ tfrac {1} {3} w + P (W) l + P (Y) w \\ EU (WY) & = \ tfrac {1} {3} l + P (W) w + P (Y) w \ end {align})
Легко видеть, что условие, при котором (EU (R) gt EU (W)) в точности совпадает с условием, при котором (EU (RY) gt EU (WY)): оба неравенства получить на всякий случай (1/3 \, w + P (W) l \ gt 1/3 \, l + P (W) w).
Есть три заметных ответа на парадоксы Алле и Эллсберга. Во-первых, можно следовать Savage (101 и далее) и Raiffa (1968, 80–86) и защищать теорию ожидаемой полезности на том основании, что предпочтения Алле и Эллсберга иррациональны.
Во-вторых, можно следовать Buchak (2013) и утверждать, что предпочтения Алле и Эллсберга рационально допустимы, так что теория ожидаемой полезности терпит неудачу как нормативная теория рациональности. Бучак разрабатывает более приемлемую теорию рациональности, с дополнительным параметром, отражающим отношение лица, принимающего решения, к риску. Этот параметр риска взаимодействует с полезностями результатов и их условными вероятностями на действиях, чтобы определить значения действий. Одна установка параметра риска дает ожидаемую теорию полезности в качестве особого случая, но другие настройки «не склонные к риску» рационализируют предпочтения Allais.
В-третьих, можно следовать Лоомесу и Сагдену (1986), Вейриху (1986) и Папе (1995) и утверждать, что результаты парадоксов Алле и Эллсберга могут быть пересмотрены с учетом предпочтений Алле и Эллсберга. Предполагаемый конфликт между предпочтениями Алле и Эллсберга, с одной стороны, и ожидаемой теорией полезности, с другой, был основан на предположении, что данная сумма денег имеет одинаковую полезность независимо от того, как она получена. Некоторые авторы оспаривают это предположение. Loomes и Sugden предполагают, что в дополнение к денежным суммам результаты азартных игр включают чувство разочарования (или восторга) при получении меньшего (или большего), чем ожидалось. Папа отличает «восторг» от чувства восторга, страха, скуки или безопасности.и указывает, что оба могут повлиять на результат утилиты. Вейрих предполагает, что стоимость денежной суммы частично зависит от рисков, которые пошли на ее получение, независимо от чувств игрока, так что (например) 100 миллионов долларов в результате верной ставки составляют более 100 миллионов долларов от азартной игры, которая возможно, ничего не заплатил.
Broome (1991) вызывает беспокойство по поводу этого решения для повторного описания. Любые предпочтения могут быть оправданы переписыванием пространства результатов, что лишает аксиомы теории ожидаемой полезности содержания. Брум опровергает это возражение, предлагая дополнительное ограничение на предпочтение: если (A) предпочтительнее (B), то (A) и (B) должны отличаться в некотором смысле, что оправдывает предпочтение одного из них Другой. Ожидаемый теоретик полезности может затем считать предпочтения Алле и Эллсберга рациональными, если и только если есть немонетарное различие, которое оправдывает размещение результатов с одинаковой денежной стоимостью в разных точках в порядке предпочтения.
3.2.3. Контрпримеры, включающие вероятности 0 событий
Выше мы видели предполагаемые примеры рациональных предпочтений, которые нарушают теорию ожидаемой полезности. Есть также предполагаемые примеры иррациональных предпочтений, которые удовлетворяют теории ожидаемой полезности.
При типичном понимании теории ожидаемой полезности, когда два действия связаны для достижения наибольшей ожидаемой полезности, агенты должны быть безразличными между ними. Скирмс (1980, стр. 74) указывает, что эта точка зрения позволяет нам сделать странные выводы о событиях с вероятностью 0. Например, предположим, что вы собираетесь бросить дротик размером с точку на круглом дротике. Классическая теория вероятностей встречает ситуации, в которых дротик имеет вероятность 0 попадания в любую конкретную точку. Вы предлагаете мне следующую паршивую сделку: если дротик попадет на игровое поле в его точном центре, то вы заплатите мне 100 долларов; в противном случае деньги не перейдут из рук в руки. Мое решение проблемы может быть зафиксировано с помощью следующей матрицы:
состояния | |||
центр удара ((P = 0)) | мисс центр ((P = 1)) | ||
акты | принять сделку | (- 100) | (0) |
отказаться от сделки | (0) | (0) |
Теория ожидаемой полезности говорит, что я могу согласиться с тем, что согласие на сделку имеет ожидаемую полезность 0. (Это относится и к определению Джеффри, и к определению Сэвиджа, если мы предположим, что то, как дротики приземляются, вероятностно не зависит от того, Держу пари.) Но здравый смысл говорит, что я не могу согласиться на сделку. Отказ слабо доминирует над принятием: он дает лучший результат в некоторых штатах и худший результат ни в одном государстве.
Скирмс предлагает дополнить законы классической вероятности дополнительным требованием, чтобы вероятности назначались только невозможности 0. Ишваран (2014) утверждает, что вместо этого мы должны отвергнуть мнение, что теория ожидаемой полезности вызывает безразличие между действиями с равной ожидаемой полезностью. Напротив, теория ожидаемой полезности не является полной теорией рациональности: когда два действия имеют одинаковую ожидаемую полезность, она не говорит нам, какой из них выбрать. Мы можем использовать соображения непредвиденной полезности, такие как слабое доминирование, как нарушители связей.
3.2.4. Контрпримеры, включающие неограниченную полезность
Функция полезности (U) ограничена сверху, если существует предел того, насколько хорошие вещи могут быть в соответствии с (U), или более формально, если существует какое-то наименьшее натуральное число (sup), такое что для каждого (A) в области (U), (U (A) le sup). Аналогично, (U) ограничен снизу, если существует предел того, насколько плохие вещи могут быть в соответствии с (U), или, более формально, если существует какое-то наибольшее натуральное число (inf), такое что для каждого (A) в области (U), (U (A) ge inf). Теория ожидаемой полезности может столкнуться с проблемами, когда функции полезности не ограничены сверху, снизу или и тем, и другим.
Одним из проблемных примеров является петербургская игра, первоначально изданная Бернулли. Предположим, что монету подбрасывают до тех пор, пока она не приземлится в первый раз. Если при первом броске выпадает хвост, вы выигрываете 2 доллара; если после второго броска выпадает хвост, вы выиграете 4 доллара; если он получает хвосты на третьем броске, вы выигрываете 8 долларов, а если он падает на (n) -ом броске, вы выигрываете $ (2 ^ n). Предполагая, что каждый доллар стоит одного полезного, ожидаемая ценность игры в Санкт-Петербурге
[(tfrac {1} {2} cdot 2) + (tfrac {1} {4} cdot 4) + (tfrac {1} {8} cdot 8) + \ cdots + (tfrac {1} {2 ^ n} cdot 2 ^ n) + \ cdots) или [1 + 1 + 1 + \ cdots = \ infty)
Оказывается, эта сумма расходится; Петербургская игра имеет бесконечную ожидаемую полезность. Таким образом, согласно теории ожидаемой полезности, вы должны предпочесть возможность играть в петербургскую игру любой конечной сумме денег, независимо от ее размера. Кроме того, поскольку бесконечная ожидаемая полезность, умноженная на любой ненулевой шанс, все еще бесконечна, все, что имеет положительную вероятность получения игры в Санкт-Петербурге, имеет бесконечно ожидаемую полезность. Таким образом, согласно теории ожидаемой полезности, вы должны предпочесть любой шанс сыграть в петербургскую игру, пусть даже небольшую, любой конечной сумме денег, какой бы большой она ни была.
Nover и Hájek (2004) утверждают, что помимо петербургской игры, которая имеет бесконечную ожидаемую полезность, существуют и другие бесконечные игры, ожидаемые полезности которых не определены, хотя рациональность требует определенных предпочтений среди них.
Один из ответов на эти проблемные бесконечные игры состоит в том, чтобы утверждать, что сами проблемы решения являются некорректными (Джеффри (1983, 154)), а другой - принять модифицированную версию теории ожидаемой полезности, которая согласуется с ее вердиктами в обычном случае, но дает интуитивно обоснованные вердикты об бесконечных играх (Thalos and Richardson 2013) (Fine 2008) (Colyvan 2006, 2008) (Easwaran 2008).
4. Приложения
4.1 Экономика и государственная политика
В 1940-х и 50-х годах теория ожидаемой полезности приобрела популярность в США за ее способность обеспечить механизм, объясняющий поведение макроэкономических переменных. Поскольку стало очевидным, что теория ожидаемой полезности не может точно предсказать поведение реальных людей, ее сторонники вместо этого выдвинули мнение, что вместо этого она может служить теорией того, как рациональные люди должны реагировать на неопределенность (см. Herfeld 2017).
Теория ожидаемой полезности имеет множество применений в государственной политике. В экономике благосостояния Harsanyi (1953) обосновывает теорию ожидаемой полезности утверждением, что наиболее социально справедливая договоренность - это та, которая максимизирует общее благосостояние, распределенное по обществу. Теория ожидаемой полезности также имеет более прямые приложения. Ховард (1980) вводит понятие микроморта или вероятности смерти один на миллион и использует расчеты ожидаемой полезности для определения приемлемых рисков смертности. В политике здравоохранения годы жизни с поправкой на качество, или QALY, являются мерами ожидаемой полезности различных вмешательств в области здравоохранения, используемых для руководства политикой здравоохранения (см. Weinstein et al 2009). Макаскилл (2015) использует теорию ожидаемой полезности для решения центрального вопроса эффективного альтруизма:«Как я могу сделать самое хорошее?» (Утилиты в этих приложениях наиболее естественно интерпретируются как измерение чего-то вроде счастья или благополучия, а не субъективного удовлетворения предпочтений для отдельного агента.)
Другая область, где теория ожидаемой полезности находит применение, - это страховые продажи. Как и казино, страховые компании берут на себя просчитанные риски с целью долгосрочной финансовой выгоды и должны учитывать вероятность разорения в краткосрочной перспективе.
4.2 Этика
Утилитаристы вместе со своими потомками современными последователями утверждают, что правильность или неправильность действия определяется нравственной добротой или плохостью его последствий. Некоторые последователи, такие как (Рейлтон, 1984), интерпретируют это как означающее, что мы должны делать все, что на самом деле будет иметь лучшие последствия. Но трудно - возможно, невозможно - узнать долгосрочные последствия наших действий (Lenman 2000, Howard-Snyder 2007). В свете этого наблюдения Джексон (1991) утверждает, что именно правильный поступок имеет наибольшую ожидаемую моральную ценность, а не тот, который фактически приведет к наилучшим последствиям.
Как отмечает Джексон, ожидаемая моральная ценность поступка зависит от того, с какой вероятностной функцией мы работаем. Джексон утверждает, что, хотя каждая функция вероятности связана с «должна», «обязанность», которая имеет наибольшее значение для действия, - это та, которая связана со степенью убежденности лица, принимающего решение, во время действия. Другие авторы требуют приоритета для других «вопросов»: Мейсон (2013) предпочитает функцию вероятности, которую наиболее разумно использовать агенту в ответ на ее доказательства, учитывая ее эпистемологические ограничения, в то время как Одди и Мензис (1992) предпочитают функцию объективной вероятности как мера объективной правильности. (Они обращаются к более сложной функции вероятности, чтобы определить понятие «субъективной правильности» для лиц, принимающих решения, которые не знают объективных шансов.)
Третьи (Smart 1973, Timmons 2002) утверждают, что даже если мы должны сделать все, что будет иметь наилучшие последствия, теория ожидаемой полезности может сыграть роль процедуры принятия решения, когда мы не уверены, какие последствия будут иметь наши действия. Feldman (2006) возражает, что ожидаемые полезные вычисления ужасно непрактичны. В большинстве реальных решений шаги, необходимые для вычисления ожидаемых полезностей, находятся за пределами нашего понимания: перечисление возможных результатов наших действий, присвоение каждому результату полезности и условной вероятности для каждого действия и выполнение арифметики, необходимой для расчетов ожидаемой полезности.
Предполагаемая максимизирующая полезность версия консеквенциализма не является строго говоря теорией рационального выбора. Это теория морального выбора, но вопрос о том, требует ли рациональность, чтобы мы делали то, что морально лучше, остается предметом споров.
4.3 Эпистемология
Теория ожидаемой полезности может быть использована для решения практических вопросов в эпистемологии. Один такой вопрос - когда принять гипотезу. В типичных случаях доказательства логически совместимы с несколькими гипотезами, включая гипотезы, которым он оказывает мало индуктивной поддержки. Кроме того, ученые обычно не принимают только те гипотезы, которые наиболее вероятны с учетом их данных. Когда гипотеза достаточно вероятна, чтобы заслужить признание?
Байесовцы, такие как Maher (1993), предполагают, что это решение будет принято на ожидаемых полезных основаниях. Принимать ли гипотезу - это решение проблемы с принятием и отклонением в качестве действий. Это может быть зафиксировано с помощью следующей матрицы решений:
состояния | |||
гипотеза верна | гипотеза неверна | ||
акты | принимать | правильно принять | ошибочно принять |
отклонять | ошибочно отклонить | правильно отклонить |
По определению Сэвиджа, ожидаемая полезность принятия гипотезы определяется вероятностью гипотезы вместе с полезностями каждого из четырех результатов. (Мы можем ожидать, что определение Джеффри согласуется с определением Сэвиджа в отношении правдоподобного предположения о том, что, учитывая имеющиеся у нас доказательства, гипотеза вероятностно не зависит от того, принимаем мы ее или отвергаем.) Здесь утилиты можно понимать как чисто эпистемологические значения, поскольку эпистемически полезно верить интересным истинам и отвергать ложь.
Критики байесовского подхода, такие как Мейо (1996), утверждают, что научные гипотезы не могут быть разумно предоставлены вероятности. Мейо утверждает, что для того, чтобы присвоить полезную вероятность событию, нам нужны статистические данные о частоте подобных событий. Но научные гипотезы либо верны раз и навсегда, либо ложны раз и навсегда - нет такой популяции миров, из которой мы могли бы составить статистику. Мы также не можем использовать субъективные вероятности в научных целях, поскольку это было бы недопустимо произвольно. Следовательно, ожидаемые полезности принятия и отклонения не определены, и мы должны использовать методы традиционной статистики, которые основаны на сравнении вероятностей наших доказательств, зависящих от каждой из гипотез.
Теория ожидаемой полезности также дает руководство о том, когда собирать доказательства. Гуд (1967) утверждает, исходя из ожидаемой полезности, что всегда разумно собирать доказательства, прежде чем действовать, при условии, что доказательства бесплатны. Действие с наибольшей ожидаемой полезностью после получения дополнительных доказательств всегда будет всегда, по крайней мере, таким же хорошим, как действие с наивысшей ожидаемой полезностью заранее.
В теории эпистемического решения ожидаемые полезности используются для оценки состояний веры как рациональных или иррациональных. Если мы рассматриваем формирование убеждений как умственный акт, факты о содержании убеждений агента как события, а близость к истине - как желательную особенность результатов, то мы можем использовать теорию ожидаемой полезности для оценки степени веры с точки зрения их ожидаемого близость к истине. Запись об эпистемических аргументах полезности для вероятности включает в себя обзор ожидаемых аргументов полезности для различных эпистемических норм, включая обусловленность и Основной принцип.
4.4 Закон
Каплан (1968) утверждает, что ожидаемые полезные соображения могут использоваться для установления стандарта доказывания в судебных процессах. Жюри, решающее, оправдывать ли или осуждать, сталкивается со следующей проблемой решения:
состояния | |||
виновный | невинный | ||
акты | признать виновным | истинное убеждение | ложное убеждение |
оправдание | ложное оправдание | оправдательный приговор |
Каплан показывает, что (ЕС (осужденный)> ЕС (оправдание)) всякий раз, когда
[P (виновный)> \ frac {1} {1+ \ frac {U (mathrm {true ~ убеждение}) - U (mathrm {false ~ acquittal})} {U (mathrm {true ~ acquittal}) -U (mathrm {false ~ убеждение})}})
Качественно это означает, что стандарт доказывания увеличивается по мере того, как возрастает бесполезность осуждения невиновного человека ((U (mathrm {true ~ conviction}) - U (mathrm {false ~ acquittal}))) или по мере того, как снижается бесполезность оправдания виновного ((U (mathrm {true ~ acquittal}) - U (mathrm {false ~ осуждение}))).
Критики этого теоретико-решения подхода, такие как Laudan (2006), утверждают, что трудно или невозможно преодолеть разрыв между доказательствами, допустимыми в суде, и реальной вероятностью вины обвиняемого. Вероятность вины зависит от трех факторов: распределение явной вины между подлинно невиновными, распределение явной вины среди искренне невинных и соотношение искренне виновных к искренне невинным обвиняемым, которые предстают перед судом (см. Bell 1987). Препятствия для расчета любого из этих факторов заблокируют вывод судьи или присяжных о явной вине и реальной вероятности вины.
Библиография
- Allais M., 1953, «Le Comportement de l'Homme Rationnel devant le Risque: Критика постулатов и аксиом де-л'Экоул америкейн», Econometrica, 21: 503–546.
- Белл Р., 1987, «Теория принятия решений и надлежащее судебное разбирательство: критика законотворчества Верховного суда в отношении бремени доказывания», Журнал уголовного права и криминологии, 78: 557-585.
- Бентам, Дж., 1961. Введение в принципы морали и законодательства, Гарден-Сити: Doubleday. Первоначально опубликовано в 1789 году.
- Бернулли, Д., 1738, «Specimen theoriae novae de mensura sortis», Commentarii Academiae Scientiarum Imperialis Petropolitanae 5. Переведено Луизой Сомер и переиздано как «Изложение новой теории измерения риска» 1954, Econometrica, 22: 23– 36.
- Болкер, Э., 1966, «Функции, напоминающие коэффициенты мер», Труды Американского математического общества, 2: 292–312.
- Брэдли Р., 2004, «Теорема о представлении Рамсея», Диалектика, 58: 483–497.
- Burch-Brown, JM, 2014, «Подсказки для конклюзивистов», Utilitas, 26: 105-119.
- Бучак Л., 2013, риск и рациональность, Оксфорд: издательство Оксфордского университета.
- Коливан, М., 2006, «Нет ожиданий», Mind, 116: 695–702.
- Коливан, М., 2008, «Теория относительных ожиданий», «Философский журнал», 105: 37–44.
- Ишваран, К., 2014, «Регулярность и гиперреальность», «Философское обозрение», 123: 1–41.
- Ишваран, К., 2008, «Сильные и слабые ожидания», Mind, 117: 633–641.
- Эллиот, Э., 2017, «Рэмси без этической нейтральности: новая теорема о представлении», Mind, 126: 1-51.
- Эллсберг Д., 1961, «Риск, двусмысленность и дикие аксиомы», Quarterly Journal of Economics, 75: 643–669.
- Фельдман, Ф. 2006, «Фактическая полезность, возражение от непрактичности и переход к ожидаемой полезности», Философские исследования, 129: 49–79.
- Fine, T., 2008, «Оценка азартных игр в Пасадене, Альтадене и Санкт-Петербурге», Mind, 117: 613–632.
- Хорошо, IJ, 1967, «О принципе полного доказательства», Британский журнал по философии науки, 17: 319–321
- Гривз, H. 2016, «Невежество», Труды Аристотелевского общества, 116: 311-339.
- Хэмптон Дж. «Отказ теории ожидаемой полезности как теории разума», Экономика и философия, 10: 195–242.
- Harsanyi, JC, 1953, «Кардинальная полезность в экономике благосостояния и в теории принятия риска», журнал политической экономии, 61: 434–435.
- Херфельд К., «От теорий человеческого поведения к правилам рационального выбора: отслеживание нормативного поворота в Комиссии Коулза, 1943–1954 годы», История политической экономии, 50: 1–48.
- Howard, RA, 1980, «О принятии решений о жизни и смерти», в RC Schwing и WA Albers, «Оценка риска для общества: насколько безопасна безопасность?»., Нью-Йорк: Пленум Пресс.
- Ховард-Снайдер, Ф., 1997, «Отказ от объективного консеквенциализма», Utilitas, 9: 241–248.
- Джексон, Ф., 1991, «Теоретический консеквенциализм принятия решений и самое близкое и самое дорогое возражение», Этика, 101: 461–482.
- Джеффри Р., 1983, «Логика решения», 2- е издание, Чикаго: Университет Чикагской Прессы.
- Джевонс В. С., 1866, «Общая математическая теория политической экономии», Журнал Королевского статистического общества, 29: 282–287.
- Джойс, Дж., 1999, Основы теории причинных решений, Кембридж: издательство Кембриджского университета.
- Канеман, Д. и Тверский А., Решение в условиях неопределенности: эвристика и предубеждения, Нью-Йорк: издательство Кембриджского университета.
- Kaplan, J., 1968, «Теория принятия решений и процесс установления фактов», Stanford Law Review, 20: 1065-1092.
- Колмогоров А. Н., 1933, Grundbegriffe der Wahrscheinlichkeitrechnung, Ergebnisse Der Mathematik; переводится как «Основы вероятности», Нью-Йорк: издательство «Челси», 1950.
- Лодан, Л., 2006, правда, ошибка и уголовное право, Кембридж: издательство Кембриджского университета.
- Ленман, J., 2000. «Consequentialism и невежественность», Философия и связи с общественностью, 29 (4): 342–370.
- Льюис Д., 1981, «Теория причинных решений», Австралийский философский журнал, 59: 5–30.
- Леви, I., 1991, «Consequentialism и Sequential Choice», в M. Bacharach и S. Hurley (eds.), Основы теории принятия решений, Оксфорд: Basil Blackwell Ltd, 92–12.
- Линдблом, CE, 1959, «Наука« путаницы »», Обзор государственного управления, 19: 79–88.
- Loomes, G. And Sugden, R., 1986, «Разочарование и динамическая последовательность в выборе в условиях неопределенности», Обзор экономических исследований, 53 (2): 271–282.
- Махер, П., 1993, Ставки на теории, Кембридж: издательство Кембриджского университета.
- Март, JG и Саймон, H., 1958, организации, Нью-Йорк: Wiley.
- Мейсон, Э., 2013, «Объективизм и проспективизм о правоте», Журнал этики и социальной философии, 7: 1–21.
- Мейо, Д., 1996, Ошибка и рост экспериментальных знаний, Чикаго: Университет Чикагской Прессы.
- McAskill, W., 2015, «Делать добро лучше», Нью-Йорк: Gotham Books.
- МакГи, В., 1991, «Мы - машины Тьюринга - не ожидаемые максимизаторы полезности (даже в идеале)», Philosophical Studies, 64: 115-123.
- Meacham, C. и Weisberg, J., 2011, «Теоремы о представлении и основы теории принятия решений», Australasian Journal of Philosophy, 89: 641–663.
- Менгер К., 1871, «Grundsätze der Volkswirtschaftslehre», переведенный Джеймсом Дингуоллом и Берт Ф. Хоселиц как «Принципы экономики», Нью-Йорк: издательство New York University Press, 1976; Перепечатано в Интернете, Институт Людвига фон Мизеса, 2007.
- Мельница, JS, 1861. Утилитаризм. Отредактированный с введением Роджером Криспом. Нью-Йорк: издательство Оксфордского университета, 1998.
- фон Нейман, Дж., и Моргенштерн, О., 1944, Теория игр и экономического поведения, Принстон: издательство Принстонского университета.
- Nover, H. & Hájek, A., 2004, «Превосходные ожидания», Mind, 113: 237–249.
- Нозик Р., 1969, «Проблема Ньюкомба и два принципа выбора», в книге Николаса Решера (ред.), «Очерки в честь Карла Дж. Хемпеля», Дордрехт: Рейдель, 114–115.
- Оливер, А., 2003, «Количественный и качественный тест парадокса Алле с использованием показателей здоровья», журнал «Экономическая психология», 24: 35–48.
- Pope, R., 1995, «На пути к более точной структуре принятия решений: отделение отрицательной полезности случайности от убывающей предельной полезности и предпочтения безопасности», Theory and Decision, 39: 241–265.
- Raiffa, H., 1968, Анализ решений: вводные лекции по выбору в условиях неопределенности, Рединг, Массачусетс: Addison-Wesley.
- Ramsey, FP, 1926, «Правда и вероятность», в Основах математики и других очерках, Р. Б. Брейтуэйт (ред.), Лондон: Kegan, Paul, Trench, Trubner, & Co., 1931, 156–198; переиздано в «Исследованиях по субъективной вероятности», Х. Е. Кибург-младший и Х. Е. Смоклер (ред.), 2-е издание, Нью-Йорк: RE Krieger Publishing Company, 1980, 23–52; перепечатано в «Философских документах», Д. Х. Меллор (ред.), Кембридж: издательство Кембриджского университета, 1990.
- Сэвидж, LJ, 1972, Основы статистики, 2- е издание, Нью-Йорк: Dover Publications, Inc.
- Сен, 1977, «Рациональные дураки: критика поведенческих основ экономической теории», Философия и связи с общественностью, 6: 317–344.
- Шафер, Г., 2007, «От принципа Курно к рыночной эффективности», Августин Курно: Экономика моделирования, Жан-Филипп Туффут (ред.), Челтенхем: Эдвард Элгар, 55–95.
- Сиджвик Х., 1907. Методы этики, седьмое издание. Лондон: Макмиллан; первое издание, 1874 г.
- Саймон Х., 1956, «Поведенческая модель рационального выбора», The Quarterly Journal of Economics, 69: 99–118.
- Скирмс, Б., 1980. Причинная необходимость: прагматическое исследование необходимости принятия законов, Нью-Хейвен, Коннектикут: Издательство Йельского университета.
- Смит, HM, «Субъективная правота», Социальная и политическая философия, 27: 64-110.
- Sobel, JH, 1994, «Удача: эссе о рациональном выборе», Кембридж: издательство Кембриджского университета.
- Spohn, W., 1977, «Где Люси и Кранц действительно обобщают модель решений Сэвиджа», Erkenntnis, 11: 113–134.
- Сринивасан, А., 2015, «Нормативность без картезианской привилегии», Noûs, 25: 273-299.
- Suppes, P., 2002, Представление и инвариантность научных структур, Стэнфорд: Публикации CSLI.
- Талос, м. И Ричардсон, О., 2013, «Капитализация в игре Санкт-Петербурга: почему статистические распределения имеют значение», Политика, философия и экономика, 13: 292-313.
- Вайнштейн, М. К., Торренс, Г., и Макгуайр, А., 2009 «QALY: основы», «Ценность в здоровье», 12: S5 – S9.
- Вейрих, П., 1986, «Ожидаемая полезность и риск», Британский журнал по философии науки, 37: 419–442.
- Зында Л., 2000, «Теоремы о представлении и реализм о степенях веры», Философия науки, 67: 45–69.
Академические инструменты
![]() |
Как процитировать эту запись. |
![]() |
Предварительный просмотр PDF-версию этой записи в обществе друзей SEP. |
![]() |
Посмотрите эту тему в Проекте интернет-философии онтологии (InPhO). |
![]() |
Расширенная библиография для этой записи в PhilPapers со ссылками на ее базу данных. |
Другие интернет-ресурсы
- Решения, Игры и Rational Choice, материалы для курса, преподаваемого весной 2008 года Робертом Стальнакером, MIT OpenCourseWare.
- Микроэкономическая теория III, материалы для курса, который преподавал весной 2010 года Мухамет Йилдиз, MIT OpenCourseWare.
- Выбор в условиях неопределенности, лекции Джонатана Левина.
- Теория ожидаемой полезности, от Филиппа Монжина, статья «Справочник по экономической методологии».
- Истоки ожидаемой теории полезности, эссе Ивана Ленгвилера.