Теория принятия решений

Оглавление:

Теория принятия решений
Теория принятия решений

Видео: Теория принятия решений

Видео: Теория принятия решений
Видео: 15 минут о теории принятия решений 2024, Март
Anonim

Входная навигация

  • Содержание входа
  • Библиография
  • Академические инструменты
  • Friends PDF Preview
  • Информация об авторе и цитировании
  • Вернуться к началу

Теория принятия решений

Впервые опубликовано ср 16 дек 2015

Теория принятия решений связана с рассуждением, лежащим в основе выбора агента, будь то приземленный выбор между поездкой на автобусе или такси, или более далеко идущим выбором о том, продолжать ли требовательную политическую карьеру. (Обратите внимание, что «агент» здесь означает сущность, обычно отдельное лицо, способное к размышлениям и действиям.) Стандартное мышление заключается в том, что действия агента в любом конкретном случае полностью определяются его убеждениями и желаниями / ценностями, но это не бесспорное, как будет отмечено ниже. В любом случае теория принятия решений - это такая же теория убеждений, желаний и других соответствующих установок, как и теория выбора; важно то, как эти различные отношения (называемые ими «предпочтения») связаны друг с другом.

Основное внимание в этой статье уделяется нормативной теории принятия решений. То есть главный вопрос интереса состоит в том, каким критериям предпочтения агента должны удовлетворять в любых общих обстоятельствах. Это сводится к минимальному учету рациональности, который оставляет в стороне более существенные вопросы о соответствующих ценностях и предпочтениях и разумных убеждениях, учитывая сложившуюся ситуацию. Ключевым вопросом в этом отношении является обработка неопределенности. Ортодоксальная нормативная теория принятия решений, теория ожидаемой полезности (ЕС), по сути, говорит, что в ситуациях неопределенности следует отдавать предпочтение варианту с наибольшей ожидаемой желательностью или ценностью. Этот простой принцип будет в центре нашей дискуссии.

Структура этой записи следующая: в разделе 1 обсуждается базовое понятие «предпочтения над перспективами», которое лежит в основе теории принятия решений. Раздел 2 описывает развитие нормативной теории принятия решений с точки зрения все более мощных и гибких мер предпочтений. В разделе 3 обсуждаются две наиболее известные версии теории ЕС. Раздел 4 рассматривает более широкое значение теории ЕС для практических действий, умозаключений и оценки. Раздел 5 посвящен выдающимся вызовам теории ЕС, а раздел 6 посвящен последовательным решениям и тому, как эта более богатая обстановка влияет на дискуссии о рациональных предпочтениях.

  • 1. Каковы предпочтения перед перспективами?
  • 2. Полезные меры предпочтения

    • 2.1 Порядковые коммунальные услуги
    • 2.2 Кардинализирующая утилита
    • 2.3 Теорема о представлении фон Неймана и Моргенштерна (vNM)
  • 3. Принимать реальные решения

    • 3.1 Теория Сэвиджа
    • 3.2 Теория Джеффри
  • 4. Более широкое значение теории ожидаемой полезности (ЕС)

    • 4.1 Пределы теории ЕС
    • 4.2 О рациональном убеждении
    • 4.3 О рациональном желании
  • 5. Проблемы теории ЕС

    • 5.1 Причинные аномалии
    • 5.2 Об отделимости: отношение риска и сожаления
    • 5.3. О полноте: смутные убеждения и желания
  • 6. Последовательные решения

    • 6.1 Был ли Улисс рациональным?
    • 6.2 Аксиомы ЕС вновь
  • 7. Заключительные замечания
  • Библиография
  • Академические инструменты
  • Другие интернет-ресурсы
  • Связанные Записи

1. Каковы предпочтения перед перспективами?

Два центральных понятия в теории принятия решений - это предпочтения и перспективы (или, что то же самое, варианты). Грубо говоря, мы говорим, что агент «предпочитает» «опцию» (A), а не (B) на тот случай, если для рассматриваемого агента первое предпочтительнее или достойнее выбора, чем второе. Это грубое определение ясно показывает, что предпочтение является сравнительным отношением; это один из вариантов сравнения с точки зрения того, насколько они желательны / достойны выбора. Помимо этого, есть место для споров о том, что на самом деле означают предпочтения перед опционами, или, другими словами, что касается агента (возможно, самого себя), который касается нас, когда мы говорим о его / ее предпочтениях над опциями. В этом разделе рассматриваются некоторые элементарные вопросы интерпретации, которые устанавливают основу для введения (в следующем разделе) таблиц решений и правила ожидаемой полезности, которое для многих является знакомым предметом теории решений. Дальнейшие толковательные вопросы, касающиеся предпочтений и перспектив, будут рассмотрены позже, по мере их возникновения.

Тем не менее давайте продолжим сначала вводить базовые свойства-кандидаты (рационального) предпочтения опционов, а только потом перейдем к вопросам интерпретации. Как отмечено выше, предпочтение касается сравнения вариантов; это отношение между вариантами. Для области опций мы говорим об упорядочении предпочтений агента, то есть об упорядочении опций, которое генерируется предпочтением агента между любыми двумя опциями в этом домене.

В дальнейшем (previousq) представляет слабое отношение предпочтения, т. Е. Отношение «… не является предпочтительным для…». Таким образом, (A / previousq B) означает, что интересующий нас агент считает вариант (B) как минимум столь же предпочтительным, как и вариант (A). Из отношения слабых предпочтений мы можем определить отношение строгих предпочтений (prec) следующим образом: (A / prec B / Rightrightarrow A / previousq B & / \ neg (B / previousq A)), где (neg X) означает «дело не в том, что (X)». Отношение безразличия, (sim), определяется как: (A / sim B / Leftrightarrow A / previousq B & / B / previousq A). Это означает, что интересующий нас агент считает одинаково предпочтительными (A) и (B).

Мы говорим, что (previousq) слабо упорядочивает множество (S) опций всякий раз, когда оно удовлетворяет следующим двум условиям:

Аксиома 1 (Полнота)

Для любого (A, B / in S): либо (A / previousq B), либо (B / previousq A).

Аксиома 2 (Транзитивность)

Для любого (A, B, C / in S): если (A / previousq B) и (B / previousq C), то (A / previousq C).

Вышесказанное можно принять за предварительную характеристику рационального предпочтения опционов. Даже эта ограниченная характеристика является спорной, однако, и указует на расходящиеся интерпретации «предпочтения на перспективах / варианты».

Начните с аксиомы полноты, в которой говорится, что агент может сравнить с точки зрения отношения слабых предпочтений все пары опций в (S). Является ли Полнота вероятным ограничением рациональности, зависит как от того, какие варианты рассматриваются, так и от того, как мы интерпретируем предпочтения по этим вариантам. Если набор опций включает в себя всевозможные положения дел, то полнота не является неотразимой. Например, сомнительно, должен ли агент иметь возможность сравнить вариант, при котором два дополнительных человека в мире становятся грамотными, с вариантом, согласно которому два дополнительных человека достигают шестидесятилетнего возраста. Если, с другой стороны, все варианты в наборе очень похожи друг на друга, скажем, все варианты являются инвестиционными портфелями, то полнота является более убедительной. Но даже если мы не ограничиваем виды рассматриваемых вариантов, вопрос о том, должна ли быть достигнута Полнота, оборачивается смыслом предпочтения. Например, если предпочтения просто представляют поведение выбора или склонности выбора, как они это делают в соответствии с «теорией выявленных предпочтений», популярной среди экономистов (см. Sen 1973), то полнота автоматически удовлетворяется, исходя из предположения, что выбор неизбежно должен быть сделан. Напротив, если предпочтения понимаются скорее как ментальные установки, т. Е. Учитываются суждения о том, является ли тот или иной вариант более предпочтительным или более предпочтительным, чем другой, тогда уместны сомнения в полноте, упомянутые выше (для дальнейшего обсуждения см. Mandler 2001).вопрос о том, должна ли быть завершена полнота или нет, включает значение предпочтения. Например, если предпочтения просто представляют поведение выбора или склонности выбора, как они это делают в соответствии с «теорией выявленных предпочтений», популярной среди экономистов (см. Sen 1973), то полнота автоматически удовлетворяется, исходя из предположения, что выбор неизбежно должен быть сделан. Напротив, если предпочтения понимаются скорее как ментальные установки, т. Е. Учитываются суждения о том, является ли тот или иной вариант более предпочтительным или более предпочтительным, чем другой, тогда уместны сомнения в полноте, упомянутые выше (для дальнейшего обсуждения см. Mandler 2001).вопрос о том, должна ли быть завершена полнота или нет, включает значение предпочтения. Например, если предпочтения просто представляют поведение выбора или склонности выбора, как они это делают в соответствии с «теорией выявленных предпочтений», популярной среди экономистов (см. Sen 1973), то полнота автоматически удовлетворяется, исходя из предположения, что выбор неизбежно должен быть сделан. Напротив, если предпочтения понимаются скорее как ментальные установки, т. Е. Учитываются суждения о том, является ли тот или иной вариант более предпочтительным или более предпочтительным, чем другой, тогда уместны сомнения в полноте, упомянутые выше (для дальнейшего обсуждения см. Mandler 2001).тогда полнота автоматически удовлетворяется при условии, что выбор неизбежно должен быть сделан. Напротив, если предпочтения понимаются скорее как ментальные установки, т. Е. Учитываются суждения о том, является ли тот или иной вариант более предпочтительным или более предпочтительным, чем другой, тогда уместны сомнения в полноте, упомянутые выше (для дальнейшего обсуждения см. Mandler 2001).тогда полнота автоматически удовлетворяется при условии, что выбор неизбежно должен быть сделан. Напротив, если предпочтения понимаются скорее как ментальные установки, т. Е. Учитываются суждения о том, является ли тот или иной вариант более предпочтительным или более предпочтительным, чем другой, тогда уместны сомнения в полноте, упомянутые выше (для дальнейшего обсуждения см. Mandler 2001).

Большинство философов и теоретиков принятия решений присоединяются к последней интерпретации предпочтения как своего рода суждения, которое объясняет, а не тождественно с расположением выбора и результирующим поведением выбора (см., Например, Dietrich and List, 2015). Более того, многие считают, что полнота не требуется рационально; эта рациональность предъявляет требования только к суждениям, которые фактически имеет агент, но ничего не говорит о том, должно ли решение быть вынесено в первую очередь. Тем не менее, следуя Ричарду Джеффри (1983), большинство теоретиков принятия решений предполагают, что рациональность требует, чтобы предпочтения были последовательно расширяемыми. Это означает, что даже если ваши предпочтения не являются полными, должна быть возможность выполнить их, не нарушая ни одного из условий, которые рационально требуются, в частности, переходность.

Это подводит нас к аксиоме Транзитивности, которая гласит, что если опция (B) хотя бы столь же предпочтительна, как (A), а (C) хотя бы так же предпочтительна, как (B), то (A) не может быть строго предпочтительным (C). Недавний вызов Транзитивности включает гетерогенные наборы опций в соответствии с обсуждением полноты выше. Но здесь используется другая интерпретация предпочтений при сравнении вариантов. Идея заключается в том, что предпочтения или суждения о желательности могут зависеть от существенных условий. Например, предположим, что при сравнении автомобилей (A) и (B) наиболее характерной особенностью является то, насколько быстро они могут двигаться, и (B) не хуже, чем (A) в этом отношении, тем не менее, при сравнении автомобилей (B) и (C) наиболее важной особенностью является то, насколько они безопасны, и что (C) не хуже, чем (B) в этом отношении. Более того,при сравнении (A) и (C) наиболее характерной особенностью является их красота. В таком случае некоторые утверждают (например, Темкин 2012), что нет причин, по которым Транзитивность должна выполняться в отношении предпочтений, касающихся (A), (B) и (C). Другие (например, Брум 1991а) утверждают, что Транзитивность является частью самого значения отношения лучше (или объективной сравнительной желательности); если рациональное предпочтение - это суждение о желательности или желательности, то Транзитивность не подлежит обсуждению. Что касается примера автомобиля, Брум будет утверждать, что желательность полностью указанного варианта не должна изменяться, просто в силу того, с чем сравниваются другие варианты. Либо контекст выбора влияет на то, как агент воспринимает выбранный вариант, и в этом случае описание варианта должно отражать это,или же контекст выбора не влияет на опцию. В любом случае, Транзитивность должна быть удовлетворена.

Существует более простая защита транзитивности в предпочтениях; защита, которая зависит от верных потерь, которые могут понести любой, кто нарушает аксиому. Это так называемый аргумент денежного насоса (недавнее обсуждение и пересмотр этого аргумента см. Gustafsson 2010 & 2013). Он основан на предположении, что если вы найдете (X) хотя бы столь же желательным, как (Y), то вы должны быть рады обменять последнее на первое. Предположим, вы нарушаете Транзитивность, т. Е. Для вас: (A / previousq B), (B / previousq C), но (C / prec A). Кроме того, предположим, что у вас есть (A). Тогда вы должны быть готовы обменять (A) на (B). То же самое касается (B) и (C): вы должны быть готовы обменять (B) на (C). Вы строго предпочитаете (A) (C), поэтому вы должны быть готовы обменять (C) плюс некоторую сумму ($ x) на (A). Но теперь вы находитесь в той же ситуации, с которой начинали, имея (A), но не (B) и (C), за исключением того, что вы потеряли ($ x)! Таким образом, в нескольких шагах, каждый из которых соответствовал вашим предпочтениям, вы попадаете в ситуацию, которая по вашим собственным условиям явно хуже вашей исходной ситуации. Картина станет более драматичной, если мы представим, что процесс можно повторить, превратив вас в «денежный насос». Следовательно, аргумент гласит, что в ваших непереходных предпочтениях есть что-то (инструментально) иррациональное. Если бы ваши предпочтения были переходными, то вы не были бы уязвимы в выборе доминирующего варианта и в качестве денежного насоса. Поэтому ваши предпочтения должны быть переходными.каждая из которых соответствовала вашим предпочтениям, вы попали в ситуацию, которая, по вашим собственным взглядам, явно хуже вашей исходной ситуации. Картина станет более драматичной, если мы представим, что процесс можно повторить, превратив вас в «денежный насос». Следовательно, аргумент гласит, что в ваших непереходных предпочтениях есть что-то (инструментально) иррациональное. Если бы ваши предпочтения были переходными, то вы не были бы уязвимы в выборе доминирующего варианта и в качестве денежного насоса. Поэтому ваши предпочтения должны быть переходными.каждая из которых соответствовала вашим предпочтениям, вы попали в ситуацию, которая, по вашим собственным взглядам, явно хуже вашей исходной ситуации. Картина станет более драматичной, если мы представим, что процесс можно повторить, превратив вас в «денежный насос». Следовательно, аргумент гласит, что в ваших непереходных предпочтениях есть что-то (инструментально) иррациональное. Если бы ваши предпочтения были переходными, то вы не были бы уязвимы в выборе доминирующего варианта и в качестве денежного насоса. Поэтому ваши предпочтения должны быть переходными.есть что-то (инструментально) иррациональное в ваших непереходных предпочтениях. Если бы ваши предпочтения были переходными, то вы не были бы уязвимы в выборе доминирующего варианта и в качестве денежного насоса. Поэтому ваши предпочтения должны быть переходными.есть что-то (инструментально) иррациональное в ваших непереходных предпочтениях. Если бы ваши предпочтения были переходными, то вы не были бы уязвимы в выборе доминирующего варианта и в качестве денежного насоса. Поэтому ваши предпочтения должны быть переходными.

Хотя вышеупомянутые противоречия не были урегулированы, в оставшейся части данной статьи будут сделаны следующие допущения: i) объекты предпочтения могут представлять собой неоднородные перспективы, включающие в себя богатую и разнообразную область свойств, ii) предпочтение между вариантами является суждением сравнительной желательности или возможности выбора, и iii) предпочтения удовлетворяют как транзитивности, так и полноте (хотя последнее условие будет пересмотрено в разделе 5). Вопрос, который сейчас возникает, заключается в том, существуют ли дополнительные общие ограничения на рациональное предпочтение опционов.

2. Полезные меры предпочтения

В нашем продолжающемся исследовании рациональных предпочтений над перспективами числовое представление (или измерение) предпочтений предпочтений станет важным. Рассматриваемые числовые меры известны как функции полезности. Двумя основными типами функций полезности, которые будут играть роль, являются порядковая функция полезности и более полезная интервальная (или кардинальная) функция полезности.

2.1 Порядковые коммунальные услуги

Оказывается, что пока множество перспектив / опций (S) конечно, любой слабый порядок опций в (S) может быть представлен порядковой функцией полезности. Чтобы быть точным, скажем, что (u) является функцией полезности с областью (S). Мы говорим, что функция (u) представляет предпочтение (previousq) между опциями в (S) на всякий случай:

(tag {1} text {Для любого} A, B / in S: u (A) leq u (B) Leftrightarrow A / previousq B)

Еще один способ выразить это состоит в том, что, когда вышеупомянутое имеет место, отношение предпочтения может быть представлено как максимизирующая полезность, так как оно всегда предпочитает вариант с наивысшей полезностью.

Единственная информация, содержащаяся в обычном служебном представлении, - это то, как агент, чьи предпочтения представляются, выбирает варианты заказов, от наименее до наиболее предпочтительных. Это означает, что если (u) является порядковой функцией полезности, которая представляет порядок (previousq), то любая вспомогательная функция (u '), которая является порядковым преобразованием (u), то есть любое преобразование (u), которое также удовлетворяет биконусловию в (1) -представляет (previousq) так же, как и (u). Следовательно, мы говорим, что порядковая функция полезности уникальна только с точностью до порядковых преобразований.

Упомянутый выше результат можно суммировать следующим образом:

Теорема 1 (Порядковое представление). Пусть (S) - конечное множество, а (previousq) - слабое отношение предпочтений на (S). Тогда есть порядковая функция полезности, которая представляет (previousq) на случай, если (previousq) полна и транзитивна.

Эта теорема не должна быть слишком удивительной. Если (previousq) завершен и транзитивен над (S), то параметры в (S) можно расположить в порядке, от наиболее предпочтительного до наименее предпочтительного, где некоторые параметры могут совпадать положение (если они считаются одинаково желательными), но там, где нет циклов или петель. Теорема 1 просто говорит о том, что мы можем присвоить номера опциям в (S) таким образом, чтобы представить этот порядок. (Для простого доказательства теоремы 1, за исключением строгого, а не слабого отношения предпочтений, обратитесь к Peterson 2009: 95.)

Обратите внимание, что обычные утилиты, так сказать, не очень математически «мощные». Например, не имеет смысла сравнивать вероятностные ожидания различных наборов порядковых утилит. Например, рассмотрим следующие две пары перспектив: элементам первой пары назначены порядковые утилиты 2 и 4, а элементам второй пары назначены порядковые утилиты 0 и 5. Укажем «плоское» распределение вероятностей. в каждом случае так, что каждому элементу в двух парах соответствует вероятность 0,5. Относительно этого вероятностного назначения ожидание первой пары порядковых утилит равно 3, что больше 2,5, ожидание второй пары. Тем не менее, когда мы преобразуем порядковые утилиты допустимым образом, например, увеличивая максимальную полезность во второй паре с 5 до 10, порядок ожиданий меняется; теперь сравнение между 3 и 5. Значение этого пункта станет более ясным в дальнейшем, когда мы перейдем к сравнительной оценке лотерей и рискованного выбора. Интервалозначная или кардинальная функция полезности необходима для последовательной оценки лотереи / рискованных перспектив. Точно так же, для построения или концептуализации основной функции полезности обычно обращаются к предпочтениям по сравнению с лотереями. Интервалозначная или кардинальная функция полезности необходима для последовательной оценки лотереи / рискованных перспектив. Точно так же, для построения или концептуализации основной функции полезности обычно обращаются к предпочтениям по сравнению с лотереями. Интервалозначная или кардинальная функция полезности необходима для последовательной оценки лотереи / рискованных перспектив. Точно так же, для построения или концептуализации основной функции полезности обычно обращаются к предпочтениям по сравнению с лотереями.

2.2 Кардинализирующая утилита

Чтобы получить кардинальное (интервальное) полезное представление порядка предпочтения, т. Е. Меры, которая представляет собой не только то, как агент упорядочивает опции, но и что-то говорит о десиралистическом «расстоянии» между опциями, нам нужна более богатая настройка.; набор параметров и соответствующий порядок предпочтений должны иметь большую структуру, чем для обычного показателя полезности. Один из таких отчетов, благодаря Джону фон Нейману и Оскару Моргенштерну (1944), будет подробно описан ниже. На данный момент полезно сосредоточиться на том варианте, который является ключевым для понимания и построения основной функции полезности: лотереи. [1]

Рассмотрим сначала порядок по трем регулярным вариантам, например, по трем направлениям отдыха Амстердам, Бангкок и Кардифф, обозначенные (A), (B) и (C) соответственно. Предположим, что вы предпочитаете порядок (A / prec B / prec C). Этой информации достаточно для представления вашего суждения; Напомним, что любое назначение утилит в таком случае является приемлемым, если (C) получает более высокое значение, чем (B), которое получает более высокое значение, чем (A). Но, возможно, мы хотим знать больше, чем можно понять из такой функции полезности - мы хотим знать, насколько (C) предпочтительнее, чем (B), по сравнению с тем, насколько (B) предпочтительнее, чем (А). Например, может случиться так, что Бангкок считается почти таким же желанным, как и Кардифф, но Амстердам, по большому счету, сильно отстает от Бангкока. Или, может быть, Бангкок лишь немного лучше, чем Амстердам,по сравнению с тем, насколько Кардифф лучше, чем Бангкок. Такого рода информация об относительном расстоянии между вариантами с точки зрения степени предпочтения или желательности - это именно то, что дается функцией полезности с интервальным значением. Проблема в том, как установить эту информацию.

Чтобы решить эту проблему, Рамси (1926), а затем фон Нейман и Моргенштерн (в дальнейшем vNM) сделали следующее предложение: мы строим новый вариант лотереи, (L), который имеет (A) и (C) как возможные «призы», и мы выясним, какая вероятность должна быть у лотереи для (C), чтобы вы были равнодушны между этой лотереей и праздником в Бангкоке. Основная идея заключается в том, что ваше суждение о Бангкоке относительно Кардиффа, с одной стороны, и Амстердама, с другой, может быть измерено рискованностью лотереи (L) с участием Кардиффа и Амстердама, которую вы считаете столь же желанной, как и Бангкок. Например, если вы безразличны между Бангкоком и лотереей, которая дает очень низкий шанс выиграть поездку в Кардифф, то вы, очевидно, не считаете Бангкок намного лучше, чем Амстердам, по сравнению с Кардиффом; для тебя,даже небольшого улучшения Амстердама, то есть лотереи с небольшим шансом Кардиффа, а не Амстердама, достаточно, чтобы соответствовать Бангкоку.

Приведенный выше анализ предполагает, что лотереи оцениваются с точки зрения их ожидаемой ценности выбора или желательности. То есть желательность лотереи - это, по сути, сумма шансов каждого приза, умноженная на желательность этого приза. Рассмотрим следующий пример. Предположим, вы равнодушны к лотерее (L) и выходному дню в Бангкоке (B), когда вероятность выигрыша в лотерее в Кардиффе равна (3/4). Назовите эту конкретную лотерею (L '). Идея заключается в том, что Бангкок находится в трех четвертях пути вверх по шкале желательности, где Амстердам внизу и Кардифф вверху. Если мы оговорим, что (u (A) = 0) и (u (C) = 1), то (u (B) = u (L ') = 3/4). Это соответствует ожидаемой желательности или, как ее обычно называют, ожидаемой полезности лотереи, так как (u (L ')) = 1/4 / cdot 0 + 3/4 / cdot 1 = 3/4). Таким образом, стоимость лотереи представляет собой взвешенную по вероятности сумму утилит ее призов, где вес каждого приза определяется вероятностью того, что лотерея приведет к получению этого приза.

Таким образом, мы видим, что мера полезности с интервалом по опционам может быть построена путем введения опционов лотереи Как следует из названия, мера полезности с интервалами передает информацию об относительных размерах интервалов между вариантами в соответствии с некоторой шкалой желательности. То есть утилиты становятся уникальными после того, как мы зафиксировали начальную точку нашего измерения и единичную шкалу желательности. В приведенном выше примере мы могли бы, например, присвоить значение полезности от 1 до (A) и от 5 до (C), и в этом случае нам бы пришлось присвоить значение полезности от 4 до (B), так как 4 составляет 3/4 пути между 1 и 5. Другими словами, как только мы присвоили служебные значения (A) и (C), полезность (L ') и, таким образом, (B) была определена. Назовем эту вторую функцию полезности (u '). Это связано с нашей исходной функцией следующим образом: (u '= 4 / cdot u +1). Это отношение всегда сохраняется между двумя такими функциями: если (u) является служебной функцией с интервальным значением, которая представляет порядок предпочтений, (previousq), и (u ') является другой вспомогательной функцией, которая также представляет этот порядок, то есть константы (a) и (b), где (a) должны быть положительными, так что (u '= a / cdot u + b). Это означает, что интервальные функции полезности являются уникальными только с точностью до положительного линейного преобразования.тогда существуют константы (a) и (b), где (a) должны быть положительными, такими, что (u '= a / cdot u + b). Это означает, что интервальные функции полезности являются уникальными только с точностью до положительного линейного преобразования.тогда существуют константы (a) и (b), где (a) должны быть положительными, такими, что (u '= a / cdot u + b). Это означает, что интервальные функции полезности являются уникальными только с точностью до положительного линейного преобразования.

Прежде чем завершить это обсуждение полезности измерений, следует упомянуть два связанных ограничения в отношении информации, передаваемой такими мерами. Во-первых, поскольку полезности опций, будь то порядковые или интервальные значения, могут быть определены только относительно утилит других опций, не существует такой вещи, как абсолютная полезность опциона, по крайней мере, без дополнительных предположений. [2]Во-вторых, по тем же соображениям, ни интервальные, ни порядковые меры полезности, как обсуждалось здесь, не являются межличностными соизмеримыми в отношении уровней и единиц полезности. В качестве быстрой иллюстрации предположим, что и у вас, и у меня есть порядок предпочтений, описанный выше по сравнению с вариантами выходных: (A / prec B / prec C). Предположим также, что, как указано выше, мы оба безразличны между (B) и лотереей (L '), которая имеет (3/4) шанс на получение (C) и (1/4) шанс уступить (A). Можем ли мы тогда сказать, что предоставление мне Кардиффа и вам Бангкока равняется той же сумме «полной желательности», что и предоставление вам Кардиффа и меня Бангкока? Мы не имеем права говорить это. Наш общий порядок предпочтений, например,в соответствии с моим поиском отпуска в Кардиффе, мечта сбылась, а ты просто находишь это лучшим из плохих. Более того, мы даже не имеем права утверждать, что разница в желательности между Бангкоком и Амстердамом для вас такая же, как и для меня. По моему мнению, желательность этих трех вариантов может варьироваться от живого ада до воплощения мечты, в то время как, по вашему мнению, от плохого до весьма плохого; Обе оценки соответствуют приведенному выше порядку предпочтений. На самом деле, то же самое может относиться к нашим предпочтениям по всем возможным вариантам, включая лотереи: даже если мы разделили один и тот же общий порядок предпочтений, это может быть случай, когда вы просто отрицательно настроены, не находя такой вариант, как здорово, пока я Я очень экстремален - нахожу одни варианты превосходными, а другие - просто пыткой. Следовательно, функции полезности,будь то интервал или порядковый номер, не допускайте значимых межличностных сравнений. (Elster and Roemer 1993 содержит ряд статей, посвященных этим вопросам; см. Также статью SEP по теории социального выбора.)

2.3 Теорема о представлении фон Неймана и Моргенштерна (vNM)

В последнем разделе было представлено представление полезности человека по сравнению с лотереями с интервальной оценкой при условии, что лотереи оцениваются с точки зрения ожидаемой полезности. Некоторые могут найти это немного быстро. Почему мы должны предполагать, что люди оценивают лотереи с точки зрения их ожидаемой полезности? Теорема vNM эффективно увеличивает пробелы в рассуждениях, переключая внимание обратно на отношение предпочтений. В дополнение к Транзитивности и Полноте, vNM вводит дополнительные принципы, управляющие рациональными предпочтениями по сравнению с лотереями, и показывает, что предпочтения агента могут быть представлены как максимизация ожидаемой полезности, когда ее предпочтения удовлетворяют этим принципам.

Давайте сначала определим в формальных терминах ожидаемую полезность лотереи: пусть (L_i) будет лотереей из набора (bL) лотерей, а (O_ {ik}) - результат, или выигрыш лотереи (L_i), возникающий с вероятностью (p_ {ik}). Ожидаемая полезность (L_i) тогда определяется как:

Уравнение vNM

[EU (L_i) dot = / sum_k u (O_ {ik}) cdot p_ {ik})

Сделанное ранее предположение теперь может быть формально сформулировано так:

begin {уравнение} tag {2} text {для любого} L_i, L_j / in / bL: L_i / previousq L_j / Rightrightarrow EU (L_i) leq EU (L_j) end {уравнение}

Когда вышесказанное выполняется, мы говорим, что есть ожидаемая функция полезности, которая представляет предпочтения агента; другими словами, агент может быть представлен как максимизация ожидаемой полезности.

Вопрос, который адрес vNM: что за предпочтения могут быть представлены таким образом? Чтобы ответить на этот вопрос, мы должны вернуться к основному отношению предпочтений (previousq) над набором опций, в данном случае с лотереями. Теорема vNM требует, чтобы множество (bL) лотерей было довольно обширным: оно закрыто в «смеси вероятностей», то есть если (L_i, L_j / in / bL), то составные лотереи, которые имеют (L_i) и (L_j) в качестве возможных призов также есть в (bL). (Другое техническое предположение, которое не будет обсуждаться подробно, заключается в том, что сложные лотереи всегда могут быть сведены, в соответствии с законами вероятности, к простым лотереям, в которых участвуют только основные призы.)

Основное ограничение рациональности отношения предпочтения уже обсуждалось - оно слабо упорядочивает варианты (то есть удовлетворяет транзитивности и полноте). Следующие обозначения будут использоваться для введения двух дополнительных аксиом предпочтения vNM: ({pA, (1-p) B }) обозначает лотерею, которая приводит либо к (A), с вероятностью (p) или (B), с вероятностью (1-p).

Аксиома 3 (непрерывность)

Предположим, (A / previousq B / previousq C). Тогда существует (p / in [0,1]) такое, что:

({pA, (1-p) C } sim B)

Аксиома 4 (Независимость)

Предположим, (A / previousq B). Тогда для любого (C) и любого (p / in [0,1]):

({pA, (1-p) C } previousq {pB, (1-p) C })

Непрерывность подразумевает, что ни один исход не является настолько плохим, что вы не захотите пойти на какую-то авантюру, которая может привести к тому, что вы закончите с таким исходом, но в противном случае вы можете получить более благоприятный исход, исходя из ваших нынешних источников, при условии, что шансы на лучший результат достаточно хороши. Интуитивно понятно, что Continuity гарантирует, что оценки лотерей, проводимые агентом, должным образом чувствительны к вероятностям выигрышей в лотереях. Это также гарантирует, как следует из названия, что достаточно богатое упорядочение предпочтений по сравнению с лотереями может быть представлено непрерывной кардинальной функцией.

Независимость подразумевает, что когда две альтернативы имеют одинаковую вероятность для какого-то конкретного результата, наша оценка двух альтернатив должна быть независимой от нашего мнения об этом конкретном результате. Интуитивно это означает, что предпочтения между лотереями должны регулироваться только особенностями лотерей, которые различаются; общие черты между лотереями должны быть эффективно проигнорированы. Порядок предпочтений должен удовлетворять некоторой версии аксиомы Независимости, чтобы можно было представить ее как максимизирующую так называемую аддитивно разделимую функцию; в частности, функция, в соответствии с которой значение (т. е. ожидаемая полезность) опциона представляет собой (взвешенную по вероятности) сумму значений его возможных результатов.

Некоторые люди считают аксиому непрерывности неразумным ограничением рациональных предпочтений. Есть ли вероятность (p), что вы готовы принять азартную игру, в которой есть вероятность того, что вы потеряете свою жизнь, и вероятность ((1-p)) выиграть 10 долларов? Многие думают, что нет. Однако те же самые люди, вероятно, переходят улицу, чтобы получить 10-долларовую купюру, которую они сбросили. Но это всего лишь игра в азартные игры, которая имеет очень малую вероятность быть убитым автомобилем, но гораздо более высокую вероятность получить 10 долларов! В более общем смысле, хотя люди редко думают об этом таким образом, они постоянно берут на себя азартные игры, которые имеют ничтожные шансы привести к неизбежной смерти и, соответственно, очень высоки шансы на какое-то скромное вознаграждение. Каждый раз, когда мы идем гулять, водить машину, летать куда-то и так далее,есть вероятность того, что у нас случится несчастный случай со смертельным исходом. Но поскольку вероятность этих несчастных случаев достаточно мала, мы решаем воспользоваться нашими шансами.

Независимость кажется обязательным требованием рациональности, если рассматривать ее абстрактно. Тем не менее, есть известные примеры, когда люди часто нарушают Независимость, не выглядя иррациональными. Эти примеры включают взаимодополняемость между возможными результатами лотереи. Особенно известным таким примером является так называемый парадокс Алле, который французский экономист Морис Алле (1953) впервые представил в начале 1950-х годов. Парадокс включает сравнение предпочтений людей по двум парам лотерей, аналогичных приведенным в таблице 1. Лотереи описываются в терминах призов, связанных с конкретными пронумерованными билетами, где один билет будет разыгран случайным образом (например, (L_1) дает выигрыш в размере 2500 долларов США, если разыгран один из билетов с номерами 2–34).

1 2-34 35-100
(L_1) $ 0 $ 2500 $ 2400
(L_2) $ 2400 $ 2400 $ 2400
1 2-34 35-100
(L_3) $ 0 $ 2500 $ 0
(L_4) $ 2400 $ 2400 $ 0

Таблица 1. Парадокс Алле

В этой ситуации многие люди строго предпочитают (L_2), чем (L_1), но также (L_3), чем (L_4) (что подтверждается их поведением выбора, а также их показаниями), пару предпочтения, которые будут называться предпочтениями Allais. [3] Распространенный способ рационализировать предпочтения Allais, заключается в том, что в ситуации с первым выбором риск не получить ничего, когда можно было бы получить 2400 долларов, не оправдывает увеличение шансов на более высокий выигрыш. Однако во второй ситуации выбора минимальный выигрыш составляет $ 0 независимо от того, какой выбор сделать. Поэтому в этом случае многие думают, что небольшой дополнительный риск в 0 долларов стоит шанса на лучший приз.

Хотя приведенные выше рассуждения могут показаться убедительными, предпочтения Алле находятся в противоречии с аксиомой независимости. Следующее верно для обеих ситуаций выбора: независимо от того, какой выбор вы сделаете, вы получите один и тот же приз, если будет разыгран один из билетов в последнем столбце. Следовательно, Независимость подразумевает, что как ваши предпочтения между (L_1) и (L_2), так и ваши предпочтения между (L_3) и (L_4) должны быть независимыми от призов в этом столбце. Но когда вы игнорируете последний столбец, (L_1) становится идентичным (L_3) и (L_2) - (L_4). Следовательно, если вы предпочитаете (L_2), а не (L_1), а (L_3), а не (L_4), в вашем порядке предпочтений может возникнуть несогласованность. И там однозначно есть нарушение Независимости. В результате пара обсуждаемых предпочтений не может быть представлена как максимизирующая ожидаемую полезность. (Таким образом, «парадокс»:многие думают, что независимость является требованием рациональности, но, тем не менее, также хотят утверждать, что в предпочтениях Аллеа нет ничего иррационального.)

Теоретики принятия решений по-разному отреагировали на парадокс Алле. Эта проблема будет вновь рассмотрена в разделе 5.2, когда будут обсуждаться проблемы теории ЕС. Настоящая цель состоит в том, чтобы просто показать, что непрерывность и независимость являются непреодолимыми ограничениями на рациональные предпочтения, хотя и не без их хулителей. Доказанный результат vNM можно обобщить следующим образом:

Теорема 2 (фон Неймана-Моргенштерна).

Пусть (bO) - конечный набор результатов, (bL) - набор соответствующих лотерей, замкнутый по вероятностной смеси, и (previousq) - слабое отношение предпочтений. на (bL). Тогда (previousq) удовлетворяет аксиомам 1–4 тогда и только тогда, когда существует функция (u) из (bO) в набор действительных чисел, единственная с точностью до положительного линейного преобразования, и относительно которого (previousq) может быть представлен как максимизация ожидаемой полезности.

Дэвид Крепс (1988) дает доступную иллюстрацию доказательства этой теоремы. Доказательство проводится в два этапа: сначала доказывается существование интервальной функции полезности, удовлетворяющей аксиомам предпочтения (это функция полезности, которая оценивает лотереи с точки зрения их ожидаемой полезности, как описано ранее). Тогда единственность этой полезной меры (с точностью до положительного линейного преобразования) доказана.

3. Принимать реальные решения

Теорема vNM является очень важным результатом для измерения силы предпочтений рационального агента перед определенными вариантами (лотереи эффективно способствуют кардинальному измерению над определенными вариантами). Но это не дает нам возможности принимать рациональные решения в реальном мире; у нас еще нет теории принятия решений. Теорема ограничивается оценкой вариантов, которые приходят с объективным распределением вероятности по результатам - теоретики и экономисты, принимающие решения о ситуации, часто описывают как «выбор под риском» (Knight, 1921).

В большинстве обычных ситуаций выбора объекты выбора, над которыми мы должны иметь или формировать предпочтения, не такие. Скорее, лица, принимающие решения, должны консультироваться со своими собственными убеждениями относительно вероятности того, что тот или иной результат будет результатом определенного варианта. Решения в таких обстоятельствах часто описываются как «выбор в условиях неопределенности» (Knight 1921). Например, рассмотрим затруднительное положение альпиниста, решающего, делать ли опасное восхождение на вершину, где ключевым фактором для нее является погода. Если ей повезет, она может иметь доступ к полной статистике погоды для региона. Тем не менее, статистика погоды отличается от лотереи тем, что она не определяет вероятности возможных результатов попыток, а не попыток саммита в определенный день. Не в последнюю очередь,альпинист должен учитывать, насколько она уверена в альт ="

Рисунок 1. Решение проблемы Улисса

Нам говорят, что перед тем, как отправиться в путь, Улисс предпочел бы свободно услышать сирены и вернуться домой на Итаку. Проблема в том, что Улисс предсказывает, что его будущее я не подчинится: если он отплывает безудержно, то позже он будет соблазнен сиренами и на самом деле не останется домом для Итаки, а скорее останется на острове до бесконечности. Поэтому Улисс считает, что было бы лучше быть привязанным к мачте, потому что он предпочел бы стыд и дискомфорт от привязанности к мачте и превращения его в дом, чтобы оставаться на острове сирен навсегда.

Нельзя отрицать, что Улисс делает мудрый выбор, будучи привязанным к мачте. Некоторые считают, однако, что Улисс вряд ли является образцовым агентом - в конце концов, он должен играть против своего будущего я, которое будет невольно соблазнено сиренами. В то время как Улисс является рациональным по стандартам статических решений, мы можем считать его иррациональным по стандартам последовательных решений. Чтобы быть рациональным в последовательном или динамическом смысле, Улисс должен был бы продемонстрировать непрерывную рациональность в течение продолжительного периода времени: он должен был бы, скажем, действовать как максимизатор ЕС во всех точках выбора и, кроме того, не подвергаться каким-либо ошибочным изменениям убеждение или желание, т. е. изменения, которые не соответствуют стандартному правилу обучения байесовской обусловленности (который гласит, что при изучении некоторого предложения убеждения обновляются до соответствующих условных вероятностей). Другими словами, можно утверждать, что модель последовательного решения решает вопросы рациональности во времени.

Хотя рациональность с течением времени может иметь некоторое значение (например, позволяя нам идентифицировать последовательное поведение), на самом деле важно то, как агент должен действовать в любой данный момент времени. С этой целью модель последовательного решения более плодотворно рассматривается как инструмент, помогающий определить рациональный выбор в конкретный момент времени, так же как и модель статического решения. Последовательное дерево решений - это эффективный способ визуализации временных рядов выборов и обучающих событий, с которыми агент полагает, что он / она столкнется в будущем, в зависимости от того, какую часть дерева решений он / она найдет сам. Таким образом, ключевой вопрос заключается в следующем: как агент должен выбирать среди своих первоначальных вариантов в свете своего прогнозируемого дерева решений? Этот вопрос вызвал удивительное количество противоречий. В литературе появилось три основных подхода к согласованию последовательных деревьев решений. Это наивный или близорукий подход, сложный подход и решительный подход. Они будут обсуждаться по очереди, и будет предложено, чтобы споры не были существенными, а скорее указывали на тонкие различия в интерпретации последовательных моделей принятия решений.

Так называемый наивный подход к согласованию последовательных решений служит полезным контрастом с двумя другими подходами. Наивный агент предполагает, что возможен любой путь через дерево решений, и поэтому отправляется в тот путь, который является оптимальным, учитывая его / ее нынешнее отношение. Например, наивный Улисс просто предположил бы, что у него есть три общих стратегии на выбор: либо приказ экипажа привязать его к мачте, либо не издавать такой приказ, а затем останавливаться на острове сирен, либо не издавать такой приказ и позже придерживаюсь его курса. Улисс предпочитает исход, связанный с последней комбинацией, и поэтому он начинает эту стратегию, не приказывая команде сдерживать его. В таблице 5 представлен статический аналог решения наивного Улисса. В результате,эта модель принятия решений не учитывает нынешние знания Улисса о его будущих предпочтениях, и, следовательно, рекомендует, чтобы он выбрал вариант, который, по прогнозам, невозможен.

акт результат
порядок привязки к мачте добраться до дома, некоторое унижение
плавать без ограничений и остаться с сиренами жизнь с сиренами
плыть без ограничений, а затем домой в Итаку добраться до дома, без унижения

Таблица 5. Наивное решение проблемы Улисса

Нет необходимости трудиться над тем, что наивный подход к последовательному выбору удачно назван. Отличительной чертой сложного подхода, напротив, является его акцент на обратном планировании: сложный выборщик не предполагает, что будут возможны все пути через дерево решений или, другими словами, все возможные комбинации выбора в различных узлах выбора., Агент скорее рассматривает то, что он / она будет склонен выбирать в более поздних узлах выбора, когда он / она доберется до рассматриваемой временной позиции. Изощренный Улисс примет к сведению тот факт, что, если он достигнет острова безудержных сирен, он захочет остановиться там на неопределенный срок из-за преобразующего влияния песни сирен на его предпочтения. Затем это отражается в статическом представлении проблемы решения, согласно Таблице 6. Государства здесь касаются будущих предпочтений Улисса, как только он достигнет острова. Поскольку второе состояние имеет нулевую вероятность, действия решаются на основе первого состояния, поэтому Улисс мудро выбирает быть привязанным к мачте.

акт позже выберите сирены ((p = 1)) позже выберите Итака ((p = 0))
порядок привязки к мачте домой, некоторое унижение домой, некоторое унижение
плавать без ограничений жизнь с сиренами дома, без унижения

Таблица 6. Изощренная проблема решения Улисса

Решительный выбор отклоняется от сложного выбора только при определенных условиях, которые не выполняются Улиссом, учитывая его необъяснимое изменение в отношениях. Защитники решительного выбора обычно защищают теории принятия решений, которые нарушают принцип аксиомы Независимости / принцип «Конечно» (особенно McClennen 1990 и Machina 1989; см. Также Rabinowicz 1995 для обсуждения), и призывают к решительному выбору, чтобы сделать свою теорию решений более приемлемой в последовательном контексте, В соответствии с решительным выбором, в соответствующих контекстах (включая предпочтения, которые являются стабильными, но которые нарушают Независимость), агент должен рассчитывать на простое соблюдение стратегии, которая изначально считалась лучшей во всех будущих узлах выбора. Вопрос в том, имеет ли смысл решительный подход, учитывая стандартную интерпретацию модели последовательного решения. Может ли агент действительно рассчитывать на выбор против своих предпочтений в определенный момент времени, чтобы выполнить старый план? Это может показаться случаем падения из-за ошибочной стоимости. Конечно, агент может придавать большое значение выполнению предыдущих обязательств. Однако любые подобные сомнения в честности должны быть отражены в реальных предпочтениях агента на данный момент. Это сильно отличается от того, чтобы не идти в ногу со всеми предпочтениями, которые учитываются во всем.в то время, о котором идет речь. Это сильно отличается от того, чтобы не идти в ногу со всеми предпочтениями, которые учитываются во всем.в то время, о котором идет речь. Это сильно отличается от того, чтобы не идти в ногу со всеми предпочтениями, которые учитываются во всем.

Возможно, защитники решительного выбора на самом деле имеют в виду другую интерпретацию последовательных моделей принятия решений, согласно которой будущие «точки выбора» на самом деле не являются точками, в которых агент может выбирать в соответствии со своими предпочтениями в данный момент. Если это правильно, это означает изменение вопроса или проблемы интереса. В дальнейшем будет принята стандартная интерпретация последовательных моделей принятия решений, и, кроме того, предполагается, что рациональные агенты рассуждают о таких решениях изощренным образом (согласно Леви 1991, Махер 1992, Сейденфельд 1994, среди других).

6.2 Аксиомы ЕС вновь

Мы видели, что последовательные деревья решений могут помочь агенту, подобному Улиссу, оценить последствия своего текущего выбора, чтобы он мог лучше подумать о том, что делать сейчас. Литература о последовательном выборе, в первую очередь, связана с более амбициозными вопросами. Действительно, последовательная установка эффективно предлагает новые способы «проверить» теории рационального предпочтения, а также рационального изменения веры / желания. Это контролируемые тесты, в которых предполагается, что агент прогнозирует стабильные предпочтения во времени, т. Е. Он не ожидает, что его порядок предпочтений по сравнению с конечными результатами изменится, за исключением тех способов, которые соответствуют его правилу изменения убеждений / желаний. Строго говоря, то, что подвергается проверке, это целый пакет правил принятия решений плюс правила обучения. На практике оба рассматриваются отдельно:различные правила принятия решений сравниваются в предположении, что обучение осуществляется с помощью байесовской обусловленности, или же различные правила обучения сравниваются в предположении, что агент максимизирует ожидаемую полезность. Вопрос заключается в том, является ли решение или правило обучения агента самоубийственным (или, другими словами, динамически непоследовательным), в некотором смысле, в последовательной настройке.

Давайте сначала рассмотрим аргумент последовательного решения для обучения в ответ на новые доказательства с помощью байесовской обусловленности, поскольку он служит полезным сравнением для других последовательных аргументов. Skyrms (1993) представляет такой аргумент; это, пожалуй, самая изощренная версия аргумента так называемой «диахронической голландской книги», согласно которому условность является единственным правилом рационального обучения. Предполагается, что агент - это максимизатор ожидаемой полезности, который применяет сложный (обратный подход) подход к последовательным решениям проблем. Скайрмс показывает, что любой такой агент, который планирует учиться таким образом, который расходится с условными выражениями, будет делать самоубийственные выборы в некоторых специально вымышленных последовательных ситуациях принятия решений. В отличие от этого, хороший кондиционирующий агент никогда не сделает такой выбор. Тип «саморазрушительного выбора», о котором идет речь, - это те, которые равносильны проигрышу. Таким образом, агент выбирает стратегию, которая, несомненно, хуже его собственных источников, чем другую стратегию, которую она могла бы выбрать в противном случае, если бы только ее правило обучения было таким, что она могла бы выбирать по-разному в одном или нескольких будущих узлах выбора.

Аналогичный аргумент может быть использован для защиты предпочтений ЕС. В этом случае мы предполагаем, что правилом обучения агента является условность; Более того, мы по-прежнему предполагаем, что агент имеет стабильные предпочтения и использует сложный подход к последовательным решениям проблем. Хаммонд (1976, 1977, 1988b, c) приводит аргумент «динамической согласованности» для теории ЕС, который аналогичен приведенному выше для условной теории; он показывает, что только предпочтения со структурой ЕС таковы, что агент может планировать следовать по любому пути в последовательном дереве решений, который агент считает оптимальным с исходного узла выбора. В отличие от других структур предпочтений (правил принятия решений), предпочтения ЕС никогда не приводят к «саморазрушающему выбору»,в том смысле, что агент вынужден выбирать стратегию, которая хуже его собственных источников, чем другая стратегия, которую он мог бы выбрать в противном случае, если бы только его предпочтения были таковы, что он будет выбирать по-другому в будущих узлах выбора.

Аргумент Хаммонда относительно теории ЕС и понятие динамической согласованности, к которому он обращается, подвергался критике с разных сторон, как теми, кто защищает теории, которые нарушают аксиому Независимости, но сохраняют аксиомы полноты и транзитивности (т.е. упорядоченности) теории ЕС, и те, кто защищает теории, которые нарушают последнее (обсуждение см. Стил 2010). Подход, использованный некоторыми защитниками теорий, нарушающих независимость (в частности, Machina 1989 и McClennen 1990), уже упоминался: они отвергают предположение о сложном выборе, который приводит в движение аргументы динамической согласованности. Seidenfeld (1988a, b, 1994, 2000a, b) скорее отвергает понятие динамической согласованности Хаммонда в пользу более тонкого понятия, которое различает теории, которые нарушают порядок и те, которые нарушают только независимость; бывший,в отличие от последнего, пройдите тест Зайденфельда. Этот аргумент также не без критиков (см. McClennen 1988, Hammond 1988a, Rabinowicz 2000). Обратите внимание, что издержки любого отклонения от теории ЕС хорошо подчеркнуты Al-Najjar and Weinstein (2009) и Kadane et al. (2008), в частности, возможность отвращения к бесплатной информации и отвращение к возможностям для более широкого выбора в будущем.

7. Заключительные замечания

Давайте в заключение суммируем основные причины, по которым теория принятия решений, описанная выше, представляет философский интерес. Во-первых, теория нормативных решений - это (минимальная) теория практической рациональности. Цель состоит в том, чтобы охарактеризовать отношение агентов, которые являются практически рациональными, и обычно приводятся различные (статические и последовательные) аргументы, чтобы показать, что определенные практические катастрофы случаются с агентами, которые не удовлетворяют стандартным теоретическим ограничениям принятия решений. Во-вторых, многие из этих ограничений касаются убеждений агентов. В частности, нормативная теория принятия решений требует, чтобы степени убеждений агентов удовлетворяли аксиомам вероятности и чтобы они отвечали на новую информацию посредством обусловленности. Таким образом, теория принятия решений имеет большое значение для дебатов в эпистемологии и философии науки; то есть,для теории эпистемологической рациональности.

Наконец, теория принятия решений должна представлять большой интерес для философов разума и психологии, а также для тех, кому интересно, как люди могут понимать поведение и намерения других; и, в целом, как мы можем интерпретировать то, что происходит в умах других людей. Теоретики принятия решений обычно предполагают, что поведение человека может быть полностью объяснено с точки зрения его убеждений и желаний. Но, возможно, более интересно то, что некоторые из наиболее важных результатов теории решений - различные теоремы о представлении, некоторые из которых обсуждались здесь - предполагают, что если человек удовлетворяет определенным требованиям рациональности, то мы можем прочитать его убеждения и желания, и насколько сильны эти убеждения и желания, от ее выбора диспозиций (или предпочтений). То, что эти теоремы действительно говорят нам, является предметом обсуждения, как обсуждалось выше. Но при оптимистическом прочтении этих результатов они уверяют нас, что мы можем осмысленно говорить о том, что происходит в умах других людей, без особых доказательств, помимо информации об их склонностях к выбору.

Библиография

  • Аль-Наджар, Набиль И. и Джонатан Вайнштейн, 2009, «Литература об отвращении к неоднозначности: критическая оценка», Экономика и философия, 25: 249–284. [Аль-Наджар и Вайнштейн 2009 доступны онлайн (pdf)]
  • Allais, Морис, 1953, «Le Comportement de l'omom Rationnel devant le Risque: Критика постулатов и аксиом Эколе Америки», Econometrica, 21: 503–546.
  • Анскомб, FJ, 1963, «Последовательные медицинские испытания», журнал Американской статистической ассоциации, 58: 365–383.
  • Анскомб, Ф. Дж. и Роберт Дж. Ауманн, 1963, «Определение субъективной вероятности», Анналы математической статистики, 34: 199–204.
  • Бен-Хаим, Яков, 2001, Теория информационного разрыва: решения в условиях серьезной неопределенности, Лондон: Academic Press.
  • Бермудес, Хосе Луис, 2009, Проблемы теории принятия решений, Оксфорд: издательство Оксфордского университета.
  • Бинмор, Кен, 2009, Rational Decisions, Принстон, Нью-Джерси: издательство Принстонского университета.
  • Болкер, Этан Д., 1966, «Функции, напоминающие коэффициенты мер», Труды Американского математического общества, 124: 292–312.
  • –––, 1967, «Одновременная аксиоматизация полезности и субъективной вероятности», Philosophy of Science, 34: 333–340.
  • Брэдли, Ричард, 1998, «Теорема о представлении для теории решений с условиями», Synthese, 116: 187–222
  • –––, 2004, «Теорема о представлении Рамсея», Диалектика, 4: 484–497.
  • –––, 2007, «Единая байесовская теория принятия решений», Theory and Decision, 63: 233–263.
  • Брэдли, Ричард и Х. Орри Стефанссон, 2016, «Противоположная желательность», Британский журнал по философии науки, в печати.
  • –––, 2016, «Желание, ожидание и инвариантность», Mind, в печати.
  • Брум, Джон, 1991a, Взвешивание товаров: равенство, неопределенность и время, Оксфорд: Блэквелл.
  • –––, 1991b, «Структура добра: теория и этика принятия решений», в Основах теории принятия решений, Майкл Бахарах и Сьюзан Херли (ред.), Оксфорд: Блэквелл, стр. 123–146.
  • –––, 1991c, «Желание, вера и ожидание», Mind, 100: 265–267.
  • –––, 1993, «Может ли Humean быть умеренным?», В Value, Благосостояние и мораль, GR Frey и Кристофер У. Моррис (ред.), Кембридж: издательство Кембриджского университета. С. 51–73.
  • Бучак, Лара, 2013, риск и рациональность, Оксфорд: издательство Оксфордского университета.
  • –––, готовится к изданию «Теория принятия решений», в Оксфордском справочнике вероятности и философии, Кристофер Хичкок и Алан Хайек (ред.), Оксфорд: издательство Оксфордского университета.
  • Бирн, Алекс и Алан Хаджек, 1997, «Дэвид Хьюм, Дэвид Льюис и теория принятия решений», Mind, 106: 411–728.
  • Чанг, Рут, 2002, «Возможность паритета», Этика, 112: 659–688.
  • Коливан, Марк, Дамиан Кокс и Кэти Стил, 2010, «Моделирование морального измерения решений», Noûs, 44: 503–529.
  • Дитрих, Франц и Кристиан Лист, 2013, «Теория рационального выбора, основанная на причинах», Noûs, 47: 104–134.
  • –––, 2015, «Основанный на разуме выбор и контекстная зависимость: объяснительная основа», Экономика и философия, в печати.
  • –––, 2015, «Ментализм против бихевиоризма в экономике: перспектива философии науки», «Экономика и философия», в печати.
  • Драйер, Джеймс, 1996, «Рациональные предпочтения: теория принятия решений как теория практической рациональности», Theory and Decision, 40: 249–276.
  • Эльстер, Джон и Джон Э. Ремер (ред.), 1993, Межличностные сравнения благосостояния, Кембридж: издательство Кембриджского университета.
  • Гарденфорс, Питер и Нильс-Эрик Сахлин, 1982, «Вероятности ненадежности, принятие рисков и принятие решений», перепечатано в P. Gärdenfors и N.-E. Sahlin (ред.), 1988, Решение, Вероятность и Полезность, Кембридж: издательство Кембриджского университета, 313–334.
  • Гильбоа, Ицхак и Дэвид Шмейдлер, 1989, «Ожидаемая полезность Maxmin с неуникальным приоритетом», журнал математической экономики, 18: 141–153.
  • Хорошо, IJ, 1967, «О принципе полного доказательства», Британский журнал по философии науки, 17: 319–321.
  • Гуала, Франческо, 2006, «Опроверглась ли теория игр?», «Философский журнал», 103: 239–263.
  • –––, 2008, «Парадигматические эксперименты: ультимативная игра от тестирования до измерительного устройства», Philosophy of Science, 75: 658–669.
  • Густафссон, Йохан Э., 2010, «Насос денег для ациклических непереходных предпочтений», Диалектика, 64: 251–257.
  • –––, 2013, «Неуместность диахронического аргумента денежной помпы для ацикличности», The Journal of Philosophy, 110: 460–464.
  • Хаек, Алан и Филипп Петтит, 2004, «Желание за пределами веры», Австралийский философский журнал, 82: 77–92.
  • Halpern, Joseph Y., 2003, Рассуждение о неопределенности, Кембридж, Массачусетс: MIT Press.
  • Хаммонд, Питер Дж., 1976, «Изменение вкусов и последовательный динамический выбор», Обзор экономических исследований, 43: 159–173.
  • –––, 1977, «Динамические ограничения на метастатический выбор», Economica 44: 337–350.
  • –––, 1988a, «Теория упорядоченных решений: комментарий профессора Зайденфельда», «Экономика и философия», 4: 292–297.
  • –––, 1988b, «Последовательность и аксиома независимости», в «Риск, решение и рациональность», Б. Р. Мунье (ред.), Дордрехт: Д. Рейдел.
  • –––, 1988c, «Consequentialist Основы для теории ожидаемой полезности», Theory and Decision, 25: 25–78.
  • Хаусман, Даниэль М., 2011, «Ошибки в предпочтениях в социальных науках», Философия социальных наук, 41: 3–25.
  • Хип, Шон Харгривз, Мартин Холлис, Брюс Лайонс, Роберт Сагден и Альберт Уил, 1992, «Теория выбора: критическое введение», Оксфорд: издательство Blackwell.
  • Хилл, Брайан, 2013, «Доверие и решение», Игры и экономическое поведение, 82: 675–692.
  • Джексон, Фрэнк и Майкл Смит, 2006, «Абсолютистские моральные теории и неопределенность», The Journal of Philosophy, 103: 267–283.
  • Джеффри, Ричард С., 1965, «Логика принятия решений», Нью-Йорк: МакГроу-Хилл.
  • –––, 1974, «Предпочтения среди предпочтений», The Journal of Philosophy, 71: 377–391.
  • –––, 1983, «Байесианизм с человеческим лицом», в Тестировании научных теорий, Джон Эрман (ред.), Миннеаполис: Университет Миннесотской Прессы, стр. 133–156.
  • Джойс, Джеймс М., 1998, «Непрагматическое подтверждение вероятности», Philosophy of Science 65: 575–603.
  • –––, 1999, Основы теории причинных решений, Нью-Йорк: издательство Кембриджского университета.
  • –––, 2002, «Леви о теории причинно-следственных решений и возможности прогнозирования собственных действий», Философские исследования, 110: 69–102.
  • –––, 2010, «Защита неточных доказательств в умозаключениях и принятии решений», Philosophical Perspectives, 24: 281–323.
  • Кадане, Джозеф Б., Марк Дж. Шервиш и Тедди Сейденфельд, 2008, «Является ли невежество блаженством?», «Вестник философии», 105: 5–36.
  • Кини, Ральф Л. и Говард Райффа, 1993, Решения с несколькими целями: предпочтения и компромиссы стоимости, Кембридж: издательство Кембриджского университета.
  • Klibanoff, Peter, Massimo Marinacci и Sujoy Mukerji, 2005, «Плавная модель принятия решений в условиях неопределенности», Econometrica, 73: 1849–1892.
  • Найт, Фрэнк, 1921, Риск, Неопределенность и Прибыль, Бостон, Массачусетс: Houghton Mifflin Company.
  • Крепс, Дэвид М., 1988, Заметки о теории выбора, Боулдер, Колорадо: Вествью Пресс.
  • Леви, Исаак, 1986, Трудный выбор: принятие решений в условиях неразрешенного конфликта, Кембридж: издательство Кембриджского университета.
  • –––, 1991, «Consequentialism и Sequential Choice», в Основах теории принятия решений, М. Бахарах и С. Херли (ред.), Оксфорд: Бэзил Блэквелл, стр. 70–101.
  • Льюис, Дэвид, 1988, «Желание как вера», Mind, 97: 323–332.
  • –––, 1996, «Желание как вера II», Mind, 105: 303–313.
  • Loomes, Graham and Robert Sugden, 1982, «Теория сожаления: альтернативная теория рационального выбора в условиях неопределенности», The Economic Journal, 92: 805–824.
  • Machina, Mark J., 1989, «Динамическая согласованность и неожиданные полезные модели выбора в условиях неопределенности», журнал экономической литературы, 27: 1622–1668.
  • Махер, Патрик, 1992, «Диахроническая рациональность», Philosophy of Science, 59: 120–141.
  • Мандлер, Майкл, 2001, «Трудный выбор в теории предпочтений: рациональность подразумевает полноту или транзитивность, но не то и другое», в «Разновидностях практического мышления», Элайджа Миллграм (ред.), Кембридж, Массачусетский технологический институт, стр. 373–402.
  • МакКленнен, Эдвард Ф., 1988, «Упорядоченность и независимость: комментарий профессора Зайденфельда», Экономика и философия, 4: 298–308.
  • –––, 1990, Рациональность и динамический выбор: фундаментальные исследования. Кембридж: издательство Кембриджского университета.
  • Петерсон, Мартин, 2009, Введение в теорию принятия решений, Кембридж: издательство Кембриджского университета.
  • Pettit, Philip, 1993, «Теория принятия решений и народная психология», в Основах теории принятия решений: проблемы и достижения, Майкл Бахарах и Сьюзан Херли (ред.), Оксфорд: Blackwell, стр. 147–175.
  • Рабинович, Влодек, 1995, «Есть пирог и есть его, слишком: последовательный выбор и ожидаемые нарушения полезности», Journal of Philosophy, 92: 586–620.
  • –––, 2000, «Стабильность предпочтений и замена равнодушных: ответ Зейденфельду», Теория и решение, 48: 311–318.
  • –––, 2002, «Практическое обсуждение вытесняет самопредсказание?», Эркеннтнис, 57: 91–122.
  • Рэмси, Франк П., 1926/1931, «Правда и вероятность», в Основах математики и других логических очерках, Р. Б. Брейтуэйт (ред.), Лондон: Кеган, Пол, Тренч, Трубнер и Ко, стр. 156– 198.
  • –––, 1990, «Вес ценности знаний», Британский журнал по философии науки, 41: 1–4.
  • Resnik, Michael D., 1987, Choices: Введение в теорию принятия решений, Миннеаполис: Университет Миннесотской Прессы.
  • Сэвидж, Леонард Дж., 1954, Основы статистики, Нью-Йорк: Джон Вили и сыновья.
  • Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane и Isaac Levi, 2003, «Расширения теории ожидаемой полезности и некоторые ограничения парных сравнений», Труды третьей ISIPTA (JM), 496–510.
  • Seidenfeld, Teddy, 1988a, «Теория принятия решений без« независимости »или без« упорядоченности »», «Экономика и философия», 4: 309–315.
  • –––, 1988b, «Rejoinder [to Hammond and McClennen]», Economics and Philosophy, 4: 309–315.
  • –––, 1994, «Когда решения в нормальной и обширной форме различаются», Логика, Методология и философия науки, IX: 451–463.
  • –––, 2000a, «Замена безразличных вариантов в узлах выбора и допустимость: ответ Рабиновичу», Теория и решение, 48: 305–310.
  • –––, 2000b, «Постулат независимости, гипотетические и вызванные акты: дальнейший ответ Рабиновичу», Теория и решение, 48: 319–322.
  • Сен, Amartya, 1973, «Поведение и концепция предпочтения», Economica, 40: 241–259.
  • –––, 1977, «Рациональные дураки: критика поведенческих основ экономической теории», Philosophy and Public Affairs, 6: 317–344.
  • Скирмс, Брайан, 1993, «Ошибка в динамических аргументах когерентности?», Philosophy of Science, 60: 320–328.
  • Stalnaker, Robert C., 1987, Inquiry, Cambridge, MA: MIT Press.
  • Стил, Кэти С., 2010, «Каковы минимальные требования рационального выбора? Аргументы из постановки последовательного решения», Теория и решение, 68: 463–487.
  • Стефанссон, Х. Орри, 2014, «Желания, убеждения и условная желательность», Synthese, 191: 4019–4035.
  • Suppes, Patrick, 2002, Представление и инвариантность научных структур, Стэнфорд, Калифорния: Публикации CSLI.
  • Темкин, Ларри, 2012, Переосмысление добра: моральные идеалы и природа практического мышления, Оксфорд: издательство Оксфордского университета.
  • Тверский, Амос, 1975, «Критика теории ожидаемой полезности: описательные и нормативные соображения», Эркеннтнис, 9: 163–173.
  • Виллегас, C., 1964, «О качественной вероятности (sigma) - алгебрах», Анналы математической статистики, 35: 1787–1796.
  • фон Нейман, Джон и Оскар Моргенштерны, 1944, Теория игр и экономического поведения, Принстон: издательство Принстонского университета.
  • Уолли, Питер, 1991, Статистическое обоснование с неточными вероятностями, Нью-Йорк: Чепмен и Холл.
  • Зында, Лайл, 2000, «Теоремы о представлении и реализм о степенях веры», Философия науки, 67: 45–69.

Академические инструменты

значок сеп человек
значок сеп человек
Как процитировать эту запись.
значок сеп человек
значок сеп человек
Предварительный просмотр PDF-версию этой записи в обществе друзей SEP.
значок Inpho
значок Inpho
Посмотрите эту тему в Проекте интернет-философии онтологии (InPhO).
Фил документы
Фил документы
Расширенная библиография для этой записи в PhilPapers со ссылками на ее базу данных.

Другие интернет-ресурсы

  • Брэдли, Ричард, 2014, Теория принятия решений: официальное философское введение.
  • Ханссон, Свен Ове, 1994, Теория принятия решений: краткое введение.

Рекомендуем: