2021/03/08

【読書メモ】 意思決定の科学

『「意思決定」の科学 川越俊司・著 講談社Blue Backs
本書は意思決定の数理分析についての概説本。
巻頭における案内によれば、人間のさまざまな「選択」に際しての彼の主観的な「効用」判断と「選好」から数学上の「期待値」まで、すべて公理と関数を以て理論化されており、それが意思決定の科学であると。
科学とは称しても、そもそも選好の根拠たる効用には物理量の設定が無く、理論としての公理もさまざまな効用関数もあくまで記述手法としての数学に過ぎない。
一方で、意思決定の科学は行動経済学と重なってもいる由であり、よって本ブログでの本書紹介は社会科の一端としてみた。

本書の基本導入箇所はおそらくは第1章「期待効用理論」の後段から2章 「プロスペクト理論(期待効用理論を超えて)」までであろう。
どちらも章末に「まとめ」のページがおかれているので概ね論旨は了察しやすい。
ただし同箇所にては、コイン投げのゲームと賞金くじのゲームが入れ子のように呈されており、これらゲーム例と論旨展開のかかわりがやや分かり難かった。

ともかくも、本書第1章~第2章について僕なりに以下のとおりごく簡易に概括してみた。


<サンクトペテルブルクのパラドックス、期待効用理論>
『公平なコイン投げのゲームがあり、初めて表が出るまでのコイン投げ回数とそれに応じて大きくなる賞金額が設定されているとする。
この要件にて、たった1投だけこのゲームに参入できるとして(つまり参入によるリスクは有限であるとして)、何投目に参入すれば賞金額が最大となるか?』

…というゲームにて、賞金獲得のための直観上の効用判断~選好数学上の「期待値」は往々にして食い違ってしまい、この食い違いによって数学上のパラドックスが起こる。
端的な例として「サンクトペテルブルクのパラドックス」と称す。

ここで極端に単純化し、1投目と2投目での賞金額(X,Y)とその獲得確率Pの積を設定し、これを足し合わせれば数学上の期待値を表現出来る。
期待値 E = pxX + (1-p)xY
ここでゲーム参加者の主観的満足度としてなんらかの「効用」関数u(x)を投入すると、期待値表現は EU = pxu(X) + (1-p)xu(Y)
これが期待効用理論の基本、この効用期待値はゲーム参加者の最大満足度(そしてリスク限界プレミアム)を表現したことになり、この期待効用値総和を必ずプラスにおく意思決定もありうるし、マイナスにおく意思決定もありうる。

期待効用理論の公理は以下の通り明らかであるとされ、フォン=ノイマンらによってまとめられたもの。
・順序公理: 選好要件の完備性とその推移性を満たすとする
・連続性公理: 複数の選好要件を合成して新たな選好用件が成立するとする
・独立性公理: 上の要件合成にかかわらず元の選好要件は変化しないとする
人々がこれら3つの公理に同時に拠る選好を成すことと、彼らにとっての期待効用が最大になることは、数学上同値となるとノイマンは証明した。
これを以て、期待効用理論は意思決定における効用判断と選好を完全に記述した ─ とされた。

 ==================

<期待効用理論の限界>
『公平なコイン1つを表が出るまで投げ続け、k投目に初めて表が出たさいに(2k)2
の賞金が与えられる』
、というゲームを想定する。
まず「k投目ごとの賞金額」は、1投目から表が出てしまったら(21)2、2投目に初めて表が出たのなら(22)2、3投目で初めて表が出たのなら(23)2、4投目なら(24)2、5投目なら(25)2... となる。
一方で「表が初めて出る確率」は、1投目であれば1/2であり、2投目であれば1/4であり、3投目なら1/8、4投目なら1/16、5投目なら1/32 ... となる。
よって賞金の期待値は、1/2x((21)2) + 1/4x((22)2) + 1/8x((23)2) + 1/16x((24)2) + 1/32x((25)2) ... ∞ と無限大に発散する。

ここで賞金額をxとした場合の期待効用の関数uを u(x)=√x とすると、賞金の期待効用は要するに 1/2x√22 + 1/4x√42 + 1/8x√82 + 1/16x√162 + 1/32x√322 ... ∞ となり、これも無限大に発散してしまう。
よってこのゲームでは、投入コストの如何を問わず、期待効用が最大となる選好は設定出来ない。


なお、経済学者アレは、多くの人々が実際には期待効用理論における独立性公理に反した選好をしてしまうと指摘。
本旨指摘のためにアレが呈したパラドックスを簡易に記すと、以下のもの:

『くじAは100%の確率で1万円が当たる。
くじBは10%の確率で5万円、89%の確率で1万円、1%の確率で0円が当たる。
無償でAかBのどちらかのくじを入手できるとしたらどちらのくじが欲しいか?
また、くじCは11%の確率で1万円、89%の確率で0円が当たる。
くじDは10%の確率で5万円、90%の確率で0円が当たる。
無償でCかDのどちらかのくじを入手できるとしたらどちらのくじが欲しいか?』

ここで、くじAとくじBの期待効用をなんらかの効用関数u(x)を以て表すと、くじAの期待効用は1.0xu(1万円)、またくじBの期待効用は 0.1xu(5万円)+0.89xu(1万円)+0.01xu(0円)となる。
そして仮にくじAの方が期待効用が大きいと判断するならば、
1.0xu(1万円) > 0.1xu(5万円)+0.89xu(1万円)+0.01xu(0円)
これは 0.11xu(1万円) > 0.1xu(5万円) とも記せる。
同様にして、くじCとくじDについても期待効用をなんらかの効用関数u(x)を以て表しつつ、こちらの場合にはくじDの方が期待効用が大きいと判断するならば、
0.11xu(1万円) < 0.1xu(5万円) とまとまり、上のくじAとBの場合とは真逆の大小関係になってしまう。

=================


<プロスペクト理論>
上に掲げたくじゲームにおける不整合は、なんらかの効用関数u(x)がリスク愛好的なものであろうとリスク回避的なものであろうと、どうしても生じてしまう。
とすると、人間の効用判断から選好までの意思決定は「本当は期待効用理論には則っていない」ことになる。

…かかる判断によって、期待効用理論から独立性公理を排除した意思決定理論が閃かれた。
それがカーネマンとトベルスキーによって提案された「プロスペクト理論」であり、これは「確率'重み'付け関数」と「価値関数」を含む。

確率重み付け関数は、或る事象の発生確率が低い場合に人間がこれをヨリ高いものと過大評価し、一方でその発生確率が高いのに人間はこれをヨリ低いものと過小評価する、という心理上の歪みを説明出来る。
また価値関数は、期待関数に人間の損失リスク回避性を導入し数値化するもの。

かくて、「プロスペクト理論」は期待効用理論に代わる意思決定理論とされている、が、これとてサンクトペテルブルクのパラドックスを解決してはいない。

============================


さて本書はp.145にて、何故にプロスペクト理論がサンクトペテルブルクのパラドックスを解決しきれないかにつき数学手法を以て説明が続く。
そしていよいよ第3章以降は、リスク評価選好の効用関数以外のさまざまな効用関数とそれらによる選好につき仔細な紹介や検証に入って行く。

冒頭に記したように本書は意思決定の科学ゆえ、理数本ではなくむしろ社会科の一冊であり、だから経営学部や経済学部を志向する学生に是非とも一読を薦めたいものではあるが、数学論としても相応に楽しめよう。
僕としても第3部以降にはこんご徐々にチャレンジしてゆく積りだ、ではこれにて。

(おわり)