2015/06/09

【読書メモ】 ゲーム理論・入門

「ゲーム理論・入門 (新版) 有斐閣アルマ 岡田章・著」
サブタイトルは 「人間社会の理解のために」 とあり、此度読み進めたのは昨年9月の刷新版。
入門とはいえ、本書は経済理論の概説書であるため人間による意思決定の「(なんらかの)量化」、「関数化」、「確率」、「均衡」、「利得」、「分配」など数理的解釈について、基本から複合へと論が展開していく構成。
僕のように遠い昔ちょいとかじっただけの素人にとっては、なかなか読み応えがある。

あらかじめ、経済理論に対して営業経験者としての僕なりの疑念を一つ。
実際の市場競争活動においては、「或る経済主体の利得」 「別の経済主体のコスト」 たりうるが、ならば「全経済主体を通じた絶対善としての意思決定」を理論的に定義しきれるか?
もちろん我ながら青臭いとは察してのもの、ただ、経済学が政策論の礎たりうるのであれば、この疑念は常に全経済主体の意思決定にかかる問題ではないか。

本書にてもヒントらしきは呈されている ─ 
ひとつは公共財への寄付について、各プレーヤーの利得意識がもともと異なるとの前提にある仮想ゲームである。
もうひとつ、例えばナッシュ理論における「集団均衡」論にては、少なくとも利得のための意思決定は全プレーヤーが経験的に収斂に向かう由、論理的に納得(したつもりになった)。


なお、本書は初学者にとっても読み易い丁寧な文面、かつ、ゲームの戦略選択についての行・列図などもふんだんで、大意了察において惑わされることはない。
とkに数理的思考に慣れている読者は、要約的に引用されている簡易な数式「のみ」を追って読み進めれば、大意への理解が速いのではなかろうか。

それでは、いつもの【読書メモ】のように、僕なりに咀嚼し要約した処を僕なりの文脈にて、以下に簡単に列記しおく。
但し一部記号は表記出来ないため文言として記す。



<期待効用仮説>

或る合理的な人間の、複数の意思決定における選好順位を総覧的に表す。
(1) 彼の選好対象としての意思を仮に P, Q, R とする。
(2) これらの選好順位を、たとえばP≧Q などと完備的に」 明確化し、一方でまた、 たとえば P≧Q≧R というように選好順位の「推移性も明確であるとする。
(3) また、これら選好対象 P, Q, R の内に、何らかの量 x や y の「効用=u」として効用関数 u(x), u(y) などが在るとする、が、それら効用関数は、発生確率を加味していない(序数的な大小関係に過ぎない)。
(4) そこで、ヨリ現実をふまえ、選好対象Pの発生確率をpとして、P の「期待効用」とする。
同時に選好対象Q, Rの発生確率をも確率pで表しつつ、P, Q, R すべて期待効用として、お互いの選好順位を示す。

…、と、ここまでふまえつつ、このような選好順位の不等式を設定してみる。
pP + (1-p)R ≧ pQ + (1-p)R 

(5) この不等式の選好順位関係では、「どのような発生確率pにおいても」、期待効用としての選好順位はあくまで P≧Q そのものによって決まり、かつ、「選択対象Rの発生確率には無関係である」。よって、期待効用としての選好順位関係の「独立性」を確認出来る。
(6) さらに、今度は P≧Q≧R という選好順位を設定すると、上の式での左辺 pP + (1-p)R の期待効用は発生確率pに関して「連続的」に変化し、またその発生確率p はどんな選択対象Q に対しても無差別に連続変化する。

以上に列記した、選好順位の「完全性」「推移性」「独立性」「連続性」を同時に満たす「期待効用仮説」、ノイマンとモルゲンシュテルンが定義している。
この期待効用の定義に則れば、たとえば或る行為を為す人物の(何か定量化された)期待効用が発生リスク愛好的かあるいは発生リスク回避的かについて推察することが出来る。

======================================================

<最適応答、ナッシュ均衡点>

・複数の事業者が取りうる戦略について、それぞれの戦略から見込める利得が何らか定量化とされ、それらがある行/列表に場合分けされているとする。
これら事業者は、この行/列表において、互いに相手の戦略とその利得を予想しつつ、おのれの利得に有利となる戦略採択を続けていくとし、このプロセスを両者の最適応答のゲームと呼ぶ。

・なお、選択する戦略は更に、その利得が不変で明らかである「純戦略」と、期待利益が確率に応じて変わる「混合戦略」とに、分類出来る。
(実際には利得以外のフォーカルな戦略要素もある。)

・この最適応答のゲームは、どこかで互いに利得増加を期待出来なくなりそこで停まるが、その停まった段階における採用戦略の定量的な「組」を、「ナッシュ均衡点」 と称す。
一般的には fi (s) ≧ fi (s/si) という不等式で単純に表現される。
ここで s とは、一意のプレーヤー i が採りうるあらゆる戦略の「組」、一方で s/si とは、その i 自身のみが戦略を si に変えた場合の「組」
そしてfi とは、一意のプレーヤー何らかの定量的な利得関数、とする。
この利得関数の不等式が成り立つ場合戦略の「組」sがナッシュ均衡点 である。

・或るプレーヤーが、或る混合戦略のゲームを続けていくとする。
そのプレーヤーは期待利得を実際に学習するため、彼の平均的な利得は、彼を含めた母集団全体による混合戦略ゲームの利得と、次第に等しくなっていく
…というのが、ナッシュの提示した「集団均衡-マスアクション理論」の概要(だと僕なりに理解してみた)。
これは数学における大数の法則からも説明されている。

=======================================================

<クールノー均衡>

・一般に、限られた企業による独占市場を「クールノー寡占市場」と称し、ここでは2社による複占のケースを考える。

或る2つの企業が、「同じ製品」を「同じ市場」に提供していて、競争関係にあるとする。
企業1によるその製品の「供給量」を q1 とし、企業2による同じ製品の「供給量」を q2 とおき、「売価」の合計をp とすると、これが市場における(逆)需要価格となり、 p = a-b(q1+q2) と表現出来る。
但しここで、 a はその製品の売価上限、b はその製品供給量が1単位増加したさいの売価減少幅を示し、a, b > 0 とする。

さらに、企業1の供給量をやはり q1, 企業2のものを q2 として、その会社 i (ここでは2社)の同じ製品における「利潤関数」を以下のように表現出来る。
fi (q1, q2) = pqi - ciqi
ここで左辺 fi (q1,q2)  が、 i 社によるその製品の供給量 q1,q2 で決まる利潤。
右辺では同じ製品の供給量を(なんらかの) qi としてpqi  2社の売価合計を表し、そして ciqi が 2社それぞれの費用(ただし0以上)を表す。

・では、この2社それぞれの市場戦略は供給量で決まるとすると、それぞれの「最適応答」はどうなるか。
まず、企業2の供給量 q2 に対する企業1の「最適応答」は、企業1の利潤を最大にする供給量 q1 の決定。
これつまり、企業1の戦略の前提は利潤関数 fi(q1,q2) = pqi-ciqi 」に則り q1 で微分した値がゼロになる点 (※最適解の1階条件による)、ただし一方では、製品価格p の上限は「(逆)需要価格式 p = a-b(q1+q2)」 で定まっているということ。
よって 利潤関数(逆)需要価格式 を代入し計算、dfi / dqi = d / dqi { (a-b(q1+q2))q1 - c1q1} = 0 から、q1 = (a-c1) / 2b - q2/2 となる。
同様に、企業1の供給量 q1 に対する企業2の「最適応答」も自身の利潤を最大にする供給量 q2 の決定であるから、これも上同様に代入と微分から、q2 = (a-c2) / 2b - q1/2 となる。

こうして2社の最適応答による=ナッシュ均衡の点としての新たな供給量の「組」が算出され、連立方程式の解として、均衡点q1 は (a-2c1+c2) / 3b となり、 均衡点q2 は (a+c1-2c2) / 3b となる
そして、この最適応答解としての新たな供給量q1 と q2 をあらためて(逆)需要価格式利潤関数 に代入すれば、2社が落ち着くはずの価格と利潤を確認出来る。

・ここまで例示した、クールノー寡占市場における戦略のナッシュ均衡点を、特に「クールノー均衡点」と呼ぶ。

=====================================================

以上、基本箇所をざっと触りまで。

本書は今後も少しづつ読み進めるつもり、僕自身の数理的思考の鍛錬も含めあわせつつ、人間の意思決定プロセスがどこまで論理的に定義しうるかを見極めてゆきたいもの。

以上