ナッシュ均衡
出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナッシュ均衡(ナッシュきんこう、Nash equilibrium)は、ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。数学者のジョン・フォーブス・ナッシュにちなんで名付けられた。
ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。
ナッシュ均衡は、必ずしもパレート効率的ではない。その良い例が、囚人のジレンマである。
目次 |
[編集] 定義
形式的な定義は次の通りである。標準型ゲーム G=(N, S, u) (N はプレーヤーの集合、 は戦略の組の集合、 は効用の組)において、戦略の組 がナッシュ均衡であるとは、全てのプレーヤー と、全ての に対して、
を満たすことである。
ただし、s − i は、i 以外のプレーヤーの戦略の組をさす。
[編集] 純粋戦略ゲームとナッシュ均衡
[編集] 支配戦略によるナッシュ均衡
純粋戦略ゲーム(Pure strategy game)とは、参加者(プレーヤー)が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤーPaとPbがそれぞれ戦略(A1またはA2)と(B1またはB2)を選べるときの、それぞれの利得を示す。並んだ数字の左側はPaの利得、右側はPbの利得である。
Pa/Pb | B1 | B2 |
A1 | 5, 2 | 2, 4 |
A2 | 4, 6 | 1, 6 |
まずPaの利得に注目すると、Pbがどちらの戦略を選ぼうが、PaはA1戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。
次にPbの利得に注目すると、Paがどちらに戦略を選んでも、B2戦略を選んだ方がB1戦略のとき以上の利得を得られる。PaがA2戦略を選んだ場合にはB1とB2は同等になるので、このような関係のときB2は弱支配戦略であるという。
結果として、Paにとっての最適戦略はA1、Pbにとっての最適戦略はB2となり、両者ともここから戦略を変更しても利得は減る可能性がある。この組み合わせ(A1, B2)がナッシュ均衡となる。
Pa、Pbが(A1, B2)という戦略をとった場合、Paは戦略を変更してA2をとれば利得が2から1へ減少してしまうため、戦略を変更する誘因を持たない。同様にPbも、戦略を変更してB1をとれば利得が4から2へ減少してしまうため、戦略を変更する誘因を持たない。
なお、Pa、Pbが(A2, B1)という戦略をとった場合の利得は(4, 6)となり、ナッシュ均衡における利得と比べてPa、Pbともにより大きな利得を得ることができる。この場合、Paがより大きな5の利得を得るためA1に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。また、(A1, B2)から(A2, B1)への戦略変更は、パレート改善であり、ナッシュ均衡(A1, B2)はパレート効率的ではない。
[編集] 逐次消去によるナッシュ均衡
相手の戦略によってどの戦略が最も大きな利得を出すかが変化する場合、他の戦略すべてを支配できる戦略が存在しない場合がある。そのような場合、他から支配されている戦略を消去していくことで残った戦略の組み合わせをナッシュ均衡と定義できる。支配戦略によってナッシュ均衡が定義できる場合、それは消去によって定義されたものと一致する。
Pa/Pb | B1 | B2 | B3 |
A1 | 5, 2 | 2, 4 | 4, 0 |
A2 | 4, 6 | 3, 6 | 2, 5 |
A3 | 3, 3 | 1, 2 | 7, 2 |
↓B3はB2に支配されているため、B3を消去
Pa/Pb | B1 | B2 |
A1 | 5, 2 | 2, 4 |
A2 | 4, 6 | 3, 6 |
A3 | 3, 3 | 1, 2 |
↓A3はA2に支配されているためA3を消去
Pa/Pb | B1 | B2 |
A1 | 5, 2 | 2, 4 |
A2 | 4, 6 | 3, 6 |
↓B1はB2に支配されているためB1を消去
Pa/Pb | B2 |
A1 | 2, 4 |
A2 | 3, 6 |
ナッシュ均衡は(A2, B2)
[編集] 混合戦略ゲームにおけるナッシュ均衡
混合戦略ゲームとは、参加者が各行動を選ぶ確率を戦略とするような非協力ゲームのことである。この場合、ナッシュ均衡は各参加者の行動確率の組として表される。有限ゲーム(プレーヤーの数と各プレーヤーの戦略の数が有限のゲーム)は少なくとも1つのナッシュ均衡を(混合戦略ゲームで考えれば)持つことが証明されている(ナッシュの定理)。
Pa/Pb | B1 確率 q |
B2 確率 (1-q) |
A1 確率 p |
1, 2 | 0, 0 |
A2 確率 (1-p) |
0, 0 | 2, 1 |
この表のゲームの場合はPaの得る利得の期待値は:
- 1・pq + 2・(1 - p)(1 - q) = 3pq - 2p - 2q + 2 = (3q - 2)p + 2(1 - q)
である。これをpの関数だと考えると:
- q > 2/3 なら:単調増加の直線グラフなので、期待値の最大値は p = 1 のとき q
- q < 2/3 なら:単調減少の直線グラフなので、期待値の最大値は p = 0 のとき 2 - 2q
- q = 2/3 なら:期待値は一定で 2/3
となる。
Pbの得る利得の期待値の最大値も、pによって同様に決定される。この二つのグラフの交点がナッシュ均衡となる。このゲームの場合は(2/3, 1/3)がそうである。
[編集] 関連項目
ゲーム理論のトピックス | |
定義 | 協力ゲーム - 非協力ゲーム |
均衡 | ナッシュ均衡 - 部分ゲーム完全均衡 - ベイジアン・ナッシュ均衡 - 逐次均衡 - 完全均衡 - 合理化可能性 - 進化的に安定な戦略 - パレート効率性- 戦略的補完性 |
ゲームのクラス | 標準型ゲーム - 展開型ゲーム - 特性関数型ゲーム - 完全情報ゲーム - 不完全情報 - 繰り返しゲーム - ゼロ和 - 非ゼロ和 - 二人零和有限確定完全情報ゲーム |
ゲーム | 囚人のジレンマ - チキンゲーム - スタグハントゲーム |
理論 | ミニマックス法 - フォーク定理 - コアの極限定理 |
関連項目 | 数学 - 経済学 - 進化論 - 集団遺伝学 - オペレーションズリサーチ - 社会生物学- 環境社会学 |