納什均衡點
维基百科,自由的百科全书
納許平衡,又稱為非合作賽局平衡,是賽局理論的一個重要概念,以约翰·納什命名。
如果某情況下無一參與者可以獨自行動而增加收益,則此策略組合被稱為納什均衡點[1]。
目录 |
[编辑] 例子
經典的例子就是囚徒困境,囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。如果两人均不招供,将最有利,只被判刑三年。 于是,两人同时陷入招供还是不招供的两难处境。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵 |
囚犯甲
|
||
招供
|
不招供
|
||
囚犯乙
|
招供
|
判刑五年
|
甲判刑十年;乙判刑一年
|
不招供
|
甲判刑一年;乙判刑十年
|
判刑三年
|
基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事實上,这样两人都选择坦白的策略以及因此被判五年的结局被稱作是“納什均衡”(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。
[编辑] 学术争议和批评
第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem) 证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。[來源請求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
经过《美丽心灵》的Sylvia Nasar(书作者)和Ron Howard(电影作者)这样的主流媒体的介入,角谷静夫(Kakutani)在这些人的作品里被完全忽略。有人认为,「纳什平衡」(Nash equilibrium)的更合适的名字应该叫作「角谷静夫—纳什博弈论不动点」(Kakutani-Nash game-theoretic fixed point)或「角谷静夫—纳什平衡」(Kakutani-Nash equilibrium),没有角谷静夫不动点定理,纳什的证明没有多大学术意义。《美丽心灵》完全忽视角谷静夫之关键贡献的作法有待商榷。
第二,納什的非合作(non-cooperative)博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼(Von Neumann)和納什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。
这个假设的不完善处,可能比假设大家都是合作的(cooperative)更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。最近香港城市大学和北京清华大学的学者群邓小铁、姚期智在基于复杂度理论的大规模博弈论上有所进展。
[编辑] 相關鏈接
[编辑] 參考
《Non-Cooperative Games》,約翰 · 納殊 , The Annals of Mathematics 1951
[编辑] 外部链接
- 纳什博弈论的原理与应用 北京晚报 (2002年3月21日)
[编辑] 註
- ^ 若 , ,則納什稱 s 為平衡點(Equilibrium point)。----其中 pi為參與者 i 的收穫(payoff),si代表所有參與者之策略,ri代表參與者 i 的 一種可能策略,(s;ri) 指參與者 i 單方面改變策 略成 ri。 --- P.287, Annals of Mathematics 1951