✔ 最佳答案
納什均衡(Nash equilibrium)
納什均衡簡介
完全信息靜態博弈:納什均衡
納什均衡 ,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰納什命名。
在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。 如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。
一個策略組合被稱為納什均衡,當每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。
納什均衡例子
大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年;如果兩人均招供,將均被判刑五年。 於是,兩人同時陷入招供還是不招供的兩難處境。 其實如果兩人均不招供,將最有利,只被判刑三個月。
博弈矩陣
囚犯甲
招供
不招供
囚犯乙
招供
判刑五年判刑五年
甲判刑十年;乙判刑一年
不招供
甲判刑一年;乙判刑十年
判刑三個月
基於經濟學中Rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑三個月就不會出現。 這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為“納什均衡”,也叫非合作均衡。