囚徒困境原理是什麼意思? ?

General 更新 2024-05-17

囚徒困境原理是什麼意思?

兩個囚徒為了追求各自的利益最大化,得到的結果一定是兩敗俱傷;如果雙方可以同時放棄各自的最優策略,選擇合作,這樣才可以雙贏。所謂困境,在於如果任何一方選擇了合作而對方不合作,己方將萬劫不復;而如果對方選擇合作而自己選擇最優策略,自己則有機會一步登天,將萬劫不復留給對方,這就是為什麼即使雙方都知道唯有合作才能雙贏,雙方仍然無法合作。

經濟學中的“囚徒困境”是什麼意思?

囚徒困境(Prison Dilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同夥可為自己帶來利益(縮短刑期),也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

舉個例子:

1950年,由就職於蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為“囚徒困境”。經典的囚徒困境如下:

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監半年。

若二人都互相檢舉(互相“背叛”),則二人同樣判監2年。

用表格概述如下:

甲沉默(合作) 甲認罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年

乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年

《博弈聖經》囚徒困境的定義是什麼?

《博弈聖經》囚徒困境的定義;囚徒困境中的兩點一空間,堪稱大自然的三維時空遊戲,它會引起兩個靈性對三維實體變異的思考、也會引起對三維實體錯位的焦慮。

……

【摘要】

最終納什的家人和朋友、決定將他送進醫院治療,在醫院他認為醫生是蘇聯人、要追殺他。經醫生診斷,他得的“妄想型精神分裂症”也更加嚴重。一個被“妄想型精神分裂症”傷害的大腦、一個胡言亂語的精神病人、妄想出來的“納什均衡”博弈佔優理論,你們認為可信嗎?

……

來源:美國資訊網;博弈聖經著作人對納什的嘲諷

博弈聖經著作人的經典名句;0、1、二維平均,稱平衡,0、1、2、三維平均,稱均衡。

在0、1、二維記錄的系統中,0、1、這兩種輸贏粒子,必需構成博弈程序中的基本單元,馮·諾伊曼發現,有一個“極小極大定理”存在其中,(極小極大定理,就是要麼極端的輸、要麼極端的贏),從長遠來看,兩種粒子出現的一次平均、是一次平衡,多次平均、就是多次平衡,裡面並不存在兩種粒子扯平的趨勢。兩種粒子的未來、不受過去所發生的、任何粒子事件的影響。0、1、兩種粒子趨於平衡的預期,已經被極小極大定理徹底否決。

在0、1、二維粒子隨機走動的系統中,只存在平均、不存在平均律,也就是不存在三維均衡。博弈聖經著作人的經典名句;策略,就不存在0、1、二維繫統中。納什均衡提出時,當場就遭到馮·諾依曼的貶低、嘲笑和斷然否定。

談到“納什均衡”,有位記者請納什用通俗的語言來解釋他的理論。納什說;“‘納什均衡’並不高深,它就像中國人發明的一種、三個人玩的撲克遊戲,“納什均衡”就是一個簡單的三人博弈遊戲”。中國有那麼多人玩撲克,又玩了那麼多年,納什還提醒了中國人半個多世紀,納什均衡並不高深,中國人竟沒有一個人發現三個人玩的撲克遊戲中、還有一個‘均衡佔優理論’。人們不禁要問;納什他自己玩過幾次三人撲克遊戲?他和誰玩的?他是怎麼發現的均衡?均衡理論又是怎麼單方佔優的?在他所有的文章中,為什麼沒有對中國的撲克遊戲展開敘述。一副撲克三個人玩,一個人18張牌,在連續記錄的0、1、2、三維繫統中,18張牌只能記錄成、18個紅藍小點而已,它是怎麼個均衡法呢?他在60多年的時間裡,沒有人見過他、用中國的撲克表演過什麼是、非合作納什均衡,什麼是納什均衡佔優策略,他既沒有實際表演,也沒有給出明確的理論說明,這令關注納什佔優策略的人,大為失望。

博弈聖經著作人的經典名句;科學家在納什均衡理論中、尚未發現博弈佔優策略的任何跡象。

博弈聖經著作人的經典名句;策略,來自0、1、2、三維結構的自然屬性。粒子、私湍、實體,簡稱為,粒、湍、體。它是博弈取勝、計算單方佔優策略的標準模型。

在納什的語文學中,就沒有出現過一次0、1、2、三維均衡的概念,納什均衡哪裡來。

博弈聖經著作人的經典名句;納什均衡理論沒有任何明確的說法,納什均衡是美國偽造的產物,傳到了世界各地,當然也傳遍了中國。“納什均衡”的本質,是對中國人的智商,對發現、發明、創造精神的一種羞辱。

博弈聖經著作人的經典名句;二維平衡是指生物的競爭行為,三維均衡是指自然的優劣特性。

博弈聖經著作人的經典名句;揭開納什均衡的畫皮,露出真相。【如果納什均衡是以納什的名字、命名的一個博弈論術語;假如我把納什名字去掉、只剩下均衡一詞、均衡也就是純淨的博弈論術語;倘若所有博弈論的文章中、都把納什名字去掉只剩下均衡;再讀一篇篇博弈論文章、也都是圍繞著均衡一詞展開的敘述;發現通篇文章邏輯不通、詞意變異、不知所云;只要是屬於納什均衡的理論文章、去掉納什名字之後、納什的鬼魅就出現了;通篇文章,捕風捉影、張冠李戴、以訛......

什麼是囚徒困境

囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八範;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同夥選擇什麼,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,不坦白的話判一年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。結果,兩個嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個結果好。但這個帕累託改進辦不到,因為它不能滿足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性——聰明的人類會因自己的聰明而作繭自縛。

什麼是囚徒困境?

什麼是囚徒困境呢?它的具體內容是什麼呢?   囚徒困境簡介  囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。  單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。  在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。  經典的囚徒困境  1950年,由就職於蘭德公司的梅里爾·弗拉德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問阿爾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為“囚徒困境”。經典的囚徒困境如下:  警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:  若一人認罪並作證檢舉對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。  若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監半年。  若二人都互相檢舉(互相“背叛”),則二人同樣判監2年。  如同博弈論的其他例證,囚徒困境假定每個參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴格劣勢”,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。  囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:  若對方沉默、背叛會讓我獲釋,所以會選擇背叛。  若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。  二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑2年。  這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判決均比合作為高,總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優和納什均衡是相沖突的。

囚徒困境現象告訴我們什麼?

囚徒困境現象告訴我們:個人理性和集體理性之間存在矛盾,個人理性的正確選擇會降低大家的福利。

相關問題答案
漏斗原理是什麼意思?
激勵原理是什麼意思?
破壁原理是什麼意思?
醫學倫理是什麼意思?
原來是什麼意思?
永結連理是什麼意思?
做微商代理是什麼意思?
陰陽調理是什麼意思?
近因原則是什麼意思?
文理是什麼意思?