亚洲天堂av网_久久精品欧美一区二区三区不卡_亚洲欧美一级_欧美成人合集magnet

知名百科 >> 博弈論 >> 歷史版本
編輯時間歷史版本內容長度圖片數目錄數修改原因
2023-02-22 10:48 最新歷史版本 32061 4 6 修正錯誤
  返回詞條

博弈論

博弈論也叫對策論(游戲 理論),不僅是現代數學的一個新分支,也是運籌學的一個重要課題。

博弈論博弈論

博弈論主要研究公式化激勵結構之間的相互作用,是一種研究帶有斗爭或競爭性質的現象的數學理論和方法。博弈論考慮了博弈中個體的預測行為和實際行為,研究了它們的優化策略。生物學家用博弈論來理解和預測進化的一些結果。

博弈論已經成為經濟學的標準分析工具之一。在金融學、證券學、生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和許多其他學科被廣泛使用。

目錄

基本定義

《博弈圣經》博弈論的定義:我們認為動物 對自然的沉迷s運動作為決策者預期空間中的三維平衡文學理論,被稱為博弈論。

基本概念包括局里的人、行動、信息、策略、收益、均衡和結果等。其中局中人、策略和收入是最基本的要素。局中人、動作和結果統稱為游戲規則。

博弈論

理論歷史

發展過程

博弈論是兩個人互相利用在一場平等的游戲中改變他們的對抗策略以達到獲勝的目的。博弈論的思想自古就有中國 《孫子兵法》等s古著作不僅是軍事著作,也是最早的博弈論著作。博弈論最初關注的是國際象棋、橋牌、在賭博中,人們 s對游戲局勢的把握只停留在經驗上,沒有理論上的發展。

博弈論考慮了博弈中個體的預測行為和實際行為,研究了它們的優化策略。

現代對博弈論的研究始于策梅洛(Zermelo),波萊爾(Borel)及馮·諾依曼(馮 諾伊曼)

1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的劃時代巨著《博弈論與經濟行為》,將二人博弈擴展到N人博弈結構,并將博弈論系統地應用到經濟領域,從而奠定了這門學科的基礎和理論體系。

從1950年到1951年,約翰·福布斯·納什(約翰 福布斯)利用不動點定理證明了平衡點的存在性,為博弈論的推廣打下了堅實的基礎。納什 ■開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡的存在定理。此外,萊因哈德·澤爾騰、約翰·哈薩尼 美國的研究也促進了博弈論的發展。今天,博弈論已經發展成為一門相對完善的學科。

諾貝爾獎

自1994年諾貝爾經濟學獎授予三位博弈論專家以來,已經有七位諾貝爾經濟學獎與博弈論的研究有關,分別是:

約翰·海薩尼

約翰·海薩尼

1994年,它被授予加州大學伯克利分校的約翰·海薩尼(J.哈爾薩尼)普林斯頓大學的約翰·納什(J.Nash)和波恩大學的賴因哈德·澤爾滕(萊因哈德 很少見)為了表彰這三位數學家 對非合作博弈均衡分析理論的開創性貢獻,對博弈論和經濟學產生了重大影響。

1996年,它被授予英國劍橋大學的詹姆斯·莫里斯(詹姆斯 A. 米爾利)和美國哥倫比亞大學的威廉·維克瑞(威廉 維克瑞)前者在信息經濟學理論領域,特別是在非對稱信息下的經濟激勵理論方面做出了巨大貢獻,后者在信息經濟學方面做出了巨大貢獻、激勵理論、博弈論等方面都有很大的貢獻。

2001年,它被授予加州大學伯克利分校的喬治·阿克爾洛夫(喬治 A. Akerlof )美國斯坦福大學的邁克爾·斯賓塞(A.邁克爾 )和美國哥倫比亞大學的約瑟夫·斯蒂格利茨(約瑟夫 E.斯蒂格利茨)他們的研究為不對稱信息市場的一般理論奠定了基礎,他們的理論很快得到應用從傳統的農業市場到現代的金融市場,它們的貢獻來自于現代信息經濟學的核心。

2005年,它被授予馬里蘭大學的托馬斯·克羅姆比·謝林(謝林)和耶路撒冷希伯來大學的羅伯特·約翰·奧曼(羅伯特 )兩者的研究通過博弈論分析促進了對沖突與合作的理解。

2007年,它被授予明尼蘇達大學的Leonid·赫維茨(Leonid Hurwicz)美國普林斯頓大學的埃里克·馬斯金(Eric S. 馬斯金)以及美國芝加哥大學的羅杰·邁爾森(羅杰 B. 邁爾森)這三者的研究為機制設計理論奠定了基礎。

2012年,它被授予美國經濟學家歐文·羅斯(艾爾文東 號. 羅斯)與羅伊德·沙普利(勞埃德 S.沙普利街 號)他們創建“穩定分配”的理論,并進行“市場設計”的實踐。2]

作為一門工具學科,能如此廣泛地應用于經濟學,并得到學術界的關注,實屬罕見。

2014年,授予法國經濟學家梯若爾。他在產業組織和共謀理論中采用了博弈論的思想,從而使理論和問題得以解決。監管理論也有創新。

博弈要素

1.局中人:在一場比賽或游戲中,每一個擁有決策權的參與者都成了玩家。只有兩個玩家的博弈現象叫做“兩人博弈”,兩個以上玩家的游戲稱為“多人博弈”

2.策略:在一個游戲中,游戲中的每一個人都有一個切實可行的完整的行動計劃,即該計劃不是某一階段的行動計劃,而是指導整個行動的計劃,而一個玩家自始至終計劃的一個可行的行動計劃,在這個游戲中稱為該玩家的一個策略。如果每個人在一個博弈中都有有限數量的策略,那就叫“有限博弈”,否則稱為“無限博弈”

3.得失:一局結束的結果叫做得失。一局結束時每個局中人的得失不僅與局中人自己選擇的策略有關,還與整體局中人選擇的一套政策有關。所以,在游戲結束時,每個人都 s“得失”是全局的人定的一套政策的作用,通常叫做支付(payoff)函數。

4.對于游戲參與者來說,有一個游戲結果。

5.博弈涉及到均衡:均衡就是均衡在經濟學中,均衡意味著相關量處于一個穩定的值。在供求關系中,如果一個商品市場處于某個價格,在這個價格上想買這個商品的人都可以買,想賣的人都可以賣這個時候,我們說這種商品的供求達到了平衡。所謂納什均衡就是一個穩定的博弈結果。

博弈論研究的假設:

決策者是理性的,最大化自己的利益;

完全理性是常識;

假設每個參與者都對環境和其他參與者的行為形成正確的信念和期望。

博弈類型

游戲的分類根據不同的基準有不同的分類。

一般來說,游戲可以分為合作游戲和非合作游戲。合作博弈與非合作博弈的區別在于互動雙方之間是否存在有約束力的協議如果有,就是合作博弈,如果沒有,就是非合作博弈。

從行為的時間順序來看,博弈論又進一步分為靜態博弈、動態博弈兩類:靜態博弈是指在博弈中,參與者同時選擇或不同時選擇,但后一個參與者不選擇我不知道第一個演員采取了什么具體行動;動態博弈是指在博弈中,參與者的行動是有順序的,后面的行動者可以觀察到第一個行動者選擇的行動。通俗的理解:囚徒困境'就是同時做決策,屬于靜態博弈;棋牌游戲的決策或行動具有優先權,屬于動態博弈

根據參與者的說法對其他參與者的理解,它分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中每個玩家對其他玩家的特征、策略空間和收益函數具有準確的信息。不完全信息博弈是指如果一個參與者具有其他參與者的特征,、策略空間和收益函數的信息不夠準確、或者不針對所有參與者、策略空間和收益函數都有精確信息,這種情況下玩的博弈是不完全信息博弈。

經濟學家講的博弈論一般是指非合作博弈由于合作博弈比非合作博弈更復雜,其理論成熟度遠不如非合作博弈。非合作博弈分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四個博弈相對應的均衡概念是:納什均衡(納什 平衡)子博弈精煉納什均衡(子游戲 完美納什街 號平衡)貝葉斯納什均衡(貝葉斯納什街 號均衡)精煉貝葉斯均衡(完美的平衡)

博弈論有很多分類,比如:博弈的次數或持續時間可分為有限博弈和無限博弈;在表現形式上,也可以分為一般類型(戰略型)或者展開型;根據博弈邏輯基礎的不同,可以分為傳統博弈和進化博弈。

納什均衡

納什均衡(納什 平衡)在一個策略組合中,所有的參與者都面臨著這樣的情況當其他人的策略無效時,他的策略是最佳的他們不會改變策略。換句話說,如果他此時改變策略,他的支付就會減少。在納什均衡點上,每個理性的參與者都不會有單獨改變策略的沖動。證明納什均衡點存在的前提是“博弈均衡偶”概念的提出

博弈論

所謂“均衡偶”就是在兩人零和博弈中,當局中的人A采用了他的最優策略A*,參與人B也采用其最優策略B*如果玩家還是拿b*而參與人A采取了另一個策略A,那么參與人A不會比他采取原來的策略A付出更多*的支付。這個結果對于玩家b也是成立的。

這樣,“均衡偶”的明確定義為:一對策略a*屬于策略集A)和策略b*屬于策略集B)稱之為平衡對對于任何策略A,(屬于策略集A)和策略b(屬于策略集B),總有:

rect/rectrect/rectrect/復制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path對于非零和博弈,也有以下定義:一對策略a*屬于策略集A)和策略b*屬于策略集B)它被稱為非零和博弈的均衡對,對于任何策略A(屬于策略集A)和策略b(屬于策略集B),總有:對局中人A的rect/rectrect/rectrect/復制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path對局中人B的rect/rectrect/rectrect/復制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path有了上面的定義,納什定理馬上就可以得到了:

任何有限純策略的二人對策至少有一個均衡對。這個均衡對叫做納什均衡點。

納什定理的嚴格證明需要不動點理論,不動點理論是研究經濟均衡的主要工具。一般來說,找到平衡點的存在性就相當于找到了博弈的不動點。

納什均衡點的概念提供了一個非常重要的分析手段,使得博弈論研究能夠在一個博弈結構中找到更有意義的結果。

然而,納什均衡點的定義僅限于任何不滿足以下條件的參與者t不想單方面改變自己的策略,忽略了其他玩家改變策略的可能性所以很多時候納什均衡點的結論是沒有說服力的,研究者形象地稱之為“天真可愛的納什均衡點”

塞爾頓(R·Selten)從多重均衡中剔除一些按照一定規則不合理的均衡點,從而形成兩個均衡的精煉概念:子博弈完美均衡和顫抖手完美均衡。

案例一

囚徒困境

在博弈論中,塔克給出了一個著名的優勢戰略均衡的例子“囚徒困境”囚犯'進退兩難)博弈模型。這個模型以一種特殊的方式告訴我們一個警察和一個小偷的故事。假設有兩個小偷,甲和乙,他們共同犯罪、警察抓到我闖入一所房子。警察把這兩個人放在兩個不同的房間里審問對于每個嫌疑人,警方給出的政策是:如果兩個嫌疑人都供認了自己的罪行,交出了贓物,那么證據確鑿,兩人都被定罪,判處有期徒刑8年;如果只有一個犯罪嫌疑人坦白,另一個人不坦白而否認,則視為妨害公務(因為有證據表明他有罪)額外的兩年徒刑,坦白立功者減刑8年,立即釋放。如果他們都否認,警察可以 由于證據不足,我們不能判定他們犯有盜竊罪,但他們每個人都可以因非法侵入罪被判處一年監禁。下表顯示了這個博弈的收益矩陣。

首先,雖然他不t不知道B選什么,他知道不管B選什么,他都選“坦白”總是最優的。很明顯,根據對稱性,B也會選擇“坦白”結果兩人都被判有期徒刑八年。然而,如果他們都選擇“抵賴”,每人只判了一年。在表2.在2的四個行動選項中,(抵賴、抵賴)它是帕累托最優的,因為任何偏離這個行動選擇組合的其他行動選擇組合至少會使一個人 情況變得更糟。但是,“坦白”是任何犯罪嫌疑人的主導策略,而且(坦白,坦白)它是一個占優的戰略均衡,即納什均衡。不難看出,納什均衡和帕累托在這里是有沖突的。

從數學的角度來說,這個理論是合理的,即所有的選擇都是坦誠的。但在這種多維信息共同作用的社會學領域,顯然是不合適的。就像中國古代稱官員之間的賄賂一樣“陋規”這是因為社會制度束縛了人們 的行為和強迫人們 改變的決定。比如從心理學角度來說,選擇表白的成本會更大,一方 s的表白會讓對方心虛,所以事后的報復也不會輕易在身邊的知情人中展開“出賣”這個角色會讓他付出更多。

但8到10年增加的比例會被稀釋,人的尊嚴會讓人產生報復心理,稍有斷裂“行規”我們正處于大數據時代要處理一件事更接近事實,就要盡可能多的掌握相關信息,進行合理的加權分析人的動機和的移動圖像是復雜的,所以囚犯 s困境只能作為簡化模型的參考,具體決策需要具體分析。

案例二

智豬博弈

一、經濟學中的“智豬博弈”Pigs’payoffs)這個例子講的是:

假設豬圈里有一頭大豬、一頭小豬。豬圈的一頭有一個豬槽(兩豬均在食槽端)在另一端,有一個控制豬食供應的按鈕當你按下按鈕時,10個單位的豬食將進入食槽,但在前往食槽的途中,將有兩個單位的豬食的物理消耗如果大豬先到達低谷,那么大豬與食物的收益比為9 1;同時行動(去按按鈕),收益比例為7 3;仔豬先到低谷,收益比6∶4。那么,在兩頭豬都明智的前提下,最后的結果是小豬選擇等待。

智豬博弈'由納什在1950年提出。其實小豬選擇等待,讓大豬按控制鍵,自己選擇“坐船”或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,如果小豬選擇等待,小豬可以獲得四個單位的凈收入,而如果小豬行動,只能獲得大豬留下的一個單位的凈收入,所以等待比行動好;在大豬選擇等待的前提下,如果小豬行動,小豬的收益將無法覆蓋成本,凈收益為-1單位,如果大豬也選擇等待,那么小豬的收益為零,成本為零總之,等待勝于行動。

用博弈論中的報酬矩陣可以更清晰地描述小豬的選擇:

大豬/小豬

行動

等待

行動

5,1

4,4

等待

9,-1

0,0

從矩陣中可以看出,當大豬選擇行動時,如果小豬行動,它的收益是1,而如果小豬等待,它的收益是4,所以小豬選擇等待;當大豬選擇等待時,如果小豬行動,它的收益是-1,而如果豬等,收益為0,所以豬也選擇等。綜合來看,無論大豬選擇行動還是等待,小豬的選擇都會是等待,即等待是小豬的優勢策略。

在小型企業的管理中,學習如何“搭便車”是一個精明職業經理人最基本的素質。在某些時候,等待,讓其他大企業先開拓市場,是明智的選擇。在這個時候,你可以做一些事情,如果你不 不要做某事!

聰明的管理者善于利用各種有利條件為自己服務。搭便車”其實,職業經理人面對每一筆開銷,都是另一種選擇關注和研究它,可以為企業節省很多不必要的開支,使企業的管理和發展再上一個新臺階。這種現象在經濟生活中很常見,但小企業的管理者很少熟悉。

在智能豬游戲中,雖然豬 s“撿現成”這種行為在道德上是令人厭惡的,但不是游戲策略的主要目的是最大化一個人通過使用策略來維護自己的利益?

案例三

美女的硬幣

一個陌生的美女來找你聊天,要求和你玩一個游戲。美女提議:讓 每個都顯示硬幣的一面,正面或負面。如果我們都是頭,那我給你3元,如果我們都是尾,我給你1元,剩下的你給我2元。聽起來是個不錯的提議。如果我是男的,我無論如何都會玩,但是經濟上的考慮就是另一回事了這個游戲真的足夠公平嗎?

紳士/美女

女正面

女反面

正面

3,-3

2,+2

反面

2,+2

1,-1

假設我們頭的概率是X,尾的概率是利益最大化當對手正面或反面時,我們應該有相等的回報,否則對手總是可以改變正面和反面的概率來減少我們的總收入,所以這里列出的等式是

一般來說,這個等式意味著當你的對手總是積極的時候,你得到的好處和當你的對手總是消極的時候,你得到的好處是一樣的,也是最大的。解方程,也就是說平均每八次呈現三頭五尾是我們的最佳策略。而你把它代入收益表達式就可以得到每次的預期收益,計算結果是。

同樣,讓 s假設美女從前面出來的概率是y,反過來的概率是列方程的解也等于y,美女每次的期望收益是。這告訴我們,當雙方都采取最優策略時,一般的美女每次都是贏家。事實上,只要美麗需要(這個方案,不管你再采用什么方案,都能 不要改變現狀。如果所有的頭都出了,每次的期望收益就是如果所有的尾都出了,那么每次的期望收益也是。而任何策略無非是上述兩種策略的線性組合,所以期望仍然是。但是當你也采取最優策略的時候,至少可以保證你損失最小。否則你肯定會被美女采取的策略盯上,從而失去更多??雌饋磉@個博弈模型沒什么用,但實際上可能涉及到金融市場定價中最重要的模型:定價權重模型了。

總的來說“博弈論”其本質是以游戲的形式展現日常生活中的競爭矛盾,用數學和邏輯的方法分析事物的運行規律。既然有游戲的參與者,就一定有游戲規則的制定者。深刻理解競爭行為的本質,有助于我們分析和掌握競爭中事物之間的關系,也更便于我們制定和調整規則,使其最終按照我們預期的目的運行。

社會應用

《孫子兵法》是中國乃至世界上最早的經典博弈論書籍近年來,由于博弈論在世界范圍內的普及,出現了很多收集整理博弈論知識的書籍,比如《博弈論的詭計》、03010等。中國經緯智庫是最早研究新博弈論的民間智庫之一由宋雪峰主任領導的《最神奇的博弈論定律》《多腿凳定律》《定量無窮大》在社會和經濟發展的各個方面都被引用。

博弈論”結合傳統咨詢工具,可以幫助企業解決戰略定位、股權分配、股權融資、價值塑造、商業模式等疑難雜癥的新視角。

主站蜘蛛池模板: 双峰县| 南宁市| 淮北市| 微博| 文成县| 伊春市| 巫溪县| 乌拉特后旗| 通江县| 明溪县| 宁陵县| 临西县| 基隆市| 雷山县| 德清县| 尉犁县| 柳河县| 泰安市| 饶河县| 普安县| 东辽县| 贵溪市| 郯城县| 武冈市| 平阳县| 襄垣县| 澄江县| 恭城| 阳西县| 濮阳市| 时尚| 阳朔县| 凤凰县| 墨玉县| 南康市| 千阳县| 双城市| 中牟县| 崇明县| 夏邑县| 化德县|