博弈是什么意思博弈的分類
博弈是什么意思博弈的分類
博弈本意是:下棋。引申義是:在一定條件下,遵守一定的規(guī)則,一個(gè)或幾個(gè)擁有絕對理性思維的人或團(tuán)隊(duì),從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)施,并從中各自取得相應(yīng)結(jié)果或收益的過程。那么你對博弈了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于博弈是什么意思的內(nèi)容,希望大家喜歡!
博弈的簡介
一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
博弈的分類
從博弈的研究范式來劃分,可分為傳統(tǒng)博弈論和演化博弈論;從博弈的具體應(yīng)用來劃分,可分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈是指在博弈中,兩個(gè)參與人同時(shí)選擇或兩人不同時(shí)選擇,但后行動者并不知道先行動者采取什么樣的具體行動。對雙方來說,都容易形成混沌的行為重組,由于規(guī)則的嚴(yán)密與精細(xì),任何人因時(shí)間問題、資金問題、心理問題等等,致使在多次均衡后直到不明不白地造成大輸,參與靜態(tài)博弈和動態(tài)博弈的大部分都是這種人。動態(tài)博弈是指在博弈中,兩個(gè)參與人有行動的先后順序,且后行動者能夠觀察到先行動者所選擇的行動。
根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動,博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。
所謂合作性博弈是指參與者從自己的利益出發(fā)與其他參與者談判達(dá)成協(xié)議或形成聯(lián)盟,其結(jié)果對聯(lián)盟方均有利;而非合作性博弈是指參與者在行動選擇時(shí)無法達(dá)成約束性的協(xié)議。人們分工與交換的經(jīng)濟(jì)活動以及囚徒困境就是合作性的博弈,而公共資源悲劇都是非合作性的博弈。
從知識的擁有程度來看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈指參與者對所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴(yán)格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識”的博弈。對于不完全信息博弈,參與者所做的是努力使自己的期望支付或期望效用最大化。
以此博弈哲學(xué)語言也可體現(xiàn)出以下四種博弈分類:
完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈
其中策略性博弈應(yīng)屬于完全信息靜態(tài)博弈,而完全信息動態(tài)博弈則包括擴(kuò)展性博弈和重復(fù)博弈等;不完全信息靜態(tài)博弈則是以貝葉斯均衡等理論完成對混合策略的重新解釋,不完全信息動態(tài)博弈則是完美貝葉斯均衡為核心概念的信號博弈。
博弈論的介紹
博弈論又被稱為對策論(Game Theory)既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。
博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。 博弈論考慮游戲中的個(gè)體的預(yù)測行為和實(shí)際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來理解和預(yù)測進(jìn)化論的某些結(jié)果。博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。在生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用?;靖拍钪邪ň种腥恕⑿袆?、信息、策略、收益、均衡和結(jié)果等。其中局中人、策略和收益是最基本要素。局中人、行動和結(jié)果被統(tǒng)稱為博弈規(guī)則。
博弈論畢竟是數(shù)學(xué),更確切地說是運(yùn)籌學(xué)的一個(gè)分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟(jì)生活問題,所以不能不食人間煙火。其實(shí)這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點(diǎn)玄奧,實(shí)際上卻具有重要現(xiàn)實(shí)意義。博弈論大師看經(jīng)濟(jì)社會問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財(cái)物被盜。警方在此案的偵破過程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨(dú)談話。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個(gè)月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因?yàn)樘拱捉淮梢云谕玫胶芏痰谋O(jiān)禁———3個(gè)月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因?yàn)?,每一方在選擇策略時(shí)都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。不妨讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在《國富論》中的名言:“通過追求(個(gè)人的)自身利益,他常常會比其實(shí)際上想做的那樣更有效地促進(jìn)社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動搖了西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價(jià)格戰(zhàn)、軍備競賽、污染等等。一般的博弈問題由三個(gè)要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個(gè)特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個(gè)要素。
看過“博弈的分類”的人還看了:
1.博弈論心得體會