
電大博弈與決策形成性考核冊(cè)答案
- 更新時(shí)間:2016-06-29
-
電大作業(yè)
以下是為您推薦的《電大博弈與決策形成性考核冊(cè)答案》,希望能對(duì)您的工作、學(xué)習(xí)、生活有幫助,歡迎閱讀參考!
因部分圖片無(wú)法顯示,完整答案請(qǐng)下載文末附件
博弈與決策
一、名詞解釋
1.博弈論:是指研究多個(gè)個(gè)體或團(tuán)隊(duì)之間在特定條件制約下的對(duì)局中,利用相關(guān)方的策略而實(shí)施對(duì)應(yīng)策略的學(xué)科。
2.完全信息:是指所有參與者各自選擇的行動(dòng)的不同組合所決定的收益對(duì)所有參與者來(lái)說(shuō)是共同知識(shí)。
3.靜態(tài)博弈:是指博弈中參與者同時(shí)采取行動(dòng),或者盡管參與者行動(dòng)的采取有先后順序,但后行動(dòng)的人并不知道先采取行動(dòng)的人采取的是什么行動(dòng)。
4.動(dòng)態(tài)博弈:指的是參與人的行動(dòng)有先有后,而且后選擇行動(dòng)的一方可以看到先采取行動(dòng)的人所選擇的行動(dòng)。
5.非合作博弈:如果參與者之間不可能或者根本沒(méi)辦法達(dá)成具有約束力的協(xié)議,不能在一個(gè)統(tǒng)一的框架下采取行動(dòng)的話,這種博弈類(lèi)型就是非合作博弈。
6.納什均衡:是對(duì)于每一個(gè)博弈參與者來(lái)說(shuō)是這樣的一個(gè)戰(zhàn)略組合,即給定其他參與者的戰(zhàn)略,每一個(gè)參與者的這個(gè)戰(zhàn)略能使其期望效用最大化。
7.純策略:如果在每個(gè)給定信息下,只能選擇一種特定策略,而且參與者選擇了這個(gè)策略之后就不會(huì)單方面改變自己的策略,這個(gè)策略就是純策略。
8.純策略納什均衡:是指在一個(gè)純策略組合中,如果給定其他的策略不變,在該策略組合下參與者不會(huì)單方面改變自己的策略,否則會(huì)使策略組合令人后悔或者不滿意。
答:(1)對(duì)可口可樂(lè)而言,高價(jià)是劣勢(shì)策略,用橫線劃去“高價(jià)”所對(duì)應(yīng)的行;
(2)對(duì)百事可樂(lè)而言,高價(jià)是劣勢(shì)策略,用豎線劃去“高價(jià)”所對(duì)應(yīng)的列;
(3)余下的策略組合是(低價(jià),低價(jià)),這就是該博弈的最優(yōu)結(jié)果。
[注:步驟(1)(2)顛倒亦可]
答:(1)對(duì)員工乙而言,策略R是明顯劣勢(shì)策略,用豎線劃去“R”所對(duì)應(yīng)的列;
(2)對(duì)員工甲而言,在員工乙剔除R策略之后,C策略是劣勢(shì)策略,用橫線劃去“C”所對(duì)應(yīng)的行;
(3)對(duì)員工乙而言,此時(shí)劣勢(shì)的策略是L,用豎線劃去“L”所對(duì)應(yīng)的列;
(4)對(duì)員工甲而言,此時(shí)劣勢(shì)的策略是D,用豎線劃去“D”所對(duì)應(yīng)的行;
(5)余下的策略組合是(U,M),這就是該博弈的最優(yōu)結(jié)果。
三、根據(jù)優(yōu)勢(shì)策略下劃線法找出以下博弈的純策略納什均衡,并指出是否存在混合策略納什均衡。
要求: (1)劃出相應(yīng)優(yōu)勢(shì)策略的下劃線;(2)給出最優(yōu)的博弈結(jié)果。

答:(1)下劃線如圖所示;
(2)沒(méi)有形成一個(gè)純策略納什均衡。
(3)按照納什均衡存在性定理,這里還存在一個(gè)混合策略納什均衡。
[注:括號(hào)的數(shù)字和字母順序不能顛倒]
2號(hào)廠商
W X Y
1號(hào)廠商 A 3
7 2
0 5
4
B 6
8 2
2 5
0
答:(1)下劃線如圖所示;
(2)形成兩個(gè)純策略納什均衡,即(A,Y)和(B,W)。
(3)博弈的結(jié)果有兩個(gè):(4,5),即1號(hào)廠商獲得4單位支付,2號(hào)廠商獲得5單位支付;(8,6),即1號(hào)廠商獲得8單位支付,2號(hào)廠商獲得6單位支付。
(4)按照納什均衡存在性定理,這里還存在一個(gè)混合策略納什均衡。
[注:括號(hào)的數(shù)字和字母順序不能顛倒]
四、在以下博弈矩陣圖中找出哪一個(gè)是囚徒困境博弈,并簡(jiǎn)要解釋理由。
乙
壞心 好心
甲 壞心 12
10 2
50
好心 60
12 39
100
圖1-1
乙
壞心 好心
甲 壞心 12
10 0
110
好心 50
0 39
100
圖1-2
乙
壞心 好心
甲 壞心 20
10 0
30
好心 30
0 12
11
圖1-3
答:(1)利用下劃線法找出博弈的納什均衡,如圖所示。
(2)囚徒困境反映的是基于個(gè)人理性的個(gè)體最佳選擇并非集體最佳選擇,參與者之間會(huì)選擇相互“壞心”,而且對(duì)雙方而言,(好心,好心)的結(jié)果一定要比(壞心,壞心)更好。
(3)在三個(gè)博弈中,圖1-1不是囚徒困境博弈,因?yàn)閰⑴c者甲在選擇“好心”(即合作)策略時(shí)才能實(shí)現(xiàn)均衡。圖1-2所示的博弈為囚徒困境博弈,因?yàn)閰⑴c者只有在都選擇“壞心”(即不合作)策略時(shí)才能實(shí)現(xiàn)均衡。圖1-32所示的博弈也不是囚徒困境博弈,因?yàn)閷?duì)乙而言,(壞心,壞心)的結(jié)果比(好心,好心)的結(jié)果有利。
五、博弈分析
假設(shè)你所在的公司現(xiàn)在的發(fā)展雖然還可以,但是未來(lái)前景不容樂(lè)觀,所以老板只能對(duì)一個(gè)人加薪。如果你和你的同事之間只有一個(gè)人提出來(lái)加薪的請(qǐng)求,老板會(huì)考慮為提出要求的這個(gè)員工加薪,當(dāng)然不會(huì)對(duì)那個(gè)沒(méi)有提出來(lái)的員工加薪了。但是假如你和你的同事兩個(gè)人一起提出來(lái)要加薪,那么老板就只有選擇同時(shí)辭退你們倆。
請(qǐng)給出這個(gè)博弈的矩陣分析圖,并解釋你最優(yōu)的策略。
答:該博弈矩陣如下:
同事
要求 不要求
你 要求 被辭退
被辭退 無(wú)影響
加薪
不要求 加薪
無(wú)影響 無(wú)影響
無(wú)影響
根據(jù)下劃線方法,在這個(gè)博弈中,我們可以找到兩個(gè)納什均衡,即(要求,不要求)和(不要求,要求)。這個(gè)結(jié)果說(shuō)明,你和同事只能一方提出加薪的要求才可以,同時(shí)選擇要求加薪的行動(dòng)只會(huì)帶來(lái)最壞的結(jié)果——都被辭退。
換句話說(shuō),你要想獲得福利的改進(jìn),就應(yīng)該先行一步提出來(lái)加薪的要求。而假如你看到你的同事首先選擇了要求加薪的策略之后,你最好不再提出來(lái)這樣的要求。
平時(shí)作業(yè)講評(píng)(2)
一、名詞解釋
1.不確定性:就是指經(jīng)濟(jì)行為者在事先不能準(zhǔn)確地知道自己的某種決策的結(jié)果,或者說(shuō),只要經(jīng)濟(jì)行為主體的一種決策的可能結(jié)果不止一種,就會(huì)產(chǎn)生不確定性。
2.最大期望收益法:就是在事件結(jié)果不確定的情況下,應(yīng)該選擇給他帶來(lái)“期望收益”最大的策略。
3.混合策略:如果在每個(gè)給定信息下,參與者只能以某種概率選擇不同地策略,就稱(chēng)為混合策略。
4.支付均等法:當(dāng)一個(gè)參與者在均衡中應(yīng)用一個(gè)混合策略時(shí),他所得到的支付必須與他在混合策略中所應(yīng)用的每一個(gè)純策略的支付相同。
5.子博弈:如果從第一階段以外的某個(gè)階段開(kāi)始的后續(xù)博弈階段,也有初始信息集,具備進(jìn)行博弈所需要的各種信息,能夠自成一個(gè)博弈,我們就將這個(gè)博弈階段稱(chēng)為原動(dòng)態(tài)博弈的一個(gè)“子博弈”。
6.逆向歸納法:從最后一個(gè)階段或最后一個(gè)子博弈開(kāi)始逆推上去,逐步向前倒推以求解動(dòng)態(tài)博弈均衡,這就是逆向歸納法。
7.承諾:就是對(duì)愿意與你合作的人給予回報(bào)的方式。
8.空洞威脅:當(dāng)發(fā)出威脅的博弈參與者選擇威脅所宣稱(chēng)的行動(dòng)策略時(shí),對(duì)自己并沒(méi)有好處,這就不可信了,這叫做“空洞威脅”。
二、請(qǐng)用最大期望收益法尋找最優(yōu)策略。
要求: (1)寫(xiě)出計(jì)算步驟;(2)給出最優(yōu)的策略結(jié)果。
甲乙兩家企業(yè),為了市場(chǎng)份額的爭(zhēng)奪,在價(jià)格定制問(wèn)題上各有兩種純策略,如圖2-1所示。兩家企業(yè)都知道自己在各個(gè)策略組合下的收益情況,但是并不知道對(duì)方的收益。假設(shè)甲采取U的概率為0.3,乙采取R的概率為0.6。
乙
L R
甲 U 1
2 4
3
D 4
4 2
1
答:(1)當(dāng)乙采取R策略的可能性為0.6時(shí),采取L策略的可能性為0.4,那么甲據(jù)此判斷采取自己的策略U時(shí)所獲得的可能的期望收益EU(U)=0.6×2+0.4×3=2.4。甲采取自己的策略D時(shí)所獲得的可能的期望收益EU(D)=0.6×4+0.4×1=2.8。很顯然,甲應(yīng)該選擇策略D,因?yàn)镋U(D)> EU(U)。
(2)當(dāng)甲采取U策略的可能性為0.3時(shí),采取D策略的可能性為0.7,那么乙據(jù)此判斷采取自己的策略L時(shí)所獲得的可能的期望收益EU(L)=0.3×1+0.7×4=3.1。乙采取自己的策略R時(shí)所獲得的可能的期望收益EU(R)=0.3×4+0.7×2=2.6。很顯然,乙應(yīng)該選擇策略L,因?yàn)镋U(L)> EU(R)。
(3)最終該博弈的結(jié)果就是(D,L),均衡的支付為(4,4)。
三、求解以下博弈的所有納什均衡。
要求: (1)寫(xiě)出計(jì)算步驟;(2)給出所有納什均衡策略。
曹操
華容道 其它路
關(guān)羽 華容道 -2
2 3
-2
其它路 1
-2 -1
2
答:(1)對(duì)該博弈矩陣?yán)孟聞澗€法,發(fā)現(xiàn)沒(méi)有純策略納什均衡。
(2)假設(shè)關(guān)羽選擇華容道的概率為p,選擇另外一條道的概率為1-p;也假設(shè)曹操選擇華容道的概率為q,選擇另外一條道的概率為1-q。
根據(jù)支付均等法:
對(duì)關(guān)羽而言,U華容道= U其他路,即2•q+(-2)•(1-q)= (-2)•q+2•(1-q),可以得到q=1/2。
對(duì)于曹操而言,V華容道= V其他路,即(-2)•p+1•(1-p)=3•p+(-1)•(1-p),可以得到p=2/7。
該博弈的混合納什均衡為(2/7,1/2)。
2號(hào)廠商
X Y
1號(hào)廠商 A 10
10 4
1
B 1
4 5
5
答:(1)對(duì)該博弈矩陣?yán)孟聞澗€法,發(fā)現(xiàn)有兩個(gè)純策略納什均衡(A,X)和(B,Y)。
(2)假設(shè)1號(hào)廠商選擇A的概率為p,選擇B的概率為1-p;也假設(shè)2號(hào)廠商選擇X的概率為q,選擇Y的概率為1-q。
根據(jù)支付均等法:
對(duì)1號(hào)廠商而言,UA= UB,即10•q+1•(1-q)=4•q+5•(1-q),可以得到q=2/5。
對(duì)2號(hào)廠商而言,VX= VY,即10•p+1•(1-p)=4•p+5•(1-p),可以得到p=2/5。
該博弈的混合納什均衡為(2/5,2/5)。
四、請(qǐng)用逆向歸納法分析以下博弈的可能結(jié)果。
答:(1)逆向歸納法畫(huà)圖如圖所示。
(2)可能的均衡路徑為A—U,1號(hào)參與者選A,2號(hào)參與者選U,結(jié)果為(20,20),雙方各得到20單位的報(bào)酬。
(3)C—Y路徑上的報(bào)酬(1000,1000)遠(yuǎn)大于A—U路徑上的(20,20),但是并不能成為均衡。因?yàn)槿绻?號(hào)參與者選擇了C,2號(hào)參與者選擇Z就可以獲得做大的報(bào)酬,并使1號(hào)只能獲得0單位報(bào)酬。1號(hào)參與者并不能保證2號(hào)參與者會(huì)選擇Z,而且2號(hào)即使有這種保證也是不可信的。
五、尋找可信的威脅。
假如有兩個(gè)博弈參與者,2號(hào)威脅1號(hào)說(shuō),假如1號(hào)參與者對(duì)他使壞心,他就會(huì)對(duì)1號(hào)參與者也使壞心。那么在以下哪些博弈圖中,1號(hào)會(huì)相信2號(hào)的威脅?
圖2-1 圖2-2
圖2-3
答:(1)對(duì)三個(gè)博弈圖利用逆向歸納法分析,如圖所示。
(2)只有當(dāng)壞心比好心對(duì)2號(hào)參與者更有利時(shí),2號(hào)所提出的威脅才可信。
(3)在圖2-1和2-2中的威脅才可信。因?yàn)槿绻?號(hào)選擇壞心的話,2號(hào)選擇壞心才是最優(yōu)的,所以威脅可信。
(4)在圖2-3中,2號(hào)所提出的威脅不可信。因?yàn)槿绻?號(hào)選擇壞心的話,2號(hào)選擇好心才是最優(yōu)的,不會(huì)選擇壞心的。
六、博弈分析
1.假設(shè)你是公司的管理者,某天有位員工向你提出加薪的要求,但是你既不舍得他辭職,也暫時(shí)不想給他加薪,那么你該如何巧妙地回絕呢?
答:你應(yīng)該告訴他,加薪這事不屬于你管,有專(zhuān)門(mén)的部門(mén)或其他領(lǐng)導(dǎo)負(fù)責(zé)。所以,你對(duì)此無(wú)能為力,因?yàn)槟銓?duì)此事沒(méi)有決定權(quán)。而一旦知道自己要和這樣的人力資源部門(mén)去博弈了,這位員工的立場(chǎng)就會(huì)發(fā)生變化,也許就會(huì)軟化下來(lái)。
2.(1)如果一個(gè)男孩子給女孩發(fā)短信說(shuō):“親愛(ài)的,你知道我愛(ài)你愛(ài)得很深,我愿意為你赴湯蹈火,我每天每時(shí)每刻都很想見(jiàn)到你,什么艱難險(xiǎn)阻也不能阻止我向你靠近。周五下班的時(shí)候,如果不下雨,我就一定過(guò)去找你!”。(2)有一位父親對(duì)自己很淘氣的兒子說(shuō)“你再不聽(tīng)話,我就擰掉你的耳朵!”請(qǐng)你分析一下這兩個(gè)場(chǎng)景中的“承諾”和“威脅”是否值得信賴。
答:(1)中的男孩對(duì)女孩的“承諾”是不可信的,因?yàn)椤跋掠辍笔且患杀竞苄〉氖拢悄泻s因此不能去做他所說(shuō)的“每天每時(shí)每刻都很想見(jiàn)到你,什么艱難險(xiǎn)阻也不能阻止我向你靠近”。所以,廉價(jià)的承諾是不可置信的。
(2)中的父親的“威脅”是不可置信的“空洞威脅”。因?yàn)閿Q掉兒子的耳朵對(duì)他并沒(méi)有任何好處,還會(huì)因此帶來(lái)更大的負(fù)擔(dān),也影響了孩子的一生,父親也要為此背負(fù)一輩子的心理成本和經(jīng)濟(jì)成本。對(duì)孩子而言,這也是一生的不良影響和沉重的心理負(fù)擔(dān),以及巨大的機(jī)會(huì)成本。顯然這個(gè)威脅這對(duì)整個(gè)家庭沒(méi)有任何好處。所以,這個(gè)威脅根本不可置信。
平時(shí)作業(yè)講評(píng)(3)
一、名詞解釋
1.網(wǎng)絡(luò)外部性:如果一種產(chǎn)品對(duì)消費(fèi)者的價(jià)值會(huì)隨著其他使用者數(shù)量增加而增加,這種產(chǎn)品就具有網(wǎng)絡(luò)外部性。
2.大規(guī)模協(xié)調(diào)博弈:源于網(wǎng)絡(luò)外部性,假如有成千上萬(wàn)的人在同時(shí)進(jìn)行一次性博弈,那就形成了大規(guī)模協(xié)調(diào)博弈。
3.重復(fù)博弈:指同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱(chēng)為“階段博弈”。
4.無(wú)名氏定理:只要博弈參與者具有足夠的耐心,那么在滿足博弈參與者個(gè)人理性約束的前提下,博弈參與者之間就總有多種可能達(dá)成合作均衡。
5.針?shù)h相對(duì)策略:如果博弈參與者第一步采取合作,此后每一步都重復(fù)對(duì)方上一步的行動(dòng),要么是合作要么是背叛,只要是博弈沒(méi)有確定的期限,由于長(zhǎng)期利益對(duì)短期行為的制約作用,因此有一些在一次性博弈中不可行的威脅或諾言在重復(fù)博弈中會(huì)變?yōu)榭尚诺模敲淳蜁?huì)形成一種持續(xù)合作的態(tài)勢(shì)。
6.冷酷策略:是指參與人在開(kāi)始時(shí)選擇合作,在接下來(lái)的博弈中,如果對(duì)方合作則繼續(xù)合作,而如果對(duì)方一旦背叛,則永遠(yuǎn)選擇背叛,永不合作。
7.雙邊博弈:在某些博弈中,每個(gè)博弈者的策略組合都相同,博弈者之間的支付或收益對(duì)稱(chēng),這種博弈被稱(chēng)之為雙邊博弈。
8.演化穩(wěn)定策略:說(shuō)的是,如果均衡一旦得以形成,此后偏離均衡的運(yùn)動(dòng)就會(huì)受到自然選擇的打擊。
二、請(qǐng)分析以下重復(fù)博弈的合作與背叛問(wèn)題。
1.圖3-1和3-2的兩個(gè)囚徒困境博弈會(huì)一直重復(fù)下去,而且沒(méi)有確切的截止日期,請(qǐng)問(wèn)哪個(gè)博弈的參與者更有可能出賣(mài)對(duì)方?為什么?
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 5
5
圖3-1
乙
好心 壞心
甲 好心 20
20 22
0
壞心 0
22 5
5
圖3-2
答:圖3-1所示的囚徒困境博弈的參與者更容易背叛對(duì)方。
這圖3-1和圖3-2的兩個(gè)博弈中,雙方都使用好心時(shí),各自獲得20個(gè)單位的支付。一個(gè)參與人在對(duì)方好心而自己使壞心時(shí)獲得的支付是不一樣的,圖3-1為40個(gè)單位,遠(yuǎn)大于好心時(shí)的20個(gè)單位;圖3-2 為22個(gè)單位,僅稍大于好心時(shí)的20個(gè)單位。所以,圖3-1中的參與者更容易背叛對(duì)方。
2.圖3-3和3-4的兩個(gè)囚徒困境博弈會(huì)一直重復(fù)下去,而且沒(méi)有確切的截止日期,請(qǐng)問(wèn)哪個(gè)博弈的參與者更有可能出賣(mài)對(duì)方?為什么?
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 18
18
圖3-3
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 15
15
圖3-4
答:圖3-3所示的囚徒困境博弈的參與者更容易背叛對(duì)方。
這圖3-3和圖3-4的兩個(gè)博弈中,雙方都使用好心時(shí),各自獲得20個(gè)單位的支付;一個(gè)參與人在對(duì)方好心而自己使壞心時(shí)獲得的支付為40單位。在圖3-3中,即使對(duì)方也使用了壞心,雙方也還各自獲得18個(gè)單位支付,與都好心時(shí)相差2個(gè)單位;而在圖3-4中則降低為15個(gè)單位,與都好心時(shí)相差了5個(gè)單位,背叛要付出比較高的代價(jià)。所以,圖3-3中的參與者更容易背叛對(duì)方。
三、分析以下博弈的結(jié)果及策略。
要求: (1)給出可能的博弈均衡;(2)寫(xiě)出應(yīng)采取的行動(dòng)策略。
1.假設(shè)你是一位非常出眾的男士,有一位熱戀的女朋友,她各方面則比較普通。今天晚上在洋河體育場(chǎng)有一場(chǎng)足球比賽,你想去看足球比賽。而此時(shí),在奧體中心也有一場(chǎng)王菲的演唱會(huì),你的女朋友想去聽(tīng)演唱會(huì)。博弈矩陣如下,請(qǐng):(1)分析該博弈的均衡;(2)面對(duì)著沖突,你有哪些行動(dòng)可以選擇?
女方
足球賽 演唱會(huì)
男方 足球賽 1
2 0
0
演唱會(huì) -1
-1 2
1
答:(1)根據(jù)下劃線法,如圖所示,博弈均衡為(足球賽,足球賽)或者(演唱會(huì),演唱會(huì)),即二人要么都去看球賽,要么都去聽(tīng)演唱會(huì)。
(2)你可以選擇:一是主動(dòng)告訴女方,愿意陪她去聽(tīng)演唱會(huì);二是主動(dòng)告訴她,你很想去看足球賽,希望她可以陪你去看;三是自己先發(fā)制人地買(mǎi)好兩張足球賽的票,告訴女方你已經(jīng)買(mǎi)了票;四是利用你自身的優(yōu)勢(shì),告訴她要是不陪你去,有其他人愿意陪你去。
2.你和你的朋友分別經(jīng)營(yíng)著一家企業(yè),你們二人可以考慮合作,也可以不合作。當(dāng)然,基于產(chǎn)品和市場(chǎng)的預(yù)期不同,現(xiàn)在有兩種情形出現(xiàn),分別的博弈矩陣如圖3-5和3-6所示。請(qǐng)你分析:(1)兩種情形分別屬于什么博弈?(2)給出博弈的均衡結(jié)果。
乙
合作 不合作
甲 合作 10
10 4
0
不合作 0
4 4
4
圖3-5
乙
合作 不合作
甲 合作 10
10 12
0
不合作 0
12 4
4
圖3-6
答:(1)圖3-5屬于合作博弈,是獵鹿博弈。有兩個(gè)純策略納什均衡,即(合作,合作)和(不合作,不合作)。如果對(duì)方愿意開(kāi)展合作,甲和乙的最優(yōu)行動(dòng)選擇就是選擇合作,從而各自獲取10個(gè)單位的支付。
(2)圖3-6屬于不合作博弈,是囚徒困境博弈。有一個(gè)純策略納什均衡,即(不合作,不合作)。由于個(gè)人理性的存在,甲乙雙方只有選擇不合作,從而各自獲得4個(gè)單位的支付。
四、請(qǐng)解釋以下問(wèn)題。
1. Windows操作系統(tǒng)與大規(guī)模協(xié)調(diào)博弈以及網(wǎng)絡(luò)外部性有什么關(guān)系?
答:Windows操作系統(tǒng)的使用具有網(wǎng)絡(luò)外部性,使用該系統(tǒng)的人越多,這個(gè)系統(tǒng)的價(jià)值就會(huì)變得越高。這樣一來(lái),使用者就要考慮使用哪種操作系統(tǒng)的普及率更高。假如有成千上萬(wàn)的人在同時(shí)進(jìn)行一次性博弈,那就形成了大規(guī)模協(xié)調(diào)博弈。
2.如果你是一個(gè)理性的人,看到周?chē)呐笥讯贾饾u擁有了QQ賬號(hào),你應(yīng)該怎么做?為什么?
答:QQ這種即時(shí)通訊工具,具有很強(qiáng)的網(wǎng)絡(luò)外部性,使用QQ的人越多,通過(guò)QQ形成的交際網(wǎng)絡(luò)就變得越大,其網(wǎng)絡(luò)價(jià)值就越高了。而如果你周?chē)褂肣Q進(jìn)行聊天交流的人越多,你擁有的QQ賬號(hào)所起的作用就越大。所以,你應(yīng)該也申請(qǐng)一個(gè)QQ賬號(hào)。
3.微軟公司為什么在一定程度上默認(rèn)盜版的泛濫?
答:微軟公司在一定程度上默許了盜版的泛濫,實(shí)際上就是讓自己的產(chǎn)品在市場(chǎng)上逐步深入,得到了更多的使用客戶,從而讓新使用者首先想到的就是要配備安裝微軟公司的Windows系列操作系統(tǒng),從而充分發(fā)揮其產(chǎn)品的網(wǎng)絡(luò)外部性。正是盜版幫助了微軟公司在中國(guó)的發(fā)展,沒(méi)有盜版就沒(méi)有微軟如今在中國(guó)市場(chǎng)上的壟斷地位。
五、博弈分析
假設(shè)你是一家上市公司的董事長(zhǎng),可以選擇如實(shí)披露財(cái)務(wù)數(shù)據(jù)或向投資者說(shuō)謊也就是發(fā)布虛假的信息,投資者可以選擇投資或不投資。博弈矩陣如下。請(qǐng)分析該博弈的均衡策略,你們公司該怎么做?為什么?
投資者
投資 不投資
上市公司 如實(shí)披露 5
5 0
0
虛假披露 -5
10 0
0
答:如果這是一個(gè)單期博弈的話,其納什均衡只有一個(gè)(虛假披露,不投資),即上市公司選擇披露虛假財(cái)務(wù)信息,投資者選擇不投資,雙方的博弈支付均為0。
如果是多期重復(fù)博弈的話,情況就不一樣了,只要在沒(méi)有明確截止期限的情況下,就可以實(shí)現(xiàn)(如實(shí)披露,投資)這個(gè)博弈結(jié)果。但是,一旦企業(yè)披露的信息有誤,有虛假的成分,那么投資者就不會(huì)再相信這個(gè)上市公司,就在接下來(lái)的博弈中選擇不投資。
所以,上市公司要想和投資者達(dá)成合作,就必須向外部的投資者樹(shù)立一種較強(qiáng)的正面的聲譽(yù),不能披露任何虛假的信息,并致力于長(zhǎng)期維護(hù)這個(gè)聲譽(yù),從而保證合作得以持續(xù),(如實(shí)披露,投資)這個(gè)結(jié)果才會(huì)出現(xiàn)。
平時(shí)作業(yè)講評(píng)(4)
一、名詞解釋
1.英式拍賣(mài):也稱(chēng)為公開(kāi)拍賣(mài)或者增價(jià)拍賣(mài),買(mǎi)者自由地相繼出價(jià),且出價(jià)是逐步提高的,直到?jīng)]有人愿意支付更高的價(jià)格為止。
2.第二價(jià)格密封拍賣(mài):每個(gè)競(jìng)標(biāo)者分別向拍賣(mài)方提交自己的報(bào)價(jià),而且他們不知道別人的出價(jià),出價(jià)最高的競(jìng)標(biāo)者將獲得物品,并按所有的出價(jià)中僅次于最高出價(jià)的第二高價(jià)格支付給賣(mài)家。
3.私人價(jià)值拍賣(mài):在這類(lèi)拍賣(mài)中,拍品對(duì)不同競(jìng)標(biāo)者的價(jià)值可能并非是獨(dú)立的,每個(gè)競(jìng)標(biāo)者都確切地知道該拍品對(duì)他本人的價(jià)值,但是卻不能從其他競(jìng)標(biāo)者的估價(jià)中得到對(duì)自己的估價(jià)任何有用的信息。
4.邊緣政策博弈:是一種將博弈參與者和其他對(duì)手置于災(zāi)難發(fā)生的可能性逐步增大的風(fēng)險(xiǎn)中的一種戰(zhàn)略,但是可怕的災(zāi)難結(jié)果實(shí)際上發(fā)生與否并不全在發(fā)出威脅一方的控制之中。
5.信號(hào)顯示:具有信息優(yōu)勢(shì)的一方(擁有私人信息的一方)采取某種行動(dòng)向信息劣勢(shì)一方(不了解對(duì)方私人信息的一方)發(fā)送相關(guān)信號(hào),來(lái)告訴對(duì)方自己的真實(shí)類(lèi)型,這就是信號(hào)顯示。
6.信號(hào)篩選:是在博弈中沒(méi)有私人信息的一方為了減弱非對(duì)稱(chēng)信息對(duì)自己的不利影響,以便能夠區(qū)別不同類(lèi)型的交易對(duì)象而提出的一種交易方式。
7.道德風(fēng)險(xiǎn):就是從事經(jīng)濟(jì)活動(dòng)的代理人在最大限度地增進(jìn)自身效用的同時(shí)做出不利于委托人的行動(dòng)。
8.激勵(lì)相容約束:委托人提供一個(gè)合約,讓代理人在努力工作時(shí)所獲得的收益大于不努力工作時(shí)的收益,這就是激勵(lì)相容約束。
二、請(qǐng)分析以下問(wèn)題。
1.小張有一件古董,他認(rèn)為值 30000元。小李想買(mǎi)這件古董,他認(rèn)為值50000元。在二人不知道協(xié)商如何進(jìn)行的情況下,請(qǐng)你分析一下可能的結(jié)果。
答:小張和小李雙方可能在30000元至50000元之間的價(jià)格上成交。
2.在上面一個(gè)問(wèn)題的基礎(chǔ)上,小王也想買(mǎi)這件古董,也愿意出價(jià)50000元來(lái)買(mǎi)。在不知道協(xié)商如何進(jìn)行的情況下,而且小李和小王不會(huì)串通起來(lái),請(qǐng)你分析一下可能的結(jié)果。
答:小張應(yīng)該以50000元的價(jià)格賣(mài)給小李或者小王,而沒(méi)有其他結(jié)果。因?yàn)樗麄兌硕颊J(rèn)為該件物品值50000元,那么低于50000元的出價(jià)是不穩(wěn)定的。
3.假設(shè)有一片果園要對(duì)公眾拍賣(mài),采用英國(guó)式拍賣(mài)的方式。這片果園的真實(shí)價(jià)值大概為30萬(wàn)元,但是這個(gè)信息不能有效地被競(jìng)拍者所獲取。一共有五個(gè)人參與競(jìng)拍,甲的預(yù)期價(jià)值是30萬(wàn),乙的預(yù)期價(jià)值是37萬(wàn),丙的預(yù)期價(jià)值是49萬(wàn),丁的預(yù)期價(jià)值是27萬(wàn),小劉的預(yù)期價(jià)值是53萬(wàn)。請(qǐng)問(wèn):(1)小劉應(yīng)該報(bào)出的多少競(jìng)拍價(jià)格是多少?(2)他獲得的預(yù)期支付是多少?(3)獲得的實(shí)際價(jià)值是多少?(4)這種情況屬于什么問(wèn)題?
答:(1)小劉應(yīng)該報(bào)價(jià)53萬(wàn)。
(2)他獲得的預(yù)期支付為4萬(wàn)元,即53-49=4萬(wàn)元。
(3)他獲得的實(shí)際價(jià)值為-19萬(wàn)元,即30-49=-19萬(wàn)元。
(4)這種情況就是“贏者詛咒”。
4.你想買(mǎi)一輛二手車(chē),但是無(wú)法判斷它的價(jià)值。你自己覺(jué)得這輛車(chē)子的質(zhì)量?jī)?yōu)良或者不值得買(mǎi)的概率各占一半,但是汽車(chē)的質(zhì)量只有賣(mài)方才知道。下面列出了汽車(chē)對(duì)你和賣(mài)方的價(jià)值。
汽車(chē)質(zhì)量 對(duì)你的價(jià)值 對(duì)賣(mài)方的價(jià)值
好 100000元 60000元
差 10000元 0
請(qǐng)問(wèn)在這個(gè)博弈中,你是否愿意買(mǎi)車(chē)?為什么?
答:不愿意買(mǎi)車(chē)。
由于無(wú)法判斷舊車(chē)的價(jià)值,而且質(zhì)量?jī)?yōu)良或者不值得買(mǎi)的概率各占一半,你只愿意出價(jià)(100000+10000)/2=55000元,那么賣(mài)方就不會(huì)提供質(zhì)量好的車(chē)子給你,而讓質(zhì)量好的車(chē)子退出市場(chǎng)。而你如果出價(jià)60000元以上,你也只有一半的機(jī)會(huì)能買(mǎi)到高質(zhì)量的車(chē)子,還有一半的機(jī)會(huì)買(mǎi)到質(zhì)量低劣的車(chē)子。所以,你也不愿意花60000元以上來(lái)買(mǎi)平均質(zhì)量只有55000的車(chē)子。
三、請(qǐng)解釋以下問(wèn)題。
1.一些高級(jí)會(huì)所為什么采用會(huì)員制?
答:由于信息不對(duì)稱(chēng),一些高級(jí)會(huì)所并不清楚消費(fèi)者屬于哪種類(lèi)型的,而會(huì)員制則是一種信號(hào)顯示和信息甄別的組織形式,其篩選機(jī)制能有效地顯示會(huì)員信息,能有效地進(jìn)行身份甄別,從而降低信息不對(duì)稱(chēng)所引起的交易成本,提高交易效率。
3.你在搬家后想找一位新牙醫(yī),但你可能只想找至少好幾月內(nèi)都排不出時(shí)間的牙醫(yī),為什么?
答:你最想找的牙醫(yī)應(yīng)該是能滿足你的需求并能不斷吸引新客戶、保住回頭客戶的醫(yī)生,而要約這種牙醫(yī)為你治病需要等待很長(zhǎng)的時(shí)間。但是那些客源迅速流失的水平糟糕的牙醫(yī)則會(huì)有很多空閑的時(shí)間。也就是說(shuō),那種你一預(yù)約就可以安排時(shí)間給你治療的牙醫(yī)可能就是你最不想要的醫(yī)生。
3.醫(yī)學(xué)科技發(fā)展了,為什么人工流產(chǎn)率反而上升了?
答:隨著醫(yī)學(xué)科技的發(fā)展,各種新型的避孕工具和藥物以及人工流產(chǎn)技術(shù)讓人們放松了道德層面的約束,降低了意外懷孕的擔(dān)心,讓人們性生活的意外成本大大地降低。所以,人們?cè)谛陨顣r(shí)就會(huì)傾向于冒險(xiǎn),比如在性生活中傾向于不采取任何保護(hù)措施,事后可以吃緊急避孕藥,實(shí)在不行的話,大不了就是進(jìn)行人工流產(chǎn)。因此,現(xiàn)代醫(yī)學(xué)醫(yī)藥技術(shù)的發(fā)展,助長(zhǎng)了對(duì)性生活的冒險(xiǎn),也就提高了意外懷孕的機(jī)會(huì),拉升了人工流產(chǎn)率。
4.作為企業(yè)老板,你會(huì)為全部員工配股還是僅為高層管理者配股?
答:持股計(jì)劃對(duì)高層管理者有效,是因?yàn)楦邔庸芾碚呷藛T少,每個(gè)經(jīng)理人可以獲得的股份就比較大,而他們對(duì)于公司的盈虧有著重要影響,足以激勵(lì)其他們努力地為公司工作。持股計(jì)劃對(duì)普通員工低效或無(wú)效,是因?yàn)槠胀▎T工人員眾多,難以避免地出現(xiàn)搭便車(chē)問(wèn)題。所以,應(yīng)該對(duì)高層管理者配股,不應(yīng)該為全部員工配股。
5.一些日本企業(yè)在招聘員工時(shí),那些字跡潦草的應(yīng)聘者可能被優(yōu)先錄用,你覺(jué)得是為什么?
答:這是一個(gè)信號(hào)博弈。站在信號(hào)博弈的角度看,接受普通教育的人往往炫耀他們刻意寫(xiě)得工工整整的字跡,但受過(guò)良好教育的人卻常常字跡潦草難以辨認(rèn)。另外,字跡端正工整的人做事嚴(yán)謹(jǐn)刻板,缺乏進(jìn)取心;而進(jìn)取心強(qiáng),創(chuàng)造性高的人對(duì)字跡往往不講究,比較適合企業(yè)管理和產(chǎn)品開(kāi)發(fā)工作。
四、博弈分析
1.如果你是一家公司的老總,鑒于近期公司的效益明顯下滑,人事部經(jīng)理向你提出了降低人力資源成本的方案擇:一是裁掉20%的現(xiàn)有員工;二是全員降薪20%。你應(yīng)該如何決定呢?為什么?
答:應(yīng)該選擇裁掉20%的現(xiàn)有員工。如果選擇全員降薪20%,那些業(yè)務(wù)能力很強(qiáng)的員工就會(huì)另覓新的東家,得到一份收入持平甚至更好的工作,而你其實(shí)更希望這些有能力的員工留下來(lái)。如果你選擇裁員20%,那肯定是根據(jù)以往的業(yè)績(jī)表現(xiàn)而做出的裁員名單,就可以確保將那些工作能力不佳的員工裁掉,這樣會(huì)讓你的隊(duì)伍更加健康、更加有活力。
2.假如你是一位風(fēng)險(xiǎn)投資家,而我正好在為自己的一個(gè)項(xiàng)目尋求投資,我向你提出來(lái),希望你能夠?yàn)槲彝顿Y2000萬(wàn),我把新創(chuàng)公司80%的股權(quán)給你。而你認(rèn)為必須讓我自己出資50萬(wàn)元,你只擁有新創(chuàng)公司的50%的股份。這是為什么呢?
答:對(duì)于風(fēng)險(xiǎn)投資家和企業(yè)家而言,他們的立場(chǎng)和出發(fā)點(diǎn)完全不同。作為創(chuàng)業(yè)者,肯定希望得到投資,但是又不希望受到很大的約束,希望可以規(guī)避掉自己可能的損失。作為投資資本家,肯定希望項(xiàng)目能夠成功,也只有成功才可以從中獲得投資回報(bào),那么就必須想辦法讓企業(yè)家努力工作。風(fēng)險(xiǎn)投資家讓企業(yè)家自己也出資一部分,才能有效激勵(lì)企業(yè)家努力工作。
《博弈與決策》期末復(fù)習(xí)指導(dǎo)
期末復(fù)習(xí)資料
第一章博弈論的基本理論
(一)博弈論的基本概念
博弈:現(xiàn)實(shí)生活中,不同的決策人為了爭(zhēng)奪資源、爭(zhēng)奪機(jī)會(huì)使得決策人處于相互依存的復(fù)雜關(guān)系中,這就不得不思考他人有針對(duì)性行為對(duì)自身所產(chǎn)生的影響。
博弈就是一種游戲,在這種狀態(tài)下,參與者必須作出選擇,并對(duì)對(duì)方的選擇作出判斷,這種判斷和選擇決定了博弈的結(jié)果。每個(gè)對(duì)弈者在決定采取何種行動(dòng)時(shí)不但要根據(jù)自身的利益和目的行事,也要考慮自身的決策行為對(duì)其他人的可能影響,以及其他人的行為對(duì)自身的可能影響,通過(guò)選擇最佳行動(dòng)計(jì)劃,來(lái)尋求收益或效用的最大化。
博弈論:就是以參與人之間有針對(duì)性的行為產(chǎn)生的互動(dòng)過(guò)程為研究對(duì)象的理論,探討在互動(dòng)過(guò)程中參與人的一般行為規(guī)律。博弈論的核心問(wèn)題在于如何在“策略互動(dòng)”的局勢(shì)中找到局中人的最佳行為方式,使得采用最佳行為方式的局中人能獲得最大的收益。所以博弈論可以簡(jiǎn)單理解尾研究策略互動(dòng)局勢(shì)中的局中人的理性行為的理論。
(二)博弈論的構(gòu)成要素
1、博弈一般由以下幾個(gè)要素組成,包括:參與人、行動(dòng)、信息、策略、得益、結(jié)果、均衡等。
2、參與人指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體(可以是個(gè)人,也可以是團(tuán)體);
3、行動(dòng)是指參與人在博弈進(jìn)程中輪到自己選擇時(shí)所作的某個(gè)具體決策;
4、策略是指參與人選擇行動(dòng)的規(guī)則,即在博弈進(jìn)程中,什么情況下選擇什么行動(dòng)的預(yù)先安排;
5、得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動(dòng)的函數(shù),這是每個(gè)參與人最關(guān)心的東西;
6、均衡是所有參與人的最優(yōu)策略或行動(dòng)的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動(dòng)或效用集合。
上述要素中,參與人、行動(dòng)、結(jié)果統(tǒng)稱(chēng)為博弈規(guī)則,博弈分析的目的就是使用博弈規(guī)則來(lái)決定均衡。
二、博弈論的發(fā)展簡(jiǎn)史
1、萌芽階段:博弈論思想古已有之,我國(guó)古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專(zhuān)著。博弈論最初主要研究象棋、橋牌、博中的勝負(fù)問(wèn)題,人們對(duì)博弈局勢(shì)的把握只停留在經(jīng)驗(yàn)上,沒(méi)有向理論化發(fā)展。
2、產(chǎn)生階段:1944年科學(xué)家馮•諾伊曼和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡•摩根斯坦合著《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟(jì)領(lǐng)域,標(biāo)志著博弈論作為一門(mén)獨(dú)立的的學(xué)科誕生。
3、發(fā)展階段:1950年,約翰•納什(John Nash)引入均衡(解)的概念,即納什均衡,將博弈論從零和博弈推進(jìn)到非零和博弈(即參與人會(huì)出現(xiàn)雙贏或雙輸?shù)那闆r),納什的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。納什獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
4、高潮階段:20世紀(jì)40年代末到50年代中期是博弈論研究的第一個(gè)高潮時(shí)期,一方面是合作博弈發(fā)展到了鼎盛時(shí)期,包括納什和夏普里的“討價(jià)還價(jià)”模型,“核”的概念。另一 方面非合作博弈開(kāi)始創(chuàng)立,納什的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》(1950),《非合作博弈》(1951)以及Tucker于1950年定義的“囚徒困境”。這一時(shí)期海提出了“微分博弈”,奧曼提出了“強(qiáng)均衡”概念,“重復(fù)博弈”也開(kāi)始研究。
1965年和1975年蘭哈德•澤爾藤(Reinhard Selten)把納什均衡推廣到動(dòng)態(tài)博弈,并提出子博弈完美納什均衡;1967-1968年間,約翰•海薩尼(John Harsanyi)把納什思想推廣到不完全信息模型,提出貝葉斯均衡;他們與納什一起分享1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者詹姆斯•莫里斯教授和威廉姆•維克瑞教授在20世紀(jì)60、70年代提示不對(duì)稱(chēng)信息對(duì)交易帶來(lái)的影響,并提出相應(yīng)對(duì)策。70年代的重要事件海包括“進(jìn)化博弈論”,“進(jìn)化穩(wěn)定策略”,此外“共同知識(shí)”也 引起了廣泛關(guān)注。
5、成熟階段:80、90年代是博弈論于駐留經(jīng)濟(jì)學(xué)融合時(shí)期,也是博弈論走向成熟時(shí)期。這個(gè)時(shí)期最重要的進(jìn)展包括Elon KohlbergZAI 1981年引入“前向歸納法”,克里普斯和威爾遜在982年提出“序列均衡”,斯密1982年出版《進(jìn)化和博弈論》,海薩尼和澤爾藤在988年提出有關(guān)非合作博弈中均衡選擇的一般理論和標(biāo)準(zhǔn)。1991年佛德伯格和泰勒提出了“精練貝葉斯均衡”。
三、博弈論的分類(lèi)
1、參與人行動(dòng)的先后順序:靜態(tài)和動(dòng)態(tài)
靜態(tài)博弈是指參與者同時(shí)采取行動(dòng),或者盡管參與者行動(dòng)的采取有先后順序,但后行動(dòng)的人不知道先采取行動(dòng)的人采取的是什么行動(dòng)。
動(dòng)態(tài)博弈:參與者的行動(dòng)有先后順序,并且后采取行動(dòng)的人可以知道先采取行動(dòng)的人所采取的行動(dòng)。
2、參與人對(duì)其他參與人的了解程度:完全信息和不完全信息
完全信息博弈:參與者對(duì)所有參與者的特征、策略空間及策略組合下的支付有充分了解稱(chēng)為完全信息;
不完全信息博弈:參與者對(duì)所有參與者的特征、策略空間及策略組合下的支付的信息了解得不夠準(zhǔn)確或者不是對(duì)所有參與者的特征、策略空間及策略組合下的支付的信息都有準(zhǔn)確的了解。
3、參與人之間是否進(jìn)行合作:合作和非合作
合作性博弈:參與者從自己的利益出發(fā)與其他參與者談判達(dá)成協(xié)議或形成聯(lián)盟,其結(jié)果對(duì)聯(lián)盟方均有利;參與人在協(xié)議范圍內(nèi)進(jìn)行博弈。
非合作性博弈:參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議
4、非合作博弈四種類(lèi)型及對(duì)應(yīng)的均衡:
(1)完全信息靜態(tài)——納什均衡、占優(yōu)均衡
納什均衡是指這樣一種均衡:在這一均衡中,每個(gè)博弈參與人都確信,在給定其他參與人戰(zhàn)略決定的情況下,他選擇了最優(yōu)戰(zhàn)略以回應(yīng)對(duì)手的戰(zhàn)略。也就是說(shuō),所有人的戰(zhàn)略都是最優(yōu)的。
占優(yōu)均衡指不論其他參與者做何種策略選擇,每個(gè)參與者的最佳策略都是唯一的,其結(jié)果為占優(yōu)均衡。當(dāng)所有博弈者都有一個(gè)占優(yōu)戰(zhàn)略時(shí),其結(jié)果將是占優(yōu)均衡。占優(yōu)均衡一定是納什均衡。
(2)完全信息動(dòng)態(tài)——子博弈精煉納什均衡
子博弈精煉納什均衡是澤爾騰(Selten)于1965年首先提出的,其目的是將那些不
可置信威脅策略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈一個(gè)合理的均衡解。在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,后行動(dòng)的參與人在自己行動(dòng)之前就可以觀察到先行動(dòng)者(參與人)的行為,并在此基礎(chǔ)上選擇相應(yīng)的策略。而且,由于先行動(dòng)者擁有后行動(dòng)者可能選擇策略的完全信息,因而先行動(dòng)者在選擇自己的策略時(shí),就可以預(yù)先考慮自己的選擇對(duì)后行動(dòng)者選擇的影響,并采取相應(yīng)的對(duì)策。
(3)不完全信息靜態(tài)博弈——貝葉斯納什均衡
貝葉斯納什均衡:在不完全信息靜態(tài)博弈中,參與人同時(shí)行動(dòng),沒(méi)有機(jī)會(huì)觀察到別人的選擇。給定其他參與人的戰(zhàn)略選擇,每個(gè)參與人的最優(yōu)戰(zhàn)略依賴于自己的類(lèi)型。由于每個(gè)參與人僅知道其他參與人有關(guān)類(lèi)型的分布概率,而不知道其真實(shí)類(lèi)型,因而,他不可能知道其他參與人實(shí)際上會(huì)選擇什么戰(zhàn)略。但是,他能夠正確地預(yù)測(cè)到其他參與人的選擇與其各自的有關(guān)類(lèi)型之間的關(guān)系。因此,該參與人的決策目標(biāo)就是:在給定自己的類(lèi)型,以及給定其他參與人的類(lèi)型與戰(zhàn)略選擇之間關(guān)系的條件下,使得自己的期望效用最大化。貝葉斯納什均衡是一種類(lèi)型依賴型戰(zhàn)略組合。
(4)不完全信息動(dòng)態(tài)博弈——精煉貝葉斯納什均衡
精煉貝葉斯納什均衡:在不完全信息動(dòng)態(tài)博弈中博弈開(kāi)始時(shí),某一參與人既不知道其他參與人的真實(shí)類(lèi)型,也不知道其他參與人所屬類(lèi)型的分布概率。他只是對(duì)這一概率分布有自己的主觀判斷,即有自己的信念。博弈開(kāi)始后,該參與人將根據(jù)他所觀察到的其他參與人的行為,來(lái)修正自己的信念。并根據(jù)這種不斷變化的信念,作出自己的戰(zhàn)略選擇。
第二章簡(jiǎn)單博弈與博弈均衡
(一)占優(yōu)戰(zhàn)略與占優(yōu)戰(zhàn)略均衡
占優(yōu)戰(zhàn)略是博弈論(game theory)中的專(zhuān)業(yè)術(shù)語(yǔ),所謂的占優(yōu)戰(zhàn)略就是指無(wú)論競(jìng)爭(zhēng)對(duì)手如何反應(yīng)都屬于本企業(yè)最佳選擇的競(jìng)爭(zhēng)策略。
占優(yōu)戰(zhàn)略均衡必定是納什均衡,因?yàn)榫种腥说恼純?yōu)戰(zhàn)略是對(duì)所有其他局中人的任何戰(zhàn)略組合情況下的最優(yōu)戰(zhàn)略選擇,自然它也一定是對(duì)于所有其他局中人的某個(gè)特定戰(zhàn)略(其他局中人的最優(yōu)戰(zhàn)略)情況下的最優(yōu)戰(zhàn)略選擇。但反過(guò)來(lái)不成立,納什均衡不一定是占優(yōu)戰(zhàn)略均衡。
(二)納什戰(zhàn)略均衡
1、納什均衡的意義:
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),其重要影響可以概括為以下六個(gè)方面:
(1)改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。
(2)擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。
(3)加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理,分析問(wèn)題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問(wèn)題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問(wèn)題。
(4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問(wèn)題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類(lèi)型或特征進(jìn)行分類(lèi),并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。
(5)擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡理論既適用于人類(lèi)的行為規(guī)律,也適合于人類(lèi)以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。
(6)改變了經(jīng)濟(jì)學(xué)的語(yǔ)言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對(duì)保羅•薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過(guò)一個(gè)幽默的引申,他說(shuō),“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。
2、占優(yōu)戰(zhàn)略均衡和納什均衡的聯(lián)系與區(qū)別:
納什均衡,又稱(chēng)為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ)。在這一均衡中,每個(gè)博弈參與人都確信,在給定其他參與人戰(zhàn)略決定的情況下,他選擇了最優(yōu)戰(zhàn)略以回應(yīng)對(duì)手的戰(zhàn)略。也就是說(shuō),所有人的戰(zhàn)略都是最優(yōu)的。
占優(yōu)戰(zhàn)略是博弈論(game theory)中的專(zhuān)業(yè)術(shù)語(yǔ),所謂的占優(yōu)戰(zhàn)略就是指無(wú)論競(jìng)爭(zhēng)對(duì)手如何反應(yīng)都屬于本企業(yè)最佳選擇的競(jìng)爭(zhēng)策略。
占優(yōu)戰(zhàn)略均衡必定是納什均衡,因?yàn)榫种腥说恼純?yōu)戰(zhàn)略是對(duì)所有其他局中人的任何戰(zhàn)略組合情況下的最優(yōu)戰(zhàn)略選擇,自然它也一定是對(duì)于所有其他局中人的某個(gè)特定戰(zhàn)略(其他局中人的最優(yōu)戰(zhàn)略)情況下的最優(yōu)戰(zhàn)略選擇。但反過(guò)來(lái)不成立,納什均衡不一定是占優(yōu)戰(zhàn)略均衡。顯然,占優(yōu)戰(zhàn)略均衡是重復(fù)剔除的占優(yōu)戰(zhàn)略均衡的一種特例
第三章 重復(fù)博弈與序列博弈
一、重復(fù)博弈
重復(fù)博弈中的“針?shù)h相對(duì)”策略博弈
重復(fù)博弈是指同一個(gè)博弈在相同的環(huán)境、規(guī)則下反復(fù)多次執(zhí)行的博弈問(wèn)題。重復(fù)博弈最好的策略十分簡(jiǎn)單,只要將一個(gè)原則貫穿始終,即“針?shù)h相對(duì)”。這一策略的獲勝有一個(gè)十分重要的條件,即博弈是無(wú)限次重復(fù)的。也就是說(shuō),對(duì)局者都預(yù)期這一博弈將永遠(yuǎn)持續(xù)下去而不會(huì)停止。如果對(duì)局的次數(shù)是有限的話,上述結(jié)論將不再有效。
二、序列博弈
序列博弈是指對(duì)局者選擇策略有時(shí)間先后的順序,某些對(duì)局者可能率先采取行動(dòng)。序列博弈也是一種動(dòng)態(tài)博弈。在序列博弈中,先行者可能占據(jù)一定的有利地位,我們把它叫作先行者優(yōu)勢(shì)。在某些市場(chǎng)中,特別在涉及市場(chǎng)進(jìn)入的競(jìng)爭(zhēng)時(shí),先行者優(yōu)勢(shì)對(duì)于企業(yè)的經(jīng)營(yíng)具有重要意義。
第四章博弈論在企業(yè)經(jīng)濟(jì)管理決策中的應(yīng)用
一、“保證最低價(jià)格”的策略
重點(diǎn)掌握保證最低價(jià)格策略
條款內(nèi)容:該條款規(guī)定,顧客在本商店購(gòu)買(mǎi)這種商品一個(gè)月內(nèi),如果發(fā)現(xiàn)其他任何商店比本店更低價(jià)格出售同樣的商品,本店將退還差價(jià),并補(bǔ)償差額的10%。對(duì)消費(fèi)者來(lái)說(shuō),保證最低價(jià)格條款使你至少在一個(gè)月內(nèi)不會(huì)因?yàn)樯唐方祪r(jià)而后悔你的購(gòu)買(mǎi),但這種條款無(wú)疑是企業(yè)之間競(jìng)爭(zhēng)的一種手段。
假定推行保證最低價(jià)格條款的商店為商店A,它的競(jìng)爭(zhēng)者為商店B。當(dāng)商店A把某產(chǎn)品定為5000元并推行保證最低價(jià)格條款的時(shí)候,商店B應(yīng)如何定價(jià)最為有利呢?如果商店B高于5000元,顯然對(duì)其競(jìng)爭(zhēng)不利,因?yàn)槌穷櫩筒涣私馇闆r,否則他們將到商店A去購(gòu)買(mǎi)該產(chǎn)品。如果商店的定價(jià)低于5000元,它能否因此而爭(zhēng)取到更多的顧客呢?不能,因?yàn)樯痰闍已經(jīng)有了保證最低價(jià)格的條款。這樣,對(duì)商店B來(lái)說(shuō),它的最優(yōu)的定價(jià)策略就是與商店A制定同樣的價(jià)格。
再如,如果你在該商店花5000元購(gòu)買(mǎi)了一架尼康相機(jī),一周后你在另一家商店發(fā)現(xiàn)那里只賣(mài)4500元,那么你就可以向該商店交涉,并獲得550元的退款。
對(duì)消費(fèi)者來(lái)說(shuō),保證最低價(jià)格條款使你至少在一個(gè)月內(nèi)不會(huì)因?yàn)樯唐方祪r(jià)而后悔你的購(gòu)買(mǎi),但這種條款無(wú)疑是企業(yè)之間競(jìng)爭(zhēng)的一種手段。
證最低價(jià)格條款是一種承諾,由于法律的限制,商店在向消費(fèi)者公布了這一條款之后是不能不實(shí)行的,因此它是絕對(duì)可信的。這一承諾隱含著商店A向商店B發(fā)出的不要降價(jià)競(jìng)爭(zhēng)的威脅,并使這種威脅產(chǎn)生其預(yù)期的效果。
二、擴(kuò)大生產(chǎn)能力策略
壟斷者為阻止?jié)撛谶M(jìn)入者進(jìn)入市場(chǎng),壟斷者可能對(duì)潛在進(jìn)入者進(jìn)行威脅。但壟斷者的這種威脅是否能達(dá)到阻止進(jìn)入的目的,取決于其承諾。所謂承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)使其威脅成為一種令人可信的威脅。那么,一種威脅在什么條件下會(huì)變得令人可信呢?一般是,只有當(dāng)對(duì)局者在不實(shí)行這種威脅會(huì)遭受更大損失的時(shí)候。與承諾行動(dòng)相比,空頭威脅無(wú)法有效阻止市場(chǎng)進(jìn)入的主要原因是,它是不需要任何成本的。發(fā)表聲明是容易的,僅僅宣稱(chēng)將要作什么或者標(biāo)榜自己是說(shuō)一不二的人也都缺乏實(shí)質(zhì)性的涵義。因此,只有當(dāng)對(duì)局者采取了某種行動(dòng),而且這種行動(dòng)需要較高的成本,才會(huì)使威脅變得可信。
三、限制進(jìn)入定價(jià)策略
限制進(jìn)入定價(jià)是指現(xiàn)有企業(yè)通過(guò)收取低于進(jìn)入發(fā)生的價(jià)格的策略來(lái)防范進(jìn)入。潛在進(jìn)入者看到這一低價(jià)后,推測(cè)出進(jìn)入后價(jià)格也會(huì)那么低甚至更低,因而進(jìn)入該市場(chǎng)終將無(wú)利可圖。
四、掠奪性定價(jià)策略
掠奪性定價(jià)是指將價(jià)格設(shè)定為低于成本,而期望由此發(fā)生的損失在新進(jìn)入企業(yè)或者競(jìng)爭(zhēng)對(duì)手被逐出市場(chǎng)后,掠奪企業(yè)能夠行使市場(chǎng)權(quán)力時(shí)可能得到補(bǔ)償。這也是一種價(jià)格報(bào)復(fù)策略。掠奪性定價(jià)與限制定價(jià)之間的差異在于,限制定價(jià)是針對(duì)那些尚未進(jìn)入市場(chǎng)的企業(yè),是想較長(zhǎng)一段時(shí)間內(nèi)維持低價(jià)來(lái)限制新企業(yè)的進(jìn)入。而掠奪性定價(jià)則將矛頭指向已經(jīng)進(jìn)入的企業(yè)或即將來(lái)臨之際。
案例分析
囚徒困境
案例:警察把甲乙分開(kāi)關(guān)押,并在提審時(shí)分別告之,如果你坦白而他不坦白,那么你將只判0年,他將被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你們兩人都坦白了,各判5年;如果你們兩人都不坦白了,各判1年。
分析:每個(gè)博弈方選擇自己的策略時(shí),雖然無(wú)法知道另一方的實(shí)際選擇,但他卻不能忽視另一方的選擇對(duì)他自己的得益的影響,因此他應(yīng)該考慮到另一方有兩種可能的選擇,并分別考慮自己相應(yīng)的最佳策略。對(duì)囚徒A來(lái)說(shuō),囚徒B有坦白和不坦白兩種可能的選擇,假設(shè)囚徒B的選擇是不坦白,則對(duì)囚徒A來(lái)說(shuō),不坦白得益為-1,坦白得益為0,他應(yīng)該選擇坦白;
假設(shè)囚徒B選擇的是坦白,則囚徒A不坦白得益為-8,坦白得益為-5,他還是該選擇坦白。因此,在此博弈中,無(wú)論囚徒B采取何種策略囚徒A的選擇只有一種,即坦白,因?yàn)樵诹硪环絻煞N可能的情況下,坦白給自己帶來(lái)的得益都是較大的。同樣的道理,囚徒B的唯一的選擇也是坦白。
所以最可能的結(jié)局:該博弈的最終結(jié)果是兩博弈方同選擇坦白策略。
其支付矩陣如下:
性格大戰(zhàn)
案例:一對(duì)戀人準(zhǔn)備在周末晚上一起出去,男的喜歡看足球,但女的喜歡看時(shí)裝表演。當(dāng)然兩個(gè)人都不愿意分開(kāi)活動(dòng)。不同的選擇給他們帶給他們不同的滿足。
分析:可以看出,分開(kāi)將使他們兩人得不到任何滿足,只要在一起,不管是看時(shí)裝表演還是看足球,兩人都會(huì)得到一定的滿足。但看足球?qū)⑹鼓械牡玫礁蟮臐M足,看時(shí)裝表演則使女的得到更大的滿足。
在這樣的一個(gè)對(duì)局中,男的和女的都沒(méi)有占優(yōu)戰(zhàn)略。他們的最優(yōu)側(cè)率依賴于對(duì)方的選擇,一旦對(duì)方選定了某一項(xiàng)活動(dòng),另一個(gè)人選擇同樣的活動(dòng)就是最好的策略。因此,如果男的已經(jīng)買(mǎi)好了足球的門(mén)票,女的當(dāng)然就不再反對(duì);反之,如果女的已經(jīng)買(mǎi)好了時(shí)裝表演票,男的也就會(huì)與她一起看時(shí)裝表演。
價(jià)格戰(zhàn)
案例:假設(shè)市場(chǎng)中僅有A、B兩家企業(yè),每家企業(yè)可采取的定價(jià)策略都是10元或15元,我們可以得出得益矩陣如下:
分析:無(wú)論對(duì)企業(yè)A還是企業(yè)B來(lái)說(shuō),低價(jià)都是他們的占優(yōu)戰(zhàn)略。從表可見(jiàn),企業(yè)A的占優(yōu)戰(zhàn)略是10元,因?yàn)闊o(wú)論B采取什么戰(zhàn)略,企業(yè)A都能獲取比定價(jià)15元更多的利潤(rùn)。
如果企業(yè)B定價(jià)10元,企業(yè)A定價(jià)10元能夠獲利80萬(wàn)元,而定價(jià)15元只能獲得30萬(wàn)元;如果企業(yè)B定價(jià)15元,企業(yè)A定價(jià)10元可獲利170萬(wàn)元,而定價(jià)15元卻只能獲利120萬(wàn)元。同樣地,企業(yè)B的占優(yōu)戰(zhàn)略也是定價(jià)10元的策略。
如果企業(yè)A定價(jià)10元,企業(yè)B定價(jià)10元能夠獲利100萬(wàn)元,而定價(jià)15元只能獲得50萬(wàn)元;如果企業(yè)A定價(jià)15元,企業(yè)A定價(jià)10元可獲利180萬(wàn)元,而定價(jià)15元卻只能獲利150萬(wàn)元。同樣地,企業(yè)A的占優(yōu)戰(zhàn)略也是定價(jià)10元的策略。
最后有一個(gè)最容易出現(xiàn)的結(jié)局就是(10,10),故雙方均采取低價(jià)策略。