




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一節(jié):引論第二節(jié):矩陣對(duì)策第三節(jié):矩陣對(duì)策的求解第十一章對(duì)策論2022/12/24第一節(jié):引論第十一章對(duì)策論2022/12/171第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheory),具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為稱為對(duì)策行為。2.引例3.對(duì)策行為的基本要素4.對(duì)策行為的基本假設(shè)5.對(duì)策行為的分類2022/12/24第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheo21.引例:齊王賽馬齊王:上、中、下田忌:上、中、下
2022/12/241.引例:齊王賽馬齊王:上、中、下20231.引例:齊王賽馬齊王:上、中、下田忌:上、中、下2022/12/241.引例:齊王賽馬齊王:上、中、下2022/42.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)策行為中,有權(quán)決定自己行動(dòng)方案的參加者稱為局中人。2.策略(Strategy):一局對(duì)策中,可供局中人選擇的完整的行動(dòng)方案稱為策略。3.贏得函數(shù)(Score):一局對(duì)策中,局中人使用每一策略都會(huì)有所得失,這種得失是全體局中人所采取的一組策略的函數(shù),稱為贏得函數(shù)。4.局勢(shì):一局對(duì)策中,各局中人選定的策略所形成的策略組稱為一個(gè)局勢(shì)。2022/12/242.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)53.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都是“理智的”決策者,不存在利用其他局中人的決策失誤來擴(kuò)大自身利益的可能性或相反。2022/12/243.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都64.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合對(duì)策合作對(duì)策無限對(duì)策有限對(duì)策二人多人零和非零和零和非零和同有限對(duì)策2022/12/244.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合7第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2.矩陣對(duì)策解的問題3.矩陣對(duì)策的混合策略4.矩陣對(duì)策的基本定理5.矩陣對(duì)策解的性質(zhì)2022/12/24第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2022/12/1781.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策,即對(duì)策雙方的利益是激烈對(duì)抗的。(2)矩陣對(duì)策的數(shù)學(xué)模型:甲:有m個(gè)策略,表示為S1=(1,2,3,……,m)乙:有n個(gè)策略,表示為S2=(1,2,3,……,n)當(dāng)甲選定策略i、乙選定策略j時(shí),就形成了一個(gè)局勢(shì)(i
,j)。可見這樣的局勢(shì)總共有mn個(gè),對(duì)任意局勢(shì)(i
,j)甲的贏得值為aij,即甲的贏得矩陣為Am×n={aij}。因?yàn)閷?duì)策是零和的,所以乙的贏得矩陣為-Am×n。
2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策91.矩陣對(duì)策的數(shù)學(xué)模型
建立二人零和對(duì)策的模型就是要根據(jù)對(duì)實(shí)際問題的敘述,確定甲、乙兩個(gè)局中人的策略集合以及相應(yīng)的贏得矩陣。不難看出在“齊王賽馬”的例子中,齊王的贏得矩陣為:A=31111-11333-111-13111-11131111-1131111-113
2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型建立二人零和對(duì)策的模型就是要101.矩陣對(duì)策的示例1乙甲石頭剪子布石頭01-1剪子-101布1-10例1:甲的贏得矩陣
2022/12/241.矩陣對(duì)策的示例1乙石頭0111.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取一張,在對(duì)乙保密的情況下拿給甲看。若甲看到的是紅牌,他可以選擇擲硬幣或讓乙猜;若甲選擇擲硬幣,出現(xiàn)正面甲贏p元,出現(xiàn)反面甲輸q元;若讓乙猜,當(dāng)乙猜中是紅牌時(shí)甲輸r元,否則甲贏s元。若甲看到的是黑牌,他只能讓乙猜,當(dāng)乙猜中是黑牌時(shí)甲輸u元,否則甲贏t元。試確定甲、乙各自的策略并建立贏得矩陣。正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u
2022/12/241.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取121.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u若甲決定擲硬幣這個(gè)策略,則乙的猜紅或猜黑已無意義;若抽到黑牌,甲的擲硬幣已無意義,只與乙的猜紅或猜黑有關(guān)。所以,對(duì)于局勢(shì)“擲硬幣,猜紅”甲的期望贏得為:1/2(1/2p-1/2q)+1/2t=1/4(p-q+2t)
2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬幣131.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u乙甲猜紅猜黑擲硬幣1/4(p-q+2t)1/4(p-q-2u)讓乙猜1/2(-r+t)1/2(s-u)2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬142.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,3,4},S2={1,2,3},A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,此時(shí)不管局中人乙采取什么策略,甲的贏得均不小于3。
2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A152.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,3,4},S2={1,2,
3}A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,乙應(yīng)采取2策略;結(jié)果甲贏得3,乙付出3。Max836Min3
2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A162.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,…,m},S2={1,2,…,
n}
A={aij}mn
;若Maxminaij
=Minmaxaij
=ai*j*則稱ai*j*為對(duì)策G的值,局勢(shì)(i*,j*)為G的解,i*和j*分別稱為局中人的最優(yōu)策略。ijij
2022/12/242.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,172.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最小值,又是其所在列的最大值,于是有:aij*ai*j*
ai*j定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*
ai*j成立。
2022/12/242.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最182.矩陣對(duì)策解的問題
例:設(shè)矩陣對(duì)策G={S1,S2,A},贏得矩陣為:
A=756552-39-4-46575501-12-1MinMax=5Max7595Min=5i
=1,3,j=2,4,ai*j*=5,四個(gè)局勢(shì)均為矩陣對(duì)策的解。2022/12/242.矩陣對(duì)策解的問題A=75193.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1,S2,A}來說,局中人甲有把握的最小贏得是:v1=maxminaij局中人乙有把握的最大損失是:v2=min
maxaij當(dāng)v1=v2時(shí),對(duì)矩陣對(duì)策有策略意義下的解;然而并非總是如此,經(jīng)常是v1<v2(總有v1v2),此時(shí)沒有策略意義下的解。ijij
2022/12/243.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1203.矩陣對(duì)策的混合策略A=-44-6-643538-1-10-10-306-3MinMax3Max845Min4v1=3<v2=4
2022/12/243.矩陣對(duì)策的混合策略A=-44-6213.矩陣對(duì)策的混合策略
v1=3<v2=4對(duì)于兩個(gè)局中人來說,不存在一個(gè)雙方均可接受的平衡局勢(shì)。設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,,m},S2={1,,n}
A={aij}mn;則S1*={xi
0,i=1,2,,m;x1+x2++xm
=1}S2*={yj0,j=1,2,,n;y1+y2++yn
=1}稱為局中人的混合策略。
2022/12/243.矩陣對(duì)策的混合策略v1=3<v2223.矩陣對(duì)策的混合策略
對(duì)
x
S1*,y
S2*稱(x,y)為一個(gè)混合局勢(shì),局中人的贏得函數(shù)記成:E
(x,y)=xTAy這樣便得到一個(gè)新的對(duì)策G*={S1*,S2*,E}G*稱為G的混合擴(kuò)充。
2022/12/243.矩陣對(duì)策的混合策略對(duì)xS1*,y233.矩陣對(duì)策的混合策略
G*={S1*,S2*,E}是G={S1,S2,A}的混合擴(kuò)充,如果maxminE(x,y)=minmaxE(x,y)記其值為VG,則VG為對(duì)策G*的值,使上式成立的混合局勢(shì)(x
*,y
*)為G在混合策略意義下的解,x
*,y
*分別稱為局中人甲和乙的最優(yōu)混合策略。注:策略意義下的解不存在時(shí),自動(dòng)轉(zhuǎn)向混合策略意義下的解。x
S1*y
S2*x
S1*y
S2*
2022/12/243.矩陣對(duì)策的混合策略G*={S1243.矩陣對(duì)策的混合策略
對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x
*
S1*,y
*
S2*使(x
*,y
*)
為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x
S1*,y
S2*有E(x,y*)E(x*,y*)E(x*,y)
2022/12/243.矩陣對(duì)策的混合策略對(duì)策矩陣G={S1253.矩陣對(duì)策的混合策略
例:對(duì)策矩陣G={S1,S2,A},其中:
A=
顯然G在策略意義下的解不存在,于是設(shè)x=(x1,x2)為局中人甲的混合策略,y=(y1,y2)為局中人乙的混合策略,則S1*={xi0,i=1,2;x1+x2=1}S2*={yj0,j=1,2;y1+y2=1}局中人甲的贏得期望值是:E(x,y)=xTAy3654
2022/12/243.矩陣對(duì)策的混合策略例:對(duì)策矩陣G={263.矩陣對(duì)策的混合策略
例:E(x,y)=xTAy=3x1y1+6x1y2+5x2y1+4x2y2=-4(x1-1/4)(y1-1/2)+9/2取x
*=(1/4,3/4),y
*=(1/2,1/2),則E(x,y*)=E(x*,y*)=E(x*,y)=9/2即有E(x,y*)E(x*,y*)E(x*,y)故x
*和y
*分別為局中人甲和乙的最優(yōu)(混合)策略。
2022/12/243.矩陣對(duì)策的混合策略例:E(x,y)274.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*
ai*j成立。定理2:對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x
*
S1*,y
*
S2*使(x
*,y
*)
為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x
S1*,y
S2*有E(x,y*)E(x*,y*)E(x*,y)
2022/12/244.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G=284.矩陣對(duì)策的基本定理定理3:設(shè)x
*
S1*,y
*
S2*則(x
*,y
*)
是矩陣對(duì)策G的解的充分必要條件是對(duì)任意的i(1,2,…,m)和j(1,2,…,n)有E(x,y*)E(x*,y*)E(x*,y)
2022/12/244.矩陣對(duì)策的基本定理定理3:設(shè)x*294.矩陣對(duì)策的基本定理定理4:設(shè)
x
*
S1*,y
*
S2*則(x
*,y
*)
是矩陣對(duì)策G的解的充分必要條件是存在數(shù)v使得x
*
和y
*分別是不等式組aijxivaijyj
vxi=1yj=1
xi0yj
0的解,且v=VG。ij(j=1,2,…,n)(i=1,2,…,m)(i=1,2,…,m)(j=1,2,…,n)
2022/12/244.矩陣對(duì)策的基本定理定理4:設(shè)x*304.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S2,A},一定存在混合策略意義下的解。2022/12/244.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S315.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x
*,y
*)
是矩陣對(duì)策G={S1,S2,A}的解,v=VG,則(1)若xi*>0,則aijyj*
=v,(2)若aijyj*
<v
,則xi*=0;(3)若yj*>0,則aijxi*
=v,(4)若aijxi*
>v
,則yj*=0。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x*,y325.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={S1,S2,A1}、G2={S1,S2,A2},解集分別為T(G1)和T(G2),若其中有A1=(aij)、A2=(aij+L),L為任一常數(shù),則:(1)VG2=VG1+L;
(2)T(G2)=T(G1)。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={335.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={S1,S2,A}、G2={S1,S2,A},其中為大于0的任一常數(shù),則:(1)VG2=VG1;
(2)T(G2)=T(G1)。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={345.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G={S1,S2,A}存在A=-AT(稱為對(duì)稱對(duì)策)則:(1)VG=0;
(2)T1(G)=T2(G),分別為局中人甲、乙的最優(yōu)策略集。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G=355.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G={S1,S2,A},若在S1(或、和S2)中出現(xiàn)被優(yōu)超的策略,那么去掉被優(yōu)超的策略所形成的新的矩陣對(duì)策與原矩陣對(duì)策同解。
A=4023-2-214-43738454656652743例11-6:
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G=36第216頁例11-6由于第4行優(yōu)超于第1行,第3行優(yōu)超于第2行,故可去掉第1行和第2行,得到新的贏得矩陣:
A1=738454656652743
2022/12/24第216頁例11-6由于第4行優(yōu)超于第1行,37第216頁例11-6對(duì)于A1由于第1列優(yōu)超于第3列,第2列優(yōu)超于第4列,1/3(第1列)+2/3(第2列)優(yōu)超于第5列,故可去掉第3、4、5列,得到新的贏得矩陣:
A2=734652
2022/12/24第216頁例11-6對(duì)于A1由于第1列優(yōu)超于38第216頁例11-6對(duì)于A2由于第1行優(yōu)超于第3行,故可去掉第3行,得到新的贏得矩陣:
A3=7346
2022/12/24第216頁例11-6對(duì)于A2由于第1行優(yōu)超于39第216頁例11-6對(duì)于A3易之于無鞍點(diǎn)存在,應(yīng)用定理4求解不等式組:7x3+4x4
v3x3+6x4
vx3+x4
=1x3,x407y1+3y2
v4y1+6y2
vy1+y2
=1y1,y20
2022/12/24第216頁例11-6對(duì)于A3易之于無鞍點(diǎn)存在40第216頁例11-6求得解為:x3*
=1/3,x4*
=2/3y1*
=1/2,y2*
=1/2于是原矩陣對(duì)策的一個(gè)解是:x*
=(0,0,1/3,2/3,0)Ty*
=(1/2,1/2,0,0,0)TVG=52022/12/24第216頁例11-6求得解為:于是原矩陣對(duì)策41第三節(jié)矩陣對(duì)策的求解1.22對(duì)策的公式法2.2n或m2對(duì)策的圖解法3.線性方程組求解法4.線性規(guī)劃求解法2022/12/24第三節(jié)矩陣對(duì)策的求解1.22對(duì)策的公式法2022/1421.22對(duì)策的公式法所謂22對(duì)策是指局中人的贏得矩陣為22階矩陣,即:
A=a11a12a21a22如果A有鞍點(diǎn),則很快就可求出各局中人的最優(yōu)策略;如果A沒有鞍點(diǎn),則可證明各局中人的最優(yōu)混合策略中的xi*
,yj*均大于零。于是由定理6可知,為求混合策略可求解下列方程組:a11x1+a21x2
=va11y1+a12y2
=va12x1+a22x2
=va21y1+a22y2
=vx1+x2
=1y1+y2
=12022/12/241.22對(duì)策的公式法所謂22對(duì)策是指局432.2n或m2對(duì)策的圖解法例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中S1={1,2},S2={1,2,
3}
2311752A=設(shè)局中人甲的混合策略為(x,1-x)T,x[0,1]。過數(shù)軸上坐標(biāo)為0和1的兩點(diǎn)分別做兩條垂線和,垂線上點(diǎn)的縱坐標(biāo)值分別表示局中人甲采取純策略1,2時(shí),局中人乙采取各策略時(shí)的贏得值。如下圖所示,當(dāng)局中人甲選擇每一混合策略(x,1-x)T時(shí),他可能的最少贏得為局中人乙選擇1,2,
3時(shí)所確定的3條直線在x處的縱坐標(biāo)值的最小值。
2022/12/242.2n或m2對(duì)策的圖解法例:設(shè)一矩陣442.2n或m2對(duì)策的圖解法A=2311752
V=2x+7(1-x)V=3x+5(1-x)V=11x+2(1-x)設(shè)局中人甲的混合策略為(x,1-x)T,x[0,1]。過數(shù)軸上坐標(biāo)為0和1的兩個(gè)點(diǎn)分別做兩條垂線和,垂線上的點(diǎn)的縱坐標(biāo)值分別表示局中人甲采取純策略1,2時(shí),局中人乙采取各策略時(shí)的贏得值。如下圖所示:
2022/12/242.2n或m2對(duì)策的圖解法A=245甲采取混合策略最少的贏得:B1BB2B3甲確定x使贏得最大,即最小最大原則012571132xAB1B2BB3123
2022/12/24甲采取混合策略最少的贏得:B1BB2B30125711346x=OA,AB即為對(duì)策值VG求解x及VG,解方程組:VG=3x+5(1-x)VG=11x+2(1-x)求得x=3/11,VG=49/11;所以甲的最優(yōu)策略為x*=(3/11,8/11)E(x*,1)=23/11+78/11=62/11>49/11E(x*,2)=33/11+58/11=49/11E(x*,3)=113/11+28/11=49/11所以局中人乙的最優(yōu)混合策略y*=(0,y2,y3)
2022/12/24x=OA,AB即為對(duì)策值VG2022/12/17473y2+11y3=VG=49/115y2+2y3=VG=49/11y2+y3=1求解得y*=(0,9/11,2/11).
2022/12/243y2+11y3=VG=49/112022/148例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中S1={1,2,3},S2={1,2
}
27A=66112設(shè)乙的混合策略為(y,1-y),同理有:
2022/12/24例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中2022/49012671162yA1B1B2B3乙采取混合策略最大的支付:7B1B211乙確定y使支付最小,即最大最小原則321A2
2022/12/24012671162yA1B1B2B3乙采取混合策略最大的50OA1yOA2VG=62y+7(1-y)=66y+6(1-y)=66y+6(1-y)=611y+2(1-y)=6求得OA1=1/5,OA2=4/9。故局中人乙的最優(yōu)混合策略為y*=(y,1-y),其中y
[1/5,4/9];而故局中人甲的最優(yōu)策略顯然只能是x*=(0,1,0),即策略2。2022/12/24OA1yOA2VG=6202513.線性方程組求解法根據(jù)定理4求解矩陣對(duì)策解(x
*,y
*)的問題等價(jià)于求解:aijxivaijyjvxi=1yj=1xi0yj0又根據(jù)定理5和定理6,如果x
*,y
*中各分量均不為零,即可將不等式組轉(zhuǎn)換為方程組:
2022/12/243.線性方程組求解法根據(jù)定理4求解矩陣對(duì)策解(x*,y523.線性方程組求解法不等式組轉(zhuǎn)換為方程組:aijxi=vaijyj=vxi=1yj=1xi0yj0如果這兩個(gè)方程組存在非負(fù)解x
*和y
*,則已經(jīng)求得了矩陣對(duì)策的解(x
*,y
*)。
2022/12/243.線性方程組求解法不等式組轉(zhuǎn)換為方程組:2022/1533.線性方程組求解法例:“齊王賽馬”齊王的贏得矩陣為31111-11311-11A=1-13111-11131111-1131111-113
2022/12/243.線性方程組求解法例:“齊王賽馬”齊王的贏得矩陣為2543.線性方程組求解法設(shè):X
*=(x1,x2,x3,x4,x5,x6)TY
*=(y1,y2,y3,y4,y5,y6)T
從矩陣A的元素來看局中人采取任何一個(gè)策略的可能性都是存在的,故可事先假設(shè)X
*,Y
*中各分量均不為零;于是有:
ATX=vAY=v
xi=1yj=1求得解為:X
*=(1/6,1/6,1/6,1/6,1/6,1/6)TY
*=(1/6,1/6,1/6,1/6,1/6,1/6)T對(duì)策的值(齊王的期望贏得)為1。2022/12/243.線性方程組求解法設(shè):X*=(x1,x2,x554.線性規(guī)劃求解法根據(jù)定理5有矩陣對(duì)策的解(x
*,y
*)等價(jià)于下述不等式組的解:aijxivaijyjvxi=1yj=1xi0yj0其中v=max[minE(x,y)]=min[maxE(x,y)]就是對(duì)策的值VG。做變量變換xi=xi/v,yj=yj/v于是有:
2022/12/244.線性規(guī)劃求解法根據(jù)定理5有矩陣對(duì)策的解(x*,y*564.線性規(guī)劃求解法aijxi1aijyj1xi=1/vyj=1/vxi0yj0其相應(yīng)的線性規(guī)劃問題為:
minz=ximaxw=yj
aijxi1aijyj1xi0yj0
2022/12/244.線性規(guī)劃求解法aijxi574.線性規(guī)劃求解法例:729A=2909011Min(x1+x2+x3)Max(y1+y2+y3)7x1+2x2+9x317y1+2y2+9y312x1+9x2+0x312y1+9y2+0y319x1+0x2+11x319y1+0y2+11y31x1,x2,x30y1,y2,y30
2022/12/244.線性規(guī)劃求解法例:7584.線性規(guī)劃求解法cj111000wCBXBby1y2y3s1s2s3000s1s2s311172[9]2909011100010001cj-zj1110000
2022/12/244.線性規(guī)劃求解法cj111000wCBXBby1y2y3594.線性規(guī)劃求解法cj111000wCBXBby1y2y3s1s2s3001s1s2y12/97/91/90012[9]04/9-22/911/9100010-7/9-2/91/9cj-zj01-2/900-1/91/9
2022/12/244.線性規(guī)劃求解法cj111000wCBXBby1y2y3604.線性規(guī)劃求解法cj111000CBXBby1y2y3s1s2s3011s1y2y14/817/811/900101080/81-22/8111/9100-2/91/90-59/81-2/811/9cj-zj004/810-1/9-7/81
2022/12/244.線性規(guī)劃求解法cj111000CBXBby1y2y3s614.線性規(guī)劃求解法cj111000CBXBby1y2y3s1s2s3111y3y2y11/201/101/2000101010081/8011/40-99/80-9/401/2011/40-59/80-9/4081/80cj-zj000-1/20-1/10-1/20Y=(1/20,1/10,1/20)w=1/5v=5Y*=5(1/20,1/10,1/20)=(1/4,1/2,1/4)X*=(1/4,1/2,1/4)2022/12/244.線性規(guī)劃求解法cj111000CBXBby1y2y3s62第一節(jié):引論第二節(jié):矩陣對(duì)策第三節(jié):矩陣對(duì)策的求解第十一章對(duì)策論2022/12/24第一節(jié):引論第十一章對(duì)策論2022/12/1763第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheory),具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為稱為對(duì)策行為。2.引例3.對(duì)策行為的基本要素4.對(duì)策行為的基本假設(shè)5.對(duì)策行為的分類2022/12/24第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheo641.引例:齊王賽馬齊王:上、中、下田忌:上、中、下
2022/12/241.引例:齊王賽馬齊王:上、中、下202651.引例:齊王賽馬齊王:上、中、下田忌:上、中、下2022/12/241.引例:齊王賽馬齊王:上、中、下2022/662.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)策行為中,有權(quán)決定自己行動(dòng)方案的參加者稱為局中人。2.策略(Strategy):一局對(duì)策中,可供局中人選擇的完整的行動(dòng)方案稱為策略。3.贏得函數(shù)(Score):一局對(duì)策中,局中人使用每一策略都會(huì)有所得失,這種得失是全體局中人所采取的一組策略的函數(shù),稱為贏得函數(shù)。4.局勢(shì):一局對(duì)策中,各局中人選定的策略所形成的策略組稱為一個(gè)局勢(shì)。2022/12/242.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)673.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都是“理智的”決策者,不存在利用其他局中人的決策失誤來擴(kuò)大自身利益的可能性或相反。2022/12/243.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都684.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合對(duì)策合作對(duì)策無限對(duì)策有限對(duì)策二人多人零和非零和零和非零和同有限對(duì)策2022/12/244.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合69第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2.矩陣對(duì)策解的問題3.矩陣對(duì)策的混合策略4.矩陣對(duì)策的基本定理5.矩陣對(duì)策解的性質(zhì)2022/12/24第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2022/12/17701.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策,即對(duì)策雙方的利益是激烈對(duì)抗的。(2)矩陣對(duì)策的數(shù)學(xué)模型:甲:有m個(gè)策略,表示為S1=(1,2,3,……,m)乙:有n個(gè)策略,表示為S2=(1,2,3,……,n)當(dāng)甲選定策略i、乙選定策略j時(shí),就形成了一個(gè)局勢(shì)(i
,j)??梢娺@樣的局勢(shì)總共有mn個(gè),對(duì)任意局勢(shì)(i
,j)甲的贏得值為aij,即甲的贏得矩陣為Am×n={aij}。因?yàn)閷?duì)策是零和的,所以乙的贏得矩陣為-Am×n。
2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策711.矩陣對(duì)策的數(shù)學(xué)模型
建立二人零和對(duì)策的模型就是要根據(jù)對(duì)實(shí)際問題的敘述,確定甲、乙兩個(gè)局中人的策略集合以及相應(yīng)的贏得矩陣。不難看出在“齊王賽馬”的例子中,齊王的贏得矩陣為:A=31111-11333-111-13111-11131111-1131111-113
2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型建立二人零和對(duì)策的模型就是要721.矩陣對(duì)策的示例1乙甲石頭剪子布石頭01-1剪子-101布1-10例1:甲的贏得矩陣
2022/12/241.矩陣對(duì)策的示例1乙石頭0731.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取一張,在對(duì)乙保密的情況下拿給甲看。若甲看到的是紅牌,他可以選擇擲硬幣或讓乙猜;若甲選擇擲硬幣,出現(xiàn)正面甲贏p元,出現(xiàn)反面甲輸q元;若讓乙猜,當(dāng)乙猜中是紅牌時(shí)甲輸r元,否則甲贏s元。若甲看到的是黑牌,他只能讓乙猜,當(dāng)乙猜中是黑牌時(shí)甲輸u元,否則甲贏t元。試確定甲、乙各自的策略并建立贏得矩陣。正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u
2022/12/241.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取741.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u若甲決定擲硬幣這個(gè)策略,則乙的猜紅或猜黑已無意義;若抽到黑牌,甲的擲硬幣已無意義,只與乙的猜紅或猜黑有關(guān)。所以,對(duì)于局勢(shì)“擲硬幣,猜紅”甲的期望贏得為:1/2(1/2p-1/2q)+1/2t=1/4(p-q+2t)
2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬幣751.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u乙甲猜紅猜黑擲硬幣1/4(p-q+2t)1/4(p-q-2u)讓乙猜1/2(-r+t)1/2(s-u)2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬762.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,3,4},S2={1,2,3},A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,此時(shí)不管局中人乙采取什么策略,甲的贏得均不小于3。
2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A772.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,3,4},S2={1,2,
3}A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,乙應(yīng)采取2策略;結(jié)果甲贏得3,乙付出3。Max836Min3
2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A782.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,2,…,m},S2={1,2,…,
n}
A={aij}mn
;若Maxminaij
=Minmaxaij
=ai*j*則稱ai*j*為對(duì)策G的值,局勢(shì)(i*,j*)為G的解,i*和j*分別稱為局中人的最優(yōu)策略。ijij
2022/12/242.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,792.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最小值,又是其所在列的最大值,于是有:aij*ai*j*
ai*j定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*
ai*j成立。
2022/12/242.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最802.矩陣對(duì)策解的問題
例:設(shè)矩陣對(duì)策G={S1,S2,A},贏得矩陣為:
A=756552-39-4-46575501-12-1MinMax=5Max7595Min=5i
=1,3,j=2,4,ai*j*=5,四個(gè)局勢(shì)均為矩陣對(duì)策的解。2022/12/242.矩陣對(duì)策解的問題A=75813.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1,S2,A}來說,局中人甲有把握的最小贏得是:v1=maxminaij局中人乙有把握的最大損失是:v2=min
maxaij當(dāng)v1=v2時(shí),對(duì)矩陣對(duì)策有策略意義下的解;然而并非總是如此,經(jīng)常是v1<v2(總有v1v2),此時(shí)沒有策略意義下的解。ijij
2022/12/243.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1823.矩陣對(duì)策的混合策略A=-44-6-643538-1-10-10-306-3MinMax3Max845Min4v1=3<v2=4
2022/12/243.矩陣對(duì)策的混合策略A=-44-6833.矩陣對(duì)策的混合策略
v1=3<v2=4對(duì)于兩個(gè)局中人來說,不存在一個(gè)雙方均可接受的平衡局勢(shì)。設(shè)矩陣對(duì)策G={S1,S2,A},其中:
S1={1,,m},S2={1,,n}
A={aij}mn;則S1*={xi
0,i=1,2,,m;x1+x2++xm
=1}S2*={yj0,j=1,2,,n;y1+y2++yn
=1}稱為局中人的混合策略。
2022/12/243.矩陣對(duì)策的混合策略v1=3<v2843.矩陣對(duì)策的混合策略
對(duì)
x
S1*,y
S2*稱(x,y)為一個(gè)混合局勢(shì),局中人的贏得函數(shù)記成:E
(x,y)=xTAy這樣便得到一個(gè)新的對(duì)策G*={S1*,S2*,E}G*稱為G的混合擴(kuò)充。
2022/12/243.矩陣對(duì)策的混合策略對(duì)xS1*,y853.矩陣對(duì)策的混合策略
G*={S1*,S2*,E}是G={S1,S2,A}的混合擴(kuò)充,如果maxminE(x,y)=minmaxE(x,y)記其值為VG,則VG為對(duì)策G*的值,使上式成立的混合局勢(shì)(x
*,y
*)為G在混合策略意義下的解,x
*,y
*分別稱為局中人甲和乙的最優(yōu)混合策略。注:策略意義下的解不存在時(shí),自動(dòng)轉(zhuǎn)向混合策略意義下的解。x
S1*y
S2*x
S1*y
S2*
2022/12/243.矩陣對(duì)策的混合策略G*={S1863.矩陣對(duì)策的混合策略
對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x
*
S1*,y
*
S2*使(x
*,y
*)
為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x
S1*,y
S2*有E(x,y*)E(x*,y*)E(x*,y)
2022/12/243.矩陣對(duì)策的混合策略對(duì)策矩陣G={S1873.矩陣對(duì)策的混合策略
例:對(duì)策矩陣G={S1,S2,A},其中:
A=
顯然G在策略意義下的解不存在,于是設(shè)x=(x1,x2)為局中人甲的混合策略,y=(y1,y2)為局中人乙的混合策略,則S1*={xi0,i=1,2;x1+x2=1}S2*={yj0,j=1,2;y1+y2=1}局中人甲的贏得期望值是:E(x,y)=xTAy3654
2022/12/243.矩陣對(duì)策的混合策略例:對(duì)策矩陣G={883.矩陣對(duì)策的混合策略
例:E(x,y)=xTAy=3x1y1+6x1y2+5x2y1+4x2y2=-4(x1-1/4)(y1-1/2)+9/2取x
*=(1/4,3/4),y
*=(1/2,1/2),則E(x,y*)=E(x*,y*)=E(x*,y)=9/2即有E(x,y*)E(x*,y*)E(x*,y)故x
*和y
*分別為局中人甲和乙的最優(yōu)(混合)策略。
2022/12/243.矩陣對(duì)策的混合策略例:E(x,y)894.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*
ai*j成立。定理2:對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x
*
S1*,y
*
S2*使(x
*,y
*)
為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x
S1*,y
S2*有E(x,y*)E(x*,y*)E(x*,y)
2022/12/244.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G=904.矩陣對(duì)策的基本定理定理3:設(shè)x
*
S1*,y
*
S2*則(x
*,y
*)
是矩陣對(duì)策G的解的充分必要條件是對(duì)任意的i(1,2,…,m)和j(1,2,…,n)有E(x,y*)E(x*,y*)E(x*,y)
2022/12/244.矩陣對(duì)策的基本定理定理3:設(shè)x*914.矩陣對(duì)策的基本定理定理4:設(shè)
x
*
S1*,y
*
S2*則(x
*,y
*)
是矩陣對(duì)策G的解的充分必要條件是存在數(shù)v使得x
*
和y
*分別是不等式組aijxivaijyj
vxi=1yj=1
xi0yj
0的解,且v=VG。ij(j=1,2,…,n)(i=1,2,…,m)(i=1,2,…,m)(j=1,2,…,n)
2022/12/244.矩陣對(duì)策的基本定理定理4:設(shè)x*924.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S2,A},一定存在混合策略意義下的解。2022/12/244.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S935.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x
*,y
*)
是矩陣對(duì)策G={S1,S2,A}的解,v=VG,則(1)若xi*>0,則aijyj*
=v,(2)若aijyj*
<v
,則xi*=0;(3)若yj*>0,則aijxi*
=v,(4)若aijxi*
>v
,則yj*=0。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x*,y945.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={S1,S2,A1}、G2={S1,S2,A2},解集分別為T(G1)和T(G2),若其中有A1=(aij)、A2=(aij+L),L為任一常數(shù),則:(1)VG2=VG1+L;
(2)T(G2)=T(G1)。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={955.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={S1,S2,A}、G2={S1,S2,A},其中為大于0的任一常數(shù),則:(1)VG2=VG1;
(2)T(G2)=T(G1)。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={965.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G={S1,S2,A}存在A=-AT(稱為對(duì)稱對(duì)策)則:(1)VG=0;
(2)T1(G)=T2(G),分別為局中人甲、乙的最優(yōu)策略集。
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G=975.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G={S1,S2,A},若在S1(或、和S2)中出現(xiàn)被優(yōu)超的策略,那么去掉被優(yōu)超的策略所形成的新的矩陣對(duì)策與原矩陣對(duì)策同解。
A=4023-2-214-43738454656652743例11-6:
2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G=98第216頁例11-6由于第4行優(yōu)超于第1行,第3行優(yōu)超于第2行,故可去掉第1行和第2行,得到新的贏得矩陣:
A1=73845465665
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小轎車買賣合同4篇
- 2024-2025學(xué)年山西省忻州市七年級(jí)(下)第一次月考數(shù)學(xué)試卷(含答案)
- 0-3歲嬰幼兒游戲知到智慧樹答案
- 風(fēng)險(xiǎn)投資對(duì)科技創(chuàng)新企業(yè)孵化的影響分析
- 戶外拓展活動(dòng)總結(jié)15篇
- 2025年續(xù)簽商業(yè)店鋪?zhàn)赓U合同
- 2024年秋新北師大版數(shù)學(xué)一年級(jí)上冊(cè)教學(xué)課件 第五單元 有趣的立體圖形 綜合實(shí)踐 記錄我的一天
- 管道安裝過程中的安全防護(hù)
- 風(fēng)電場(chǎng)施工人員培訓(xùn)方案
- 水稻課件模板
- 2025年秋季學(xué)期第一次中層干部會(huì)議上校長講話:凝心聚力明方向沉心落力干實(shí)事
- 廣西2025年公需科目學(xué)習(xí)考試試題及答案4
- 代加工板材合同協(xié)議書范本
- 2025年事業(yè)單位工勤技能-湖南-湖南地質(zhì)勘查員二級(jí)(技師)歷年參考題庫含答案解析(5卷)
- 肝炎的分型及護(hù)理
- 高中語文38篇課內(nèi)文言文挖空一遍過(教師版)
- 2025年高考真題物理(四川卷)-2
- 企業(yè)負(fù)責(zé)人財(cái)稅知識(shí)培訓(xùn)
- 【前程無憂】2025校招人才素質(zhì)洞察白皮書
- 船舶制造公司管理制度
- 2025至2030年中國石油化工自動(dòng)化儀表產(chǎn)業(yè)發(fā)展動(dòng)態(tài)及未來趨勢(shì)預(yù)測(cè)報(bào)告
評(píng)論
0/150
提交評(píng)論