新編-管理運(yùn)籌學(xué)11對(duì)策論課件_第1頁
新編-管理運(yùn)籌學(xué)11對(duì)策論課件_第2頁
新編-管理運(yùn)籌學(xué)11對(duì)策論課件_第3頁
新編-管理運(yùn)籌學(xué)11對(duì)策論課件_第4頁
新編-管理運(yùn)籌學(xué)11對(duì)策論課件_第5頁
已閱讀5頁,還剩119頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié):引論第二節(jié):矩陣對(duì)策第三節(jié):矩陣對(duì)策的求解第十一章對(duì)策論2022/12/24第一節(jié):引論第十一章對(duì)策論2022/12/171第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheory),具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為稱為對(duì)策行為。2.引例3.對(duì)策行為的基本要素4.對(duì)策行為的基本假設(shè)5.對(duì)策行為的分類2022/12/24第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheo21.引例:齊王賽馬齊王:上、中、下田忌:上、中、下

2022/12/241.引例:齊王賽馬齊王:上、中、下20231.引例:齊王賽馬齊王:上、中、下田忌:上、中、下2022/12/241.引例:齊王賽馬齊王:上、中、下2022/42.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)策行為中,有權(quán)決定自己行動(dòng)方案的參加者稱為局中人。2.策略(Strategy):一局對(duì)策中,可供局中人選擇的完整的行動(dòng)方案稱為策略。3.贏得函數(shù)(Score):一局對(duì)策中,局中人使用每一策略都會(huì)有所得失,這種得失是全體局中人所采取的一組策略的函數(shù),稱為贏得函數(shù)。4.局勢(shì):一局對(duì)策中,各局中人選定的策略所形成的策略組稱為一個(gè)局勢(shì)。2022/12/242.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)53.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都是“理智的”決策者,不存在利用其他局中人的決策失誤來擴(kuò)大自身利益的可能性或相反。2022/12/243.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都64.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合對(duì)策合作對(duì)策無限對(duì)策有限對(duì)策二人多人零和非零和零和非零和同有限對(duì)策2022/12/244.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合7第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2.矩陣對(duì)策解的問題3.矩陣對(duì)策的混合策略4.矩陣對(duì)策的基本定理5.矩陣對(duì)策解的性質(zhì)2022/12/24第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2022/12/1781.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策,即對(duì)策雙方的利益是激烈對(duì)抗的。(2)矩陣對(duì)策的數(shù)學(xué)模型:甲:有m個(gè)策略,表示為S1=(1,2,3,……,m)乙:有n個(gè)策略,表示為S2=(1,2,3,……,n)當(dāng)甲選定策略i、乙選定策略j時(shí),就形成了一個(gè)局勢(shì)(i

,j)。可見這樣的局勢(shì)總共有mn個(gè),對(duì)任意局勢(shì)(i

,j)甲的贏得值為aij,即甲的贏得矩陣為Am×n={aij}。因?yàn)閷?duì)策是零和的,所以乙的贏得矩陣為-Am×n。

2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策91.矩陣對(duì)策的數(shù)學(xué)模型

建立二人零和對(duì)策的模型就是要根據(jù)對(duì)實(shí)際問題的敘述,確定甲、乙兩個(gè)局中人的策略集合以及相應(yīng)的贏得矩陣。不難看出在“齊王賽馬”的例子中,齊王的贏得矩陣為:A=31111-11333-111-13111-11131111-1131111-113

2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型建立二人零和對(duì)策的模型就是要101.矩陣對(duì)策的示例1乙甲石頭剪子布石頭01-1剪子-101布1-10例1:甲的贏得矩陣

2022/12/241.矩陣對(duì)策的示例1乙石頭0111.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取一張,在對(duì)乙保密的情況下拿給甲看。若甲看到的是紅牌,他可以選擇擲硬幣或讓乙猜;若甲選擇擲硬幣,出現(xiàn)正面甲贏p元,出現(xiàn)反面甲輸q元;若讓乙猜,當(dāng)乙猜中是紅牌時(shí)甲輸r元,否則甲贏s元。若甲看到的是黑牌,他只能讓乙猜,當(dāng)乙猜中是黑牌時(shí)甲輸u元,否則甲贏t元。試確定甲、乙各自的策略并建立贏得矩陣。正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u

2022/12/241.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取121.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u若甲決定擲硬幣這個(gè)策略,則乙的猜紅或猜黑已無意義;若抽到黑牌,甲的擲硬幣已無意義,只與乙的猜紅或猜黑有關(guān)。所以,對(duì)于局勢(shì)“擲硬幣,猜紅”甲的期望贏得為:1/2(1/2p-1/2q)+1/2t=1/4(p-q+2t)

2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬幣131.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u乙甲猜紅猜黑擲硬幣1/4(p-q+2t)1/4(p-q-2u)讓乙猜1/2(-r+t)1/2(s-u)2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬142.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,3,4},S2={1,2,3},A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,此時(shí)不管局中人乙采取什么策略,甲的贏得均不小于3。

2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A152.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,3,4},S2={1,2,

3}A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,乙應(yīng)采取2策略;結(jié)果甲贏得3,乙付出3。Max836Min3

2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A162.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,…,m},S2={1,2,…,

n}

A={aij}mn

;若Maxminaij

=Minmaxaij

=ai*j*則稱ai*j*為對(duì)策G的值,局勢(shì)(i*,j*)為G的解,i*和j*分別稱為局中人的最優(yōu)策略。ijij

2022/12/242.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,172.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最小值,又是其所在列的最大值,于是有:aij*ai*j*

ai*j定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*

ai*j成立。

2022/12/242.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最182.矩陣對(duì)策解的問題

例:設(shè)矩陣對(duì)策G={S1,S2,A},贏得矩陣為:

A=756552-39-4-46575501-12-1MinMax=5Max7595Min=5i

=1,3,j=2,4,ai*j*=5,四個(gè)局勢(shì)均為矩陣對(duì)策的解。2022/12/242.矩陣對(duì)策解的問題A=75193.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1,S2,A}來說,局中人甲有把握的最小贏得是:v1=maxminaij局中人乙有把握的最大損失是:v2=min

maxaij當(dāng)v1=v2時(shí),對(duì)矩陣對(duì)策有策略意義下的解;然而并非總是如此,經(jīng)常是v1<v2(總有v1v2),此時(shí)沒有策略意義下的解。ijij

2022/12/243.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1203.矩陣對(duì)策的混合策略A=-44-6-643538-1-10-10-306-3MinMax3Max845Min4v1=3<v2=4

2022/12/243.矩陣對(duì)策的混合策略A=-44-6213.矩陣對(duì)策的混合策略

v1=3<v2=4對(duì)于兩個(gè)局中人來說,不存在一個(gè)雙方均可接受的平衡局勢(shì)。設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,,m},S2={1,,n}

A={aij}mn;則S1*={xi

0,i=1,2,,m;x1+x2++xm

=1}S2*={yj0,j=1,2,,n;y1+y2++yn

=1}稱為局中人的混合策略。

2022/12/243.矩陣對(duì)策的混合策略v1=3<v2223.矩陣對(duì)策的混合策略

對(duì)

x

S1*,y

S2*稱(x,y)為一個(gè)混合局勢(shì),局中人的贏得函數(shù)記成:E

(x,y)=xTAy這樣便得到一個(gè)新的對(duì)策G*={S1*,S2*,E}G*稱為G的混合擴(kuò)充。

2022/12/243.矩陣對(duì)策的混合策略對(duì)xS1*,y233.矩陣對(duì)策的混合策略

G*={S1*,S2*,E}是G={S1,S2,A}的混合擴(kuò)充,如果maxminE(x,y)=minmaxE(x,y)記其值為VG,則VG為對(duì)策G*的值,使上式成立的混合局勢(shì)(x

*,y

*)為G在混合策略意義下的解,x

*,y

*分別稱為局中人甲和乙的最優(yōu)混合策略。注:策略意義下的解不存在時(shí),自動(dòng)轉(zhuǎn)向混合策略意義下的解。x

S1*y

S2*x

S1*y

S2*

2022/12/243.矩陣對(duì)策的混合策略G*={S1243.矩陣對(duì)策的混合策略

對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x

*

S1*,y

*

S2*使(x

*,y

*)

為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x

S1*,y

S2*有E(x,y*)E(x*,y*)E(x*,y)

2022/12/243.矩陣對(duì)策的混合策略對(duì)策矩陣G={S1253.矩陣對(duì)策的混合策略

例:對(duì)策矩陣G={S1,S2,A},其中:

A=

顯然G在策略意義下的解不存在,于是設(shè)x=(x1,x2)為局中人甲的混合策略,y=(y1,y2)為局中人乙的混合策略,則S1*={xi0,i=1,2;x1+x2=1}S2*={yj0,j=1,2;y1+y2=1}局中人甲的贏得期望值是:E(x,y)=xTAy3654

2022/12/243.矩陣對(duì)策的混合策略例:對(duì)策矩陣G={263.矩陣對(duì)策的混合策略

例:E(x,y)=xTAy=3x1y1+6x1y2+5x2y1+4x2y2=-4(x1-1/4)(y1-1/2)+9/2取x

*=(1/4,3/4),y

*=(1/2,1/2),則E(x,y*)=E(x*,y*)=E(x*,y)=9/2即有E(x,y*)E(x*,y*)E(x*,y)故x

*和y

*分別為局中人甲和乙的最優(yōu)(混合)策略。

2022/12/243.矩陣對(duì)策的混合策略例:E(x,y)274.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*

ai*j成立。定理2:對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x

*

S1*,y

*

S2*使(x

*,y

*)

為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x

S1*,y

S2*有E(x,y*)E(x*,y*)E(x*,y)

2022/12/244.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G=284.矩陣對(duì)策的基本定理定理3:設(shè)x

*

S1*,y

*

S2*則(x

*,y

*)

是矩陣對(duì)策G的解的充分必要條件是對(duì)任意的i(1,2,…,m)和j(1,2,…,n)有E(x,y*)E(x*,y*)E(x*,y)

2022/12/244.矩陣對(duì)策的基本定理定理3:設(shè)x*294.矩陣對(duì)策的基本定理定理4:設(shè)

x

*

S1*,y

*

S2*則(x

*,y

*)

是矩陣對(duì)策G的解的充分必要條件是存在數(shù)v使得x

*

和y

*分別是不等式組aijxivaijyj

vxi=1yj=1

xi0yj

0的解,且v=VG。ij(j=1,2,…,n)(i=1,2,…,m)(i=1,2,…,m)(j=1,2,…,n)

2022/12/244.矩陣對(duì)策的基本定理定理4:設(shè)x*304.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S2,A},一定存在混合策略意義下的解。2022/12/244.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S315.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x

*,y

*)

是矩陣對(duì)策G={S1,S2,A}的解,v=VG,則(1)若xi*>0,則aijyj*

=v,(2)若aijyj*

<v

,則xi*=0;(3)若yj*>0,則aijxi*

=v,(4)若aijxi*

>v

,則yj*=0。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x*,y325.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={S1,S2,A1}、G2={S1,S2,A2},解集分別為T(G1)和T(G2),若其中有A1=(aij)、A2=(aij+L),L為任一常數(shù),則:(1)VG2=VG1+L;

(2)T(G2)=T(G1)。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={335.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={S1,S2,A}、G2={S1,S2,A},其中為大于0的任一常數(shù),則:(1)VG2=VG1;

(2)T(G2)=T(G1)。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={345.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G={S1,S2,A}存在A=-AT(稱為對(duì)稱對(duì)策)則:(1)VG=0;

(2)T1(G)=T2(G),分別為局中人甲、乙的最優(yōu)策略集。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G=355.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G={S1,S2,A},若在S1(或、和S2)中出現(xiàn)被優(yōu)超的策略,那么去掉被優(yōu)超的策略所形成的新的矩陣對(duì)策與原矩陣對(duì)策同解。

A=4023-2-214-43738454656652743例11-6:

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G=36第216頁例11-6由于第4行優(yōu)超于第1行,第3行優(yōu)超于第2行,故可去掉第1行和第2行,得到新的贏得矩陣:

A1=738454656652743

2022/12/24第216頁例11-6由于第4行優(yōu)超于第1行,37第216頁例11-6對(duì)于A1由于第1列優(yōu)超于第3列,第2列優(yōu)超于第4列,1/3(第1列)+2/3(第2列)優(yōu)超于第5列,故可去掉第3、4、5列,得到新的贏得矩陣:

A2=734652

2022/12/24第216頁例11-6對(duì)于A1由于第1列優(yōu)超于38第216頁例11-6對(duì)于A2由于第1行優(yōu)超于第3行,故可去掉第3行,得到新的贏得矩陣:

A3=7346

2022/12/24第216頁例11-6對(duì)于A2由于第1行優(yōu)超于39第216頁例11-6對(duì)于A3易之于無鞍點(diǎn)存在,應(yīng)用定理4求解不等式組:7x3+4x4

v3x3+6x4

vx3+x4

=1x3,x407y1+3y2

v4y1+6y2

vy1+y2

=1y1,y20

2022/12/24第216頁例11-6對(duì)于A3易之于無鞍點(diǎn)存在40第216頁例11-6求得解為:x3*

=1/3,x4*

=2/3y1*

=1/2,y2*

=1/2于是原矩陣對(duì)策的一個(gè)解是:x*

=(0,0,1/3,2/3,0)Ty*

=(1/2,1/2,0,0,0)TVG=52022/12/24第216頁例11-6求得解為:于是原矩陣對(duì)策41第三節(jié)矩陣對(duì)策的求解1.22對(duì)策的公式法2.2n或m2對(duì)策的圖解法3.線性方程組求解法4.線性規(guī)劃求解法2022/12/24第三節(jié)矩陣對(duì)策的求解1.22對(duì)策的公式法2022/1421.22對(duì)策的公式法所謂22對(duì)策是指局中人的贏得矩陣為22階矩陣,即:

A=a11a12a21a22如果A有鞍點(diǎn),則很快就可求出各局中人的最優(yōu)策略;如果A沒有鞍點(diǎn),則可證明各局中人的最優(yōu)混合策略中的xi*

,yj*均大于零。于是由定理6可知,為求混合策略可求解下列方程組:a11x1+a21x2

=va11y1+a12y2

=va12x1+a22x2

=va21y1+a22y2

=vx1+x2

=1y1+y2

=12022/12/241.22對(duì)策的公式法所謂22對(duì)策是指局432.2n或m2對(duì)策的圖解法例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中S1={1,2},S2={1,2,

3}

2311752A=設(shè)局中人甲的混合策略為(x,1-x)T,x[0,1]。過數(shù)軸上坐標(biāo)為0和1的兩點(diǎn)分別做兩條垂線和,垂線上點(diǎn)的縱坐標(biāo)值分別表示局中人甲采取純策略1,2時(shí),局中人乙采取各策略時(shí)的贏得值。如下圖所示,當(dāng)局中人甲選擇每一混合策略(x,1-x)T時(shí),他可能的最少贏得為局中人乙選擇1,2,

3時(shí)所確定的3條直線在x處的縱坐標(biāo)值的最小值。

2022/12/242.2n或m2對(duì)策的圖解法例:設(shè)一矩陣442.2n或m2對(duì)策的圖解法A=2311752

V=2x+7(1-x)V=3x+5(1-x)V=11x+2(1-x)設(shè)局中人甲的混合策略為(x,1-x)T,x[0,1]。過數(shù)軸上坐標(biāo)為0和1的兩個(gè)點(diǎn)分別做兩條垂線和,垂線上的點(diǎn)的縱坐標(biāo)值分別表示局中人甲采取純策略1,2時(shí),局中人乙采取各策略時(shí)的贏得值。如下圖所示:

2022/12/242.2n或m2對(duì)策的圖解法A=245甲采取混合策略最少的贏得:B1BB2B3甲確定x使贏得最大,即最小最大原則012571132xAB1B2BB3123

2022/12/24甲采取混合策略最少的贏得:B1BB2B30125711346x=OA,AB即為對(duì)策值VG求解x及VG,解方程組:VG=3x+5(1-x)VG=11x+2(1-x)求得x=3/11,VG=49/11;所以甲的最優(yōu)策略為x*=(3/11,8/11)E(x*,1)=23/11+78/11=62/11>49/11E(x*,2)=33/11+58/11=49/11E(x*,3)=113/11+28/11=49/11所以局中人乙的最優(yōu)混合策略y*=(0,y2,y3)

2022/12/24x=OA,AB即為對(duì)策值VG2022/12/17473y2+11y3=VG=49/115y2+2y3=VG=49/11y2+y3=1求解得y*=(0,9/11,2/11).

2022/12/243y2+11y3=VG=49/112022/148例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中S1={1,2,3},S2={1,2

}

27A=66112設(shè)乙的混合策略為(y,1-y),同理有:

2022/12/24例:設(shè)一矩陣對(duì)策G={S1,S2,A},其中2022/49012671162yA1B1B2B3乙采取混合策略最大的支付:7B1B211乙確定y使支付最小,即最大最小原則321A2

2022/12/24012671162yA1B1B2B3乙采取混合策略最大的50OA1yOA2VG=62y+7(1-y)=66y+6(1-y)=66y+6(1-y)=611y+2(1-y)=6求得OA1=1/5,OA2=4/9。故局中人乙的最優(yōu)混合策略為y*=(y,1-y),其中y

[1/5,4/9];而故局中人甲的最優(yōu)策略顯然只能是x*=(0,1,0),即策略2。2022/12/24OA1yOA2VG=6202513.線性方程組求解法根據(jù)定理4求解矩陣對(duì)策解(x

*,y

*)的問題等價(jià)于求解:aijxivaijyjvxi=1yj=1xi0yj0又根據(jù)定理5和定理6,如果x

*,y

*中各分量均不為零,即可將不等式組轉(zhuǎn)換為方程組:

2022/12/243.線性方程組求解法根據(jù)定理4求解矩陣對(duì)策解(x*,y523.線性方程組求解法不等式組轉(zhuǎn)換為方程組:aijxi=vaijyj=vxi=1yj=1xi0yj0如果這兩個(gè)方程組存在非負(fù)解x

*和y

*,則已經(jīng)求得了矩陣對(duì)策的解(x

*,y

*)。

2022/12/243.線性方程組求解法不等式組轉(zhuǎn)換為方程組:2022/1533.線性方程組求解法例:“齊王賽馬”齊王的贏得矩陣為31111-11311-11A=1-13111-11131111-1131111-113

2022/12/243.線性方程組求解法例:“齊王賽馬”齊王的贏得矩陣為2543.線性方程組求解法設(shè):X

*=(x1,x2,x3,x4,x5,x6)TY

*=(y1,y2,y3,y4,y5,y6)T

從矩陣A的元素來看局中人采取任何一個(gè)策略的可能性都是存在的,故可事先假設(shè)X

*,Y

*中各分量均不為零;于是有:

ATX=vAY=v

xi=1yj=1求得解為:X

*=(1/6,1/6,1/6,1/6,1/6,1/6)TY

*=(1/6,1/6,1/6,1/6,1/6,1/6)T對(duì)策的值(齊王的期望贏得)為1。2022/12/243.線性方程組求解法設(shè):X*=(x1,x2,x554.線性規(guī)劃求解法根據(jù)定理5有矩陣對(duì)策的解(x

*,y

*)等價(jià)于下述不等式組的解:aijxivaijyjvxi=1yj=1xi0yj0其中v=max[minE(x,y)]=min[maxE(x,y)]就是對(duì)策的值VG。做變量變換xi=xi/v,yj=yj/v于是有:

2022/12/244.線性規(guī)劃求解法根據(jù)定理5有矩陣對(duì)策的解(x*,y*564.線性規(guī)劃求解法aijxi1aijyj1xi=1/vyj=1/vxi0yj0其相應(yīng)的線性規(guī)劃問題為:

minz=ximaxw=yj

aijxi1aijyj1xi0yj0

2022/12/244.線性規(guī)劃求解法aijxi574.線性規(guī)劃求解法例:729A=2909011Min(x1+x2+x3)Max(y1+y2+y3)7x1+2x2+9x317y1+2y2+9y312x1+9x2+0x312y1+9y2+0y319x1+0x2+11x319y1+0y2+11y31x1,x2,x30y1,y2,y30

2022/12/244.線性規(guī)劃求解法例:7584.線性規(guī)劃求解法cj111000wCBXBby1y2y3s1s2s3000s1s2s311172[9]2909011100010001cj-zj1110000

2022/12/244.線性規(guī)劃求解法cj111000wCBXBby1y2y3594.線性規(guī)劃求解法cj111000wCBXBby1y2y3s1s2s3001s1s2y12/97/91/90012[9]04/9-22/911/9100010-7/9-2/91/9cj-zj01-2/900-1/91/9

2022/12/244.線性規(guī)劃求解法cj111000wCBXBby1y2y3604.線性規(guī)劃求解法cj111000CBXBby1y2y3s1s2s3011s1y2y14/817/811/900101080/81-22/8111/9100-2/91/90-59/81-2/811/9cj-zj004/810-1/9-7/81

2022/12/244.線性規(guī)劃求解法cj111000CBXBby1y2y3s614.線性規(guī)劃求解法cj111000CBXBby1y2y3s1s2s3111y3y2y11/201/101/2000101010081/8011/40-99/80-9/401/2011/40-59/80-9/4081/80cj-zj000-1/20-1/10-1/20Y=(1/20,1/10,1/20)w=1/5v=5Y*=5(1/20,1/10,1/20)=(1/4,1/2,1/4)X*=(1/4,1/2,1/4)2022/12/244.線性規(guī)劃求解法cj111000CBXBby1y2y3s62第一節(jié):引論第二節(jié):矩陣對(duì)策第三節(jié):矩陣對(duì)策的求解第十一章對(duì)策論2022/12/24第一節(jié):引論第十一章對(duì)策論2022/12/1763第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheory),具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為稱為對(duì)策行為。2.引例3.對(duì)策行為的基本要素4.對(duì)策行為的基本假設(shè)5.對(duì)策行為的分類2022/12/24第一節(jié):引論1.內(nèi)涵:對(duì)策論亦稱博弈論(GameTheo641.引例:齊王賽馬齊王:上、中、下田忌:上、中、下

2022/12/241.引例:齊王賽馬齊王:上、中、下202651.引例:齊王賽馬齊王:上、中、下田忌:上、中、下2022/12/241.引例:齊王賽馬齊王:上、中、下2022/662.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)策行為中,有權(quán)決定自己行動(dòng)方案的參加者稱為局中人。2.策略(Strategy):一局對(duì)策中,可供局中人選擇的完整的行動(dòng)方案稱為策略。3.贏得函數(shù)(Score):一局對(duì)策中,局中人使用每一策略都會(huì)有所得失,這種得失是全體局中人所采取的一組策略的函數(shù),稱為贏得函數(shù)。4.局勢(shì):一局對(duì)策中,各局中人選定的策略所形成的策略組稱為一個(gè)局勢(shì)。2022/12/242.對(duì)策行為的基本要素1.局中人(Player):在一個(gè)對(duì)673.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都是“理智的”決策者,不存在利用其他局中人的決策失誤來擴(kuò)大自身利益的可能性或相反。2022/12/243.對(duì)策行為的基本假設(shè)對(duì)策行為總是假定每一個(gè)局中人都684.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合對(duì)策合作對(duì)策無限對(duì)策有限對(duì)策二人多人零和非零和零和非零和同有限對(duì)策2022/12/244.對(duì)策行為的分類對(duì)策動(dòng)態(tài)對(duì)策靜態(tài)對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策聯(lián)合69第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2.矩陣對(duì)策解的問題3.矩陣對(duì)策的混合策略4.矩陣對(duì)策的基本定理5.矩陣對(duì)策解的性質(zhì)2022/12/24第二節(jié):矩陣對(duì)策1.矩陣對(duì)策的數(shù)學(xué)模型2022/12/17701.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策,即對(duì)策雙方的利益是激烈對(duì)抗的。(2)矩陣對(duì)策的數(shù)學(xué)模型:甲:有m個(gè)策略,表示為S1=(1,2,3,……,m)乙:有n個(gè)策略,表示為S2=(1,2,3,……,n)當(dāng)甲選定策略i、乙選定策略j時(shí),就形成了一個(gè)局勢(shì)(i

,j)??梢娺@樣的局勢(shì)總共有mn個(gè),對(duì)任意局勢(shì)(i

,j)甲的贏得值為aij,即甲的贏得矩陣為Am×n={aij}。因?yàn)閷?duì)策是零和的,所以乙的贏得矩陣為-Am×n。

2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型(1)矩陣對(duì)策的內(nèi)涵:二人有限零和對(duì)策711.矩陣對(duì)策的數(shù)學(xué)模型

建立二人零和對(duì)策的模型就是要根據(jù)對(duì)實(shí)際問題的敘述,確定甲、乙兩個(gè)局中人的策略集合以及相應(yīng)的贏得矩陣。不難看出在“齊王賽馬”的例子中,齊王的贏得矩陣為:A=31111-11333-111-13111-11131111-1131111-113

2022/12/241.矩陣對(duì)策的數(shù)學(xué)模型建立二人零和對(duì)策的模型就是要721.矩陣對(duì)策的示例1乙甲石頭剪子布石頭01-1剪子-101布1-10例1:甲的贏得矩陣

2022/12/241.矩陣對(duì)策的示例1乙石頭0731.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取一張,在對(duì)乙保密的情況下拿給甲看。若甲看到的是紅牌,他可以選擇擲硬幣或讓乙猜;若甲選擇擲硬幣,出現(xiàn)正面甲贏p元,出現(xiàn)反面甲輸q元;若讓乙猜,當(dāng)乙猜中是紅牌時(shí)甲輸r元,否則甲贏s元。若甲看到的是黑牌,他只能讓乙猜,當(dāng)乙猜中是黑牌時(shí)甲輸u元,否則甲贏t元。試確定甲、乙各自的策略并建立贏得矩陣。正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u

2022/12/241.矩陣對(duì)策的示例2例2:從一張紅牌和一張黑牌中隨機(jī)抽取741.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u若甲決定擲硬幣這個(gè)策略,則乙的猜紅或猜黑已無意義;若抽到黑牌,甲的擲硬幣已無意義,只與乙的猜紅或猜黑有關(guān)。所以,對(duì)于局勢(shì)“擲硬幣,猜紅”甲的期望贏得為:1/2(1/2p-1/2q)+1/2t=1/4(p-q+2t)

2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬幣751.矩陣對(duì)策的示例2正面1/2抽到紅牌1/2抽到黑牌1/2擲硬幣讓乙猜讓乙猜猜紅反面1/2p-q-r猜紅猜黑猜黑st-u乙甲猜紅猜黑擲硬幣1/4(p-q+2t)1/4(p-q-2u)讓乙猜1/2(-r+t)1/2(s-u)2022/12/241.矩陣對(duì)策的示例2正面抽到紅牌1/2抽到黑牌1/2擲硬762.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,3,4},S2={1,2,3},A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,此時(shí)不管局中人乙采取什么策略,甲的贏得均不小于3。

2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A772.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,3,4},S2={1,2,

3}A=-42-6-643538-1-10-10-306-3MinMax3局中人甲應(yīng)選擇2,乙應(yīng)采取2策略;結(jié)果甲贏得3,乙付出3。Max836Min3

2022/12/242.矩陣對(duì)策解的問題設(shè)矩陣對(duì)策G={S1,S2,A782.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,2,…,m},S2={1,2,…,

n}

A={aij}mn

;若Maxminaij

=Minmaxaij

=ai*j*則稱ai*j*為對(duì)策G的值,局勢(shì)(i*,j*)為G的解,i*和j*分別稱為局中人的最優(yōu)策略。ijij

2022/12/242.矩陣對(duì)策解的問題定義1:設(shè)矩陣對(duì)策G={S1,S2,792.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最小值,又是其所在列的最大值,于是有:aij*ai*j*

ai*j定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*

ai*j成立。

2022/12/242.矩陣對(duì)策解的問題由于ai*j*既是其所在行的最802.矩陣對(duì)策解的問題

例:設(shè)矩陣對(duì)策G={S1,S2,A},贏得矩陣為:

A=756552-39-4-46575501-12-1MinMax=5Max7595Min=5i

=1,3,j=2,4,ai*j*=5,四個(gè)局勢(shì)均為矩陣對(duì)策的解。2022/12/242.矩陣對(duì)策解的問題A=75813.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1,S2,A}來說,局中人甲有把握的最小贏得是:v1=maxminaij局中人乙有把握的最大損失是:v2=min

maxaij當(dāng)v1=v2時(shí),對(duì)矩陣對(duì)策有策略意義下的解;然而并非總是如此,經(jīng)常是v1<v2(總有v1v2),此時(shí)沒有策略意義下的解。ijij

2022/12/243.矩陣對(duì)策的混合策略對(duì)矩陣對(duì)策G={S1823.矩陣對(duì)策的混合策略A=-44-6-643538-1-10-10-306-3MinMax3Max845Min4v1=3<v2=4

2022/12/243.矩陣對(duì)策的混合策略A=-44-6833.矩陣對(duì)策的混合策略

v1=3<v2=4對(duì)于兩個(gè)局中人來說,不存在一個(gè)雙方均可接受的平衡局勢(shì)。設(shè)矩陣對(duì)策G={S1,S2,A},其中:

S1={1,,m},S2={1,,n}

A={aij}mn;則S1*={xi

0,i=1,2,,m;x1+x2++xm

=1}S2*={yj0,j=1,2,,n;y1+y2++yn

=1}稱為局中人的混合策略。

2022/12/243.矩陣對(duì)策的混合策略v1=3<v2843.矩陣對(duì)策的混合策略

對(duì)

x

S1*,y

S2*稱(x,y)為一個(gè)混合局勢(shì),局中人的贏得函數(shù)記成:E

(x,y)=xTAy這樣便得到一個(gè)新的對(duì)策G*={S1*,S2*,E}G*稱為G的混合擴(kuò)充。

2022/12/243.矩陣對(duì)策的混合策略對(duì)xS1*,y853.矩陣對(duì)策的混合策略

G*={S1*,S2*,E}是G={S1,S2,A}的混合擴(kuò)充,如果maxminE(x,y)=minmaxE(x,y)記其值為VG,則VG為對(duì)策G*的值,使上式成立的混合局勢(shì)(x

*,y

*)為G在混合策略意義下的解,x

*,y

*分別稱為局中人甲和乙的最優(yōu)混合策略。注:策略意義下的解不存在時(shí),自動(dòng)轉(zhuǎn)向混合策略意義下的解。x

S1*y

S2*x

S1*y

S2*

2022/12/243.矩陣對(duì)策的混合策略G*={S1863.矩陣對(duì)策的混合策略

對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x

*

S1*,y

*

S2*使(x

*,y

*)

為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x

S1*,y

S2*有E(x,y*)E(x*,y*)E(x*,y)

2022/12/243.矩陣對(duì)策的混合策略對(duì)策矩陣G={S1873.矩陣對(duì)策的混合策略

例:對(duì)策矩陣G={S1,S2,A},其中:

A=

顯然G在策略意義下的解不存在,于是設(shè)x=(x1,x2)為局中人甲的混合策略,y=(y1,y2)為局中人乙的混合策略,則S1*={xi0,i=1,2;x1+x2=1}S2*={yj0,j=1,2;y1+y2=1}局中人甲的贏得期望值是:E(x,y)=xTAy3654

2022/12/243.矩陣對(duì)策的混合策略例:對(duì)策矩陣G={883.矩陣對(duì)策的混合策略

例:E(x,y)=xTAy=3x1y1+6x1y2+5x2y1+4x2y2=-4(x1-1/4)(y1-1/2)+9/2取x

*=(1/4,3/4),y

*=(1/2,1/2),則E(x,y*)=E(x*,y*)=E(x*,y)=9/2即有E(x,y*)E(x*,y*)E(x*,y)故x

*和y

*分別為局中人甲和乙的最優(yōu)(混合)策略。

2022/12/243.矩陣對(duì)策的混合策略例:E(x,y)894.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G={S1,S2,A}在策略意義下有解的充分必要條件是存在著局勢(shì)(i*,j*)使得對(duì)于一切i與j都有aij*ai*j*

ai*j成立。定理2:對(duì)策矩陣G={S1,S2,A}在混合策略意義下有解的充分必要條件是存在著x

*

S1*,y

*

S2*使(x

*,y

*)

為E(x,y)的一個(gè)鞍點(diǎn),即對(duì)于一切x

S1*,y

S2*有E(x,y*)E(x*,y*)E(x*,y)

2022/12/244.矩陣對(duì)策的基本定理定理1:設(shè)矩陣對(duì)策G=904.矩陣對(duì)策的基本定理定理3:設(shè)x

*

S1*,y

*

S2*則(x

*,y

*)

是矩陣對(duì)策G的解的充分必要條件是對(duì)任意的i(1,2,…,m)和j(1,2,…,n)有E(x,y*)E(x*,y*)E(x*,y)

2022/12/244.矩陣對(duì)策的基本定理定理3:設(shè)x*914.矩陣對(duì)策的基本定理定理4:設(shè)

x

*

S1*,y

*

S2*則(x

*,y

*)

是矩陣對(duì)策G的解的充分必要條件是存在數(shù)v使得x

*

和y

*分別是不等式組aijxivaijyj

vxi=1yj=1

xi0yj

0的解,且v=VG。ij(j=1,2,…,n)(i=1,2,…,m)(i=1,2,…,m)(j=1,2,…,n)

2022/12/244.矩陣對(duì)策的基本定理定理4:設(shè)x*924.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S2,A},一定存在混合策略意義下的解。2022/12/244.矩陣對(duì)策的基本定理定理5:對(duì)任一矩陣對(duì)策G={S1,S935.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x

*,y

*)

是矩陣對(duì)策G={S1,S2,A}的解,v=VG,則(1)若xi*>0,則aijyj*

=v,(2)若aijyj*

<v

,則xi*=0;(3)若yj*>0,則aijxi*

=v,(4)若aijxi*

>v

,則yj*=0。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)1:設(shè)(x*,y945.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={S1,S2,A1}、G2={S1,S2,A2},解集分別為T(G1)和T(G2),若其中有A1=(aij)、A2=(aij+L),L為任一常數(shù),則:(1)VG2=VG1+L;

(2)T(G2)=T(G1)。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)2:矩陣對(duì)策G1={955.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={S1,S2,A}、G2={S1,S2,A},其中為大于0的任一常數(shù),則:(1)VG2=VG1;

(2)T(G2)=T(G1)。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)3:矩陣對(duì)策G1={965.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G={S1,S2,A}存在A=-AT(稱為對(duì)稱對(duì)策)則:(1)VG=0;

(2)T1(G)=T2(G),分別為局中人甲、乙的最優(yōu)策略集。

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)4:設(shè)一矩陣對(duì)策G=975.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G={S1,S2,A},若在S1(或、和S2)中出現(xiàn)被優(yōu)超的策略,那么去掉被優(yōu)超的策略所形成的新的矩陣對(duì)策與原矩陣對(duì)策同解。

A=4023-2-214-43738454656652743例11-6:

2022/12/245.矩陣對(duì)策解的性質(zhì)性質(zhì)5:設(shè)一矩陣對(duì)策G=98第216頁例11-6由于第4行優(yōu)超于第1行,第3行優(yōu)超于第2行,故可去掉第1行和第2行,得到新的贏得矩陣:

A1=73845465665

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論