您好,欢迎来到钮旅网。
搜索
您的当前位置:首页博弈论——不完全信息静态博弈.讲义

博弈论——不完全信息静态博弈.讲义

来源:钮旅网


3 不完全信息静态博弈

3.1 简介

博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。如在拍卖商品或工程招投标中。

信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡

在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi(1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N”。

N首先行动,决定每个局中人的特征。每个局中人知道自己的特征,但不知道其他局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N的行动选择,第二阶段是除N外的局中人的静态博弈。这种转换被称为“Harsanyi转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。用i表示局中人i的一个特定类型,Hi表示局中人i所有可能类型的集合,即iHi,称Hi为局中人i的类型空间,i1,,n。

不完全信息静态博弈中,局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同。局中人的行动空间Ai将随类型i而变化,即AiAi(i)。支付函数也是类型依存的,可将其记为:uiui(a1,,ai,,an,i) i1,,n。

该式给出的是在其他局中人已选定行动aj,j1,,n,ji时,局中人选行动aiAi(i)获得的支付。显然给定aj时最大化ui的ai与i有关,即ai*ai*(i),其中ai*是给定aj时最大化ui的ai。

用“类型依存”来描述包括最优战略在内的相关概念与类型的对应关系。

对局中人i,他不知道其他局中人的类型。当他选择行动aiAi(i)时,如果给定其他局中人类型与其最优战略aj的一个对应组合a*j(j),

**(1)ai*1(i1),ai,ai*1(i1)an(n),i)。 ji,j1,,n,其支付为:ui(a1

假定局中人i认为其他局中人的类型组合恰好为i的概率为

Piii。

记事前的分布密度为Pi(1,i,,n),称为“先验概率”,即局中人在博弈之前掌握的知识使其对1in的取值可能性判断。显然,

Piii就是一种条件概率的概念,即当局中人i的类型为i时,他认

为i取值i的概率为

PiiiP(i,i)P(i)P(i,i) P(i,i)iHi

这是概率论中著名的贝叶斯公式(Bayes equition)。

因为i不知道i,我们这里用von·Neumann——Morganstern效用函数刻画这种不确定下的支付函数,即i的期望支付为

Piii*iu(ai(i),ai,i)

显然,最大化上式的ai就是i的最优战略ai*,它与i有关,故

**ai*ai*(i)。当存在一组“类型依存”的最优战略a*(a1,,ai*,,an),

满足 ai*argmaxaiAi(i)P{iii*|i)u(ai(i),ai,i) i1,,n

则称a*是一个(纯战略)纳什均衡,也称为贝叶斯纳什均衡(Bayes Nash equilibrium)。a*是类型依存的,即ai*ai*()。

为了减少复杂性,假定博弈开始之前各个局中人掌握的关于

(1,,n)的分布密度知识是相同的,即概率分布密度P(1,,n)是所

有局中人的共同知识。这被称为Harsanyi公理。这一公理表明所有局中人有关自然行动的信念(belief)是相同的。

贝叶斯纳什均衡(也简称贝叶斯均衡)是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。有时也称不完全信息静态博弈为静态贝叶斯博弈或贝叶斯静态博弈。

n人静态贝叶斯博弈的战略式表述:

局中人类型空间H1,,Hn;条件概率P1,,Pn;战略空间

A1(1),,An(n);支付函数u1(a1,,an,1),,un(a1,,an,n)。i知道i。用

GA1,,An,1,,n,P1,,Pn,u1,,un表示该博弈。

博弈顺序为:

iHi,①自然N选(1,,n),局中人i观察到i,但局中人ji仅知道Pj(j|j),不能观察到i。

②n个局中人同时选行动(战略)a(a1,,an),aiAi(i)。 ③i得到支付ui(a1,,an,i),i1,,n。

该定义不排除局中人j可能拥有关于局中人i类型的某种信息,而当所有局中人类型空间只有一个元素时,不完全信息静态博弈就退化为完全信息静态博弈。

同时,这里假定Ai(i)和ui(ai,ai,i)本身是共同知识,即尽管其他局中人不知道i的类型i,但他们知道i的战略空间和支付函数是如何依赖于他的类型的,即当他们知道i时,就必然知道Ai()和ui()。

n人不完全信息静态博弈GA1,,An,1,,n,P1,,Pn,u1,,un的

纯战略贝叶斯纳什均衡是一个类型依存战略组合ai*(i)i1,满足:

nai*(i)argmaxaiAi(i)P{ii*|i)ui(ai(i),ai,i) i1,,n

有限博弈的不完全信息静态博弈至少存在一个贝叶斯纳什均衡。

纯战略只是一个行动ai如何依类型i而变的规则,不是指一个具体的结果。

例 市场进入博弈

一个完全垄断企业B正垄断着一个行业的市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵见下表。

市场进入博弈 B

A

假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同。假若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),

进入 不进入

高成本 默认 40,50 0,300 斗争 -10,0 0,300 低成本 默认

斗争

30,80 -10,100 0, 400 0, 400

即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。

当A不知道B的成本情况时,他的选择将依赖于他对B的成本类型的主观概率或先验概率密度。

设A对B是高成本的先验概率判断为P,则A认为B为低成本的概率为1P。

如果A进入,其期望支付为 P(40)(1P)(10) 如果1不进入,其期望支付为0。

当且仅当P(40)(1P)(10)0或P时,A选择进入;反之,当

P1时,A不进入。 515于是,贝叶斯均衡为:

(进入,默认),高成本,P; (进入,斗争),低成本,P; (不进入,*),P 其中*表示可以是斗争,也可以是默认。

例 不对称信息(asymmetric information)下的古诺竞争

市场中有两个企业。

市场需求: P(Q) = a – Q, Q = q1 + q2.

企业 1 成本: C1(q1) = cq1.

151515

企业 2 成本: 以概率 取C2(q2) = cHq2,

以概率 1– 取 C2(q2) = cLq2。

企业 2的产量依赖于成本:

max [(a - q1* - q2) - cH]q2

max [(a - q1* - q2) - cL]q2

企业 1 选择 q1

max [(a - q1 - q2*(cH)) - c]q1 + (1–)[(a - q1 - q2*(cL)) - c]q1 一阶条件

(a - q1* - cH) – 2q2*(cH) = 0 (a - q1* - cL) – 2q2*(cL) =0

{[(a - q2*(cH)) - c] +(1-)[(a - q2*(cL)) - c]} - 2q1*=0 解出

q2*(cH) = q2*(cL) = q1*=

3.3 应用

例1 信息不完全的性别战

a2cHc1 + (cH - cL) 36a2cLc – (cH - cL) 36a2ccH(1)cL

3

帕特 歌剧 拳击

歌剧 2+ tc,1 0, 0 克丽斯

拳击 0, 0 1, 2+ tp

类型空间: Tc = Tp = [0, x] tp和tc 为[0, x]上的均匀分布.

推断(密度函数): pc (tp) = pp (tc) = 1/x

直觉: 分别存在临界值c与p:

当 tc > c时,克丽斯选择歌剧, 否则选择拳击. 当 tp > p时,帕特选择拳击, 否则选择歌剧.

克丽斯的期望收益

看歌剧: 看拳击:

选择歌剧最优

pp(2 + tc) > 1 – xxppp(2 + tc) + (1 –)× 0 = (2 + tc) xxxppp× 0 + (1 –) = 1 – xxx即 tc  因此临界值 c =

x– 3 px– 3 p帕特的期望收益

看拳击:(1 –)×0 +(2 + tp) = 看歌剧: (1 –) +

由选择拳击最优

tp 

x - 3 ccxcxcxc(2 + tp) xcc×0 = 1 – xx临界值 p = - 3 解得 p = c

和 p2 + 3p – x = 0.

克丽斯选择歌剧的概率

1 -

394xcxc= = 1 –

2xxxxc帕特选择拳击的概率

1 -

394xxpp = = 1 –

2xxx

当x → 0时,

1 –

394x1 → 1 – 2x3这正是完全信息下性别战博弈的混合战略纳什均衡。

例2 拍卖(an auction) 拍卖方式

最为流行的拍卖方式有4种:英式(增价公开)拍卖,荷兰式(减价公开)拍卖,一级价格密封拍卖(first-price sealed auction),二级价格密封拍卖(second-price sealed auction,又称Vickrey拍卖)。从形式上说前两种是公开拍卖,后两种是密封式拍卖;从实质上来说,英式拍卖和二级价格拍卖是(第)二价拍卖,其余两种是(第)一价

拍卖。

(1)英式拍卖:卖者以一个价格(可能很底)起拍,并逐步提高这个价格。如果一个投标者放弃了,就不能在后面再参与拍卖。当拍卖只有一个竞拍者时,他就是获胜者,并支付该时刻的价格。

(2)荷兰式拍卖:卖者以一个价格(高)起拍,并逐步降低这个价格,第一个应拍的竞拍者以该时刻的价格获取拍卖品。

(3)一级密封拍卖:每个竞拍者拿出一个密封的竞价交给出售者。出价最高者获胜并支付这个最高的价格。

(4)二级密封拍卖:与一级密封拍卖唯一不同的是,出价最高者获胜但支付的第二高的竞价。

尽管英国式拍卖和第二价格拍卖看起来很不相同,但从它们如何引导参与人理性决策来说,效果是一样的。因此,我们说这两种拍卖在策略上是等价的,有些经济学家甚至借用数学语言说它们是“同构”的。在这两种拍卖中,参与人受到要“显示私人真实评价”的激励。在第二价格拍卖中,这是最明显的,因为每个买主直接把他们对拍卖品的评价写在密封的信封里。在英国式的拍卖中,买主则需要通过逐渐抬高出价来慢慢接近自己的评价。

考虑密封第二价格拍卖中的买主。他必须把他的出价写下来,密封在信封里交给拍卖人。因为赢得交易的人只用付出第二高价格,所以在信封中写下他愿意付出的最大价格将是符合买主利益的决策行

动,而这时候的最大价格又等于他对拍卖品的评价。如果他赢得了拍卖,第二高的价格将比他对拍卖品的评价低,所以这时候买主还将获得一些额外利润或者说剩余。如果他写下的出价低于他的估计,他就面临着不能在一个他可以接受的价格水平上获得拍卖品的风险,但如果出价高于他的评价,他也要面临必须以一个高于他的评价的价格水平购买拍卖品的风险。因此,在这样的拍卖制度下,按自己的评价出价依然是一个优势策略。

对于一个处于英式拍卖制度下的买主,当出价不断地被抬高的时候,他必须要作出决策,决定是出比他的竞争对手更高的价,或者退出这场出价竞争。如果对手的出价实际低于他自己的评价,那么对他而言,继续提出比对手更高的出价将是有利可图的。如果对手的出价已经高于买主的评价,该买主最好的做法就是退出竞争。可以想像这样的买主,在他的头脑中有一个最高的出价,这个价格水平等于他对拍卖物品的评价。无论他的竞争对手怎么做,他的优势策略都将是:必要时一直出价,直到等于他对拍卖品的评价为止。

用博弈论的话来说,在这两种拍卖中,“讲真话”是每个参与人的优势策略。由于“讲真话”是每个参与人的优势策略,所以拍卖博弈的纳什均衡具有下述性质:

(1)赢得交易的最高出价,来自对拍卖品评价最高的参与人。因此,这样的配置是帕累托最优的。获得拍卖品的人,是可以从拍卖中获得最多满足的人。而如果拍卖品到了评价较低的买主的手中的话,那么就有进一步发生这个人和对拍卖品评价最高的人之间的互惠交易的可能性和基础。也就是说,只要拍卖品不是由评价最高(因而

出价也最高)的参与人获得,交易结果就不是帕累托最优的。之所以说不是帕累托最优,是因为仍然有改善的余地。

(2)拍卖成交时实际付出的价格,等于第二高的出价。或者说在极限的意义上等于第二高的出价。

对于密封第二价格拍卖,这两个性质是比较清楚的,因为每个参与人都实施优势策略,把他们的评价直接写在密封的信封里,对拍卖品评价最高的人将赢得交易,他付出第二高的出价。

在英国式的拍卖中,结果(1)的出现是因为评价最高的买主是最后一个从出价竞争中淘汰出局的人。结果(2)的出现,则是因为评价第二高的买主是倒数第二个从出价竞争中淘汰出局的。因为所有的参与人都讲真话,第二高的出价,我们把它记作 P ,实际上代表了在参与人中对拍卖品第二高的评价。正是这个对于拍卖品的评价第二高的参与人,把出价提高到他对拍卖品的评价的高度上来。这时候,对拍卖品评价最高的参与人,只要比 P 提高一点点出价,就可以获得这件拍卖品了。因此,至少在极限的意义上,英国式拍卖的成交价,等于第二高的出价。

从理论上说,荷兰式拍卖和第一价格拍卖在策略结构上是等价的,或者说“同构”的。这两种拍卖制度虽然从外形上看很不同,但实质上一样。

在荷兰式拍卖中的参与人会在拍卖开始之前确定他自己对拍卖品的出价。如果拍卖师喊出的拍卖价格果真下降到这个水平,他就以

这样的出价应叫,进入拍卖并赢得交易。如果有其他的参与人在他之前已经应叫,这意味着那个人的出价比他高,他就不能赢得拍卖品。现在的问题是,他的出价策略是什么呢?这是一个非常困难的选择,因为出价越低,赢得拍卖品的机会就越小,但一旦赢得交易,他可以获得的额外的利润或剩余就越多。相反,他出价越高,他赢得拍卖品的机会越大,但是他可以获得的额外利润或剩余就越少,甚至带来损失。

在第一价格拍卖中,参与人必须作出一个和在荷兰式的拍卖中的参与人一样的决策:即选择一个出价,并把它写在密封的信封里。有关选择合适的出价的策略问题也是相同的,如果他给出的价格越低,赢得交易的可能性越低,但一旦获胜,可以获得的利润或剩余就越多;如果他给出的价格越高,赢得交易的可能性越大,但一旦赢得交易,可以获得的利润或剩余却很少,甚至可能亏损。

一级密封价格拍卖(First-price, sealed-bid)

这种拍卖方法是要求买主同时将自己的出价写下来装入一个信封并密封后交给拍卖人。拍卖人打开信封,决定将拍卖品卖给出价最高的买主,按他的出价支付价格。当多位买主同时报出相同最高价格时,拍卖者通过掷骰子随机地将拍卖品卖给其中的一位买主,按他们报出的最高价格支付价格。一级密封价格拍卖可以避免围标,因为每一个买主的报价对于其他买主来说是不可观测的(当然,要做到这样,还要求成交后拍卖者要对买主的报价保密),因而每个买主的行为不受围标组织者的约束。一级密封价格拍卖尽管可以避免围标,但不能保证买主们会报出他们心目中的真实估价或最高价格。

给出一个模型,假设有两个投标人,vi是拍卖物品对投标人i的

价值。bi是投标人i的出价。vi只有投标人i自己知道,因此,vi是投标人i的类型。虽然投标人都不知道拍卖物品对对方的价值,但知道其分布为[0,1]上的均匀分布函数。

类型空间: Ti = [0, 1] 收益

vi – bi if bi > bj ui (b1, b2; vi, v2) = (vi – bi)/2 if bi = bj 0 if bi < bj

战略,即报价: bi(vi)

贝叶斯纳什均衡 (bi(vi), bj(vj)) 满足

max (vi – bi)Prob{ bi> bj(vj)} +(vi – bi)Prob{ bi= bj(vj)}.

求线性战略

bi(vi) = ai + civi, 问题为

max(vi – bi)Prob{bi> aj + cjvj } 其中

Prob{ bi> aj + cjvj } = Prob{vj < 参与人 i的最优行动满足 –

即有

bi(vi) =

viaj212biajcj} =

biajcj

biajcj +

vibi = 0 cj

比较系数,得到 aj = 0,ci=1/2 因此

bi(vi) = vi/2

例 3 双向拍卖 (A double auction)

一个买者和一个卖者, 分别提出价格 pb, ps

如果 pb  ps , 则以p = (pb + ps )/2交易; 否则不交易. 他们的估价为私人信息,vb和vs, ,为 [0, 1]上均匀分布. 买者收益

ub = vb – p if pb  ps = 0 if pb < ps

卖者收益

us = p – vs if pb  ps = 0 if pb < ps

战略 pb(vb), ps(vs)

贝叶斯纳什均衡 (pb(vb), ps(vs))满足

max (vbpbpbE[ps(vs)|pbps(vs)])Prob{ pbps(vs)}

2max (pspsE[pb(vb)|pb(vb)ps]vs)Prob{ pb (vb)ps}

2

(1) 单一价格均衡: 以预先决定的x成交。

如果 vb  x, pb = x; 否则pb = 0. 如果 vs  x, ps = x; 否则ps = 1.

vb

交易区域 x

x vs

如果 vb  vs,交易就是有效率的,但不一定会进行交易。

(2)线性均衡 假设卖者的战略

ps(vs) = as + csvs,

则ps(vs)是区间[as,as + cs]上的均匀分布,

E[ps (vs) | pb ≥ ps (vs)] = Prob{ pb  ps(vs)} =

买方的问题

max[vb –

从一阶条件解出

pb =

假设买者的战略

pb(vb) = ab + cbvb,

卖者的问题

max[{ ps +

从一阶条件解出

12psabcbacp} – vs ]bbs

cb2paap1{ pb + sb}]bs

cs22aspb (区间[as, pb]的中点) 2pbas cs21vb + as 33

ps =

21vs + (ab + cb) 33比较系数,得到

cs =, cb =, ab=均衡战略

pb(vb) = ps(vs) =

p

ps

pb

v

232311, as = 12421vb + 31221vs + 34由交易条件 pb  ps, 有

vb  vs+

1 4有部分有效的交易未发生。

vb

交易

x vs

3.3 显示原理

第一价格拍卖:在线性报价方式下,每个人的报价是他的估价的

一半, bi(vi) = vi/2。

第二价格拍卖:出价最高者获得购买,但是按第二高的出价交易。 贝叶斯纳什均衡:每个人按自己的估价报价,即bi(vi) = vi 不同的拍卖方式,参与人的报价方式不同。

机制设计(mechanism design)理论:简单的讲,经济机制设计理论是研究在自由选择、自愿交换、信息不完全及决策分散化的条件下,能否设计一套机制(规则或制度)来达到既定目标的理论。

两个约束:

参与约束或个人理性约束(individual rationality constraint,IR)。 激励相容约束(incentive compatibility constraint,IC) 满足参与约束的机制称为可行的机制。 满足激励相容约束的机制称为可实施的机制。 两者都满足称为可行的可实施机制。

直接机制(direct mechanism):每个人给出自己的类型(不一定是真实的)。

激励相容的直接机制:每个人给出自己的真实类型。

显示原理(revelation principle):任何贝叶斯博弈的任何贝叶斯纳什均衡,都可以重新表示为一个激励相容的直接机制,或者说,都可以被一个说真话的直接机制代表,说真话的直接机制就是激励相容的直接机制,该机制能使各个参与人都讲实话,即声明自己的真实类型。

如对第一价格拍卖的规则作修改:

报价最高者获得购买权,但是按他的报价一半交易。 在线性报价方式下,每个人的报价:bi(vi) = vi。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- niushuan.com 版权所有 赣ICP备2024042780号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务