博弈分析及应用

2023-09-04 来源：我们爱旅游

博弈分析及其应用

葛利萍

（绍兴文理学院数学系，浙江绍兴 312000）

摘要：系统地阐述了多人合作博弈理论，并提出利用Shapley值法计算联盟的收益函数中各局中人的分配，且具有一定的公正性和合理性，特别在利益分配问题，费用分摊问题，以及组合预测权系数的确定中有着广泛的应用，并对这些方面进行举例分析．

关键词：合作博弈；Shapley值；利益分配；费用分摊；组合预测

1 引言

在社会生活和经济、军事活动中，经常碰到各种各样具有竞争或利益相对抗的现象，如

下棋、打扑克、为争夺市场展开的广告战、军事斗争中双方兵力的对垒等，竞争的各方总是希望击败对手，取得尽可能好的结果，都想用自己最好的战术去取胜，这就是博弈现象．博弈现象实际上是一类特殊的决策，在关于不确定型的决策分析中，决策者的对手是“大自然”，它对决策者的各种策略不产生反应，更没有报复行为．但在博弈现象中，代替“大自然”的是有理性的人，因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应．

博弈论的英文名为Game Theory，又称对策论，用比较简短的话来概括，所谓博弈是指局中人按一定规则，在充分考虑其他局中人可能采取的策略的基础上，从自己的策略集中选取相应策略，并从中得到回报的过程．尽管博弈论中研究的问题形形色色，但任何一个博弈问题都包含下列三个要素：

1．局中人（players）是指参与竞争的各方，它可以是一个人，也可以是一个集团，但局中人必须是有决策权的主体，而不是参谋或从属人员．局中人可以有两方，也可以有多方．当存在多方的情况下，局中人之间可以有结盟和不结盟之分．

2．策略（strategies）是指局中人所拥有的对付其他局中人的手段、方案的集合．在静态博弈中，策略必须是一个独立的完整的行动，而不能是若干相关行动中的某一步．例如一次乒乓球男子团体比赛中，包括两名单打和一对双打选手出场，比赛前提交的名单除规定出场球员姓名之外，两名单打还必须明确谁是第一单打，谁是第二单打，这样不同单打和双打队员的出场搭配以及两名单打队员的不同排序构成了不同的策略．相应每个局中人的策略选择形成的策略组称为一个局势．

3．收益函数（payoff function）指一局博弈后各局中人的输赢得失，通常用正的数字表示局中人的赢得，负的数字表示局中人的损失．

博弈论研究决策主体的行为在发生直接相互作用时，人们如何进行决策以及这种决策的均衡问题．博弈论是研究理性的决策之间冲突与合作的理论．在博弈论分析中，一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事，他考虑到他的决策行为对其他人的可能影响，以及其他人的行为对他的可能影响，通过选择最佳行动计划，来寻求收益或效用的最大化．由于在现实生活中人们的利益冲突与一致具有普遍性，因此，几乎所有的决策问题都可以认为是博弈．博弈论在政治学、军事学、生物进化学、心理学、社会学、伦理学、经济学等许多领域都有着广泛的应用．在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域，每一领域的最新进展都应用了博弈论，博弈论已经成为主流经济

学的一部分，对经济学理论与方法正产生越来越重要的影响．正因为如此，1994年瑞典皇家科学院决定将诺贝尔经济学奖授予了纳什（John Nash）、哈萨尼（John Sanyi）和泽尔腾（Reinhard Selten）三位博弈理论家和经济学家，表彰他们在博弈论理论和应用研究方面作出的杰出贡献．目前博弈论在定价、招投标、谈判、拍卖、委托–代理以及很多重要的经营决策中得到应用，它已成为现代经济学的重要基础．

博弈中有关局中人的策略集、收益函数等构成了博弈的信息．按局中人对信息掌握情况，可区分为完全信息博弈和不完全信息博弈．按局中人采取行动的次序，当同时采取行动或在互相保密情况下采取行动，称这种情况为静态博弈．如果局中人采取行动有先后，后采取行动的人可以观察到前面人采取的行动，则属于动态博弈．综合上述，博弈可分为完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈．当然按局中人是否结盟情况，博弈还可区分为合作博弈和非合作博弈．

合作博弈是一种解决多利益主体协调行动产生效益分配问题的有效数学模型．合作是指参与者从自己的利益出发，选择行动，但选择行动的结果对各方都有利．合作博弈研究的问题就是要找到一种效益分配方式，能促使所有利益主体合作．基于合作博弈理论的收益分配是希望通过联合从事某项活动，使每个人的收益比单独从事这项活动或作小范围联合时的收益多．

当代世界，合作与竞争共存成为时代的主题，而企业间各种形式的合作联盟更成为当今经济界竞争的热点模式．组成合作联盟进行合作创新已经成为越来越多企业的选择．在社会活动中的若干实体，为了在日益激烈的竞争中争得一席之地，也为了获得更多的经济或社会效益，相互合作结成联盟或集团．这种合作通常是为了利益，是非对抗性的，确定合理分配这些效益的最佳方案是促成合作的前提．

2 多人合作博弈概念

在日常生活及社会经济活动中，一个人（或集团）为了克服自身弱点（如力量或财力有限），寻求与他人（集团）进行合作，结成一个联盟，以完成单个人或集团所不能完成的事，这就是多人合作博弈．该联盟一旦形成，就作为一个整体共同采取行动，其目标是使联盟获得最大利益．一旦博弈完毕，可以根据某种事先商定的契约以及各个局中人本身的贡献大小，分配共同所得的利益．

1,2,,n进行博弈，联盟的数学定义是：设有n个局中人N所谓一个联盟就是N的

一个非空子集S．为方便起见，有时称空集也是一个联盟．n个局中人共能形成2个联盟．

一旦联盟S形成，组成联盟S的局中人不再关心自己的特殊利益，而为整个联盟的最大利益去努力．因此，他们主要关心联盟S所能获得的最大值．所有联盟S所获得的最大值都确定以后，整个博弈就完全清楚．这样的博弈可以用特征函数加以描述：

11,2,,n，合作n人博弈记为N,v，N上的特征函数v是定义1：给定Nn定义在2上的实值函数，满足：

Nv0，

vSTvSvT,ST,S,TN. （1）

对于一个联盟S，vS的值可以通过下列方式获得：S中局中人形成联盟为使S获得最大利益而努力，这时最糟的情况是剩下的所有局中人NS形成一个联盟和S抗衡，这样可看成是两个局中人S与NS在进行非合作博弈，vS就是在上述两人非合作博弈中，

S所获得的最大收入．

对于合作博弈，局中人之间可以相互协商，共同采取使全体都有利的策略，如果某些局中人对采取某些特定策略不满意，可以事先订立契约，等博弈完了以后再进行补偿，以便大家共同采取的策略使联盟总体的利益达到最大．因此，博弈完毕后，如何分配共同形成的总体联盟N所得的收入vN就是合用博弈研究的主要任务．

vS的一种分配方案由n维向量Xx1,x2,,xn表示,xi表示局中人i的所得．显

然，对每一个局中人i来说，它至少期望得到的xi满足：

xivi,iN. （2）（2）称为个体合理性条件；还有一个必须满足的条件是：

xi1nivN. （3）

（3）称为群体合理性条件．（2）、（3）合到一起就得到一种分配方案．

1,2,,n为最大的一个联盟，记vN为最大当所有n个局中人均参与合作时，N的联盟成果，如何将vN分配给各局中人？一个很自然的方法就是依据各局中人给联盟带来的贡献来分配．

设xi为第i个局中人从vN中获得的分配，i1,2,,n则有：

x1v1，

x2v1,2v1， x3v1,2,3v1,2，

……，

xnvNvNn.

然而上述的分配通常与局中人编号的次序有关，如把局中人n,n1,,2,1的编号改为

1,2,,n，则有新的分配方案：

x1vn，

x2vn,n1vn，

x3vn,n1,n2vn,n1，

……，

xnvNvN1.

对于局中人其它编号的次序均有对应的分配方案，由于n个局中人编号的次序共有n!种，所以对应的分配方案也有n!种．为此取各局中人分配的平均值作为局中人的平均贡献．

记iv为第i个局中人的平均贡献，则有：

iv1iivSivS,i1,2,,n. （4） n!其中为由1,2,,n组成的所有n级排列，为针对所有的n!个不同n级排列求和，

iiiSj|ji，显然S为排列中排在i之前的那些局中人组成的联盟，将满足SS排列归为一类，（4）式可以表示为:

iviSnS!S1!n!vSvSi,i1,2,,n, （5）

i的所有子集，S为子集S中局中人的人数．可以证明：其中S为N中包含vvN. （6）

ii1n（6）式表明各局中人在联盟中的平均贡献iv之和等于联盟的总“成果”．定义2

3 称v1v,2v,,nv为合作n人博弈的Shapley值.

在多人合作博弈中，利用Shapley值法解决分配问题是一种比较公正、合理且行之有效的方法．本文的目的是探讨Shapley值法在利益分配问题，费用分摊问题，及如何确定组合预测权系数中的应用．下面就通过实例来说明Shapley值法在这些方面的具体应用．

3 利益分配问题

随着科学技术进步和信息技术的迅速发展，世界市场已由过去的相对稳定变成动态多变的特征，由过去的局部竞争演变成全球范围的竞争．在此情景下，以最快的速度推出产品、以最好的质量、最低的成本和最优的服务满足不同用户的需求成为每个企业认真解决的问题．于是越来越多的企业纷纷寻找合作伙伴，结成联盟，利用各方优势以更好地适应快速变化的市场要求．各企业结成联盟后获得了更大的收益，如何利用Shapley值把联盟的整体收益合理地分配给各个企业，下面给出一实例．

设现有三家企业A、B、C为了抓住某一市场机遇，决定实施联盟生产某种新产品投入市场，联盟成功后将获得一批可观的收益，现如何用Shapley值分配这一联盟收益．让我们

先看在特定场合单家企业生产或两家联盟生产以及三家联盟生产的收益情况（见表1）．表1 联盟博弈收益表单位：万元企业 A B C A+B（A、B企业联盟) A+C（A、C企业联盟） B+C（B、C企业联盟） A+B+C（A、B、C企业联盟）收益 120 80 40 240 280 200 480 由表中可以看出，两家联盟比单家生产合算，三家联盟比两家联盟合算，按Shapley值法计算：

1202408028040480200200， 3123138024012020040480280B140，

3123134028012020080480240C140．

312313A4 费用分摊问题

在我国区域经济中中小型制造企业数量很大，行业型企业联盟有利于企业抵御风险、降

低成本、提高市场竞争力．行业型企业联盟中企业协作的形式有多种，基于行业信息网络的行业联合采购是联盟企业协作的重要手段之一．在联合采购中，各采购企业通过合作使得在满足各自采购目标时的采购总费用Y小于各采购企业单独采购时的采购总费用X，每个采购企业都希望自身分配的收益越大越好，分摊的联合采购成本费用越少越好．下面就用Shapley值法对联合采购费用进行合理分摊计算．

先给出一些符号定义：

CS：联盟S的总采购费用；

M1,2,,m：企业采购物资的集合；

yy1,,ynRNM：其中RNM是联盟N购买的所有物资的集合，

yiyi1,,yimRM，其中yij是企业i购买物资j的数量，iN,jM；

pjy：购买第j种物资，数量为y时的价格；

fik：企业i采购物资k次时的交易费用，fSk为联盟S联合采购k次的交易费用．

物资采购中，采购费用包括采购的交易费用和采购物资的实际费用两部分．采购的交易费用是指一次物资采购中，采购主体（单个企业或行业采购中心）发布消息、组织招投标等进行辅助交易的费用，而采购物资的实际费用是指采购物资的实际数量和实际采购价格之积．

行业联合采购中，联盟S的采购总费用为：

CSfSkSpjySjySj．（7）

j1m对所有的联盟S都算出CS，就得到行业联合采购的一个n人合作博弈N,C． Shapley值法的行业联合采购的费用分摊计算公式为： UiiSSNnS!S1!n!CSCSi．（8）

i表示企业i没有加入联（8）式中Ui表示企业i联合采购时的分摊采购费用，CSi表示企业的边际费用（也称可分离费用），即企业i盟S时的采购费用，CSCS加入到联盟S中至少应承担的费用（最小分摊费用）．

下面举一实例说明Shapley值法在行业联合采购中的费用分摊计算．

某行业型企业联盟中有四家企业拟联合采购两类物资，假定企业独自均能采购这两类物资并可任意结盟进行联合采购．描述如下：

N1,2,3,4：局中人为四家企业； MA,B：有两类采购物资；

PN为：PN1,2,3,4,1,2,1,3,1,4,2,3,2,4,3,4, 1,2,3,1,2,4,2,3,4,1,2,3,4． 对每一个联盟SPN，其采购费用函数CS可由（7）式算出．在本实例中，不失一般性，假定企业单独采购或联盟联合采购均能一次采购完所需物资，并且四个企业单独采购的交易费用均相等，即：

f11f21f31f412000元．（9）而所有联盟的采购费用也相等，即：

fS13000元，SPN且S1．（10）

在本实例中，不失一般性，价格函数pjy假定为购买数量的线性函数，其表达式为：

Pjmax,yyjmin pjybjajy,yjminyyjmax．（11）

yyjmaxPjmin,式中，Pjmax和Pjmin分别是第j种物资在最小购买量yjmin和最大购买量yjmax时的最高、最低价格．本实例中，设PAmax,PAmin,yAmax,yAmin分别为90元、60元、160单位和40

单位，PBmax,PBmin,yBmax,yBmin分别为100元、60元、150单位和50单位．因此可分别算出物资A、B的价格函数：

y40y5090,100,y,40y160，pBy1202y,50y150．（12） pAy10045y160y15060,60,因此可算出所有联盟SPN的采购费用如表2所示．

表2 各种联盟采购物资数量（单位）及采购费用（元）表

联盟S 类别物资A 物资B 价格A 价格B 费用CS 1 50 80 87.5 88 13415 2 30 30 90 100 7700 3 10 20 90 100 4900 4 30 50 90 100 9700 1,2 80 110 80 76 17760 1,3 60 100 85 80 16100 1,4 80 130 80 68 18240 2,3 40 50 90 100 11600 续表2 各种联盟采购物资数量（单位）及采购费用（元）表

联盟S 类别物资A 物资B 价格A 价格B 费用CS 2,4 60 80 85 88 15140 3,4 40 70 90 92 13040 1,2,3 1,2,4 1,3,4 2,3,4 90 130 77.5 68 18815 110 160 72.5 60 20575 90 150 77.5 60 18975 70 100 82.5 80 16775 1,2,3,4 120 180 70 60 22200 利用Shapley值法计算公式（8）求行业联合采购的费用分摊，得：

U113415117607700161004900182409700 4431881511600205751514018975130402220016775

4348742.08

同理可得，U24837.08，U32743.75，U45877.09．

由此可以看出，对联盟贡献少（采购物资少）的企业分摊的采购费用相对较少，将获得更多收益，因此是一种根据企业对联盟贡献大小来分摊费用的方法．

5 组合预测权系数的确定

预测是根据以往及现在的已知信息，采取一定的方法或技术，对事物的未来发展趋势和结果进行估计或推测．组合预测就是综合利用各种预测方法所提供的信息，以适当的加权平均形式得出组合预测模型．组合预测最关心的问题就是如何求出加权平均系数，使得组合预测模型更加有效地提高预测精度．

设某社会经济现象的指标序列的观察值为xt|t1,2,,M，设有n个单项预测方法

1,2,,n表示，则N为组合预测方法的局中人集对其进行预测，n个单预测方法用N合．N中的任一子集S2形成组合预测方法的一个联盟，若干个局中人结成联盟后，这个联盟作为一个整体进行组合预测就是希望尽可能多的降低组合预测误差，本文采用误差平

方和这个指标来反映预测精度．

设xit为第t时刻的预测值，记eitxtxit为第i种预测方法在第t时刻的预测误差，

Ni1,2,,n，t1,2,,M．

ˆtl1x1tl2x2tlnxnt为xt的组合预测值，l1,l2,,ln为各种预测方法的加权设x系数，且满足

li1ni1,li0,i1,2,,n．设et为第t时刻组合预测误差，则有：

nnˆtlixtxitlieit．（13） etxtxi1i1组合预测模型的误差平方和为： JNet1M2tliljeitejt．（14）

t1i1j1MnnMTT记Eeitejt，Ll1,l2,,ln,I1,1,,11n,称矩阵E为组合预测模

t1mm型的误差信息矩阵，称L为组合预测模型加权系数向量，则以组合预测误差平方和的非负权

最优组合预测模型可写为：

minJNLTEL ITL1 （15）

L0令vSJS，vS为特征函数，JS表示联盟S进行组合预测所得的预测误差平方和，vS表示JS相反数．

因为预测误差平方和越大，预测精度越低，所以vS越大，表明预测精度越高．由Shapley值即可计算第i种单项预测方法同联盟合作的平均贡献iv，考虑到vN为误差平方和的负值，需将iv做如下归一化处理可得组合预测的加权系数l1,l2,,ln：

vNliiv显然它们满足

vN，i1,2,,n．（16） vj1jnli1ni1,li0,i1,2,,n．

组合预测权系数确定的合作博弈方法计算步骤：

1）根据组合预测误差信息矩阵对角线上的元素，采用某种正权组合方法，如方差倒数加权法，均方差倒数加权法等给出初始的组合预测权系数的估计．

2）根据（14）式计算各种联盟合作的特征函数．

3）根据（5）式计算各种预测方法的所获得的平均分配，即Shapley值．

4）根据（16）式对各种单项预测方法的所获得的平均分配做归一化处理即得组合预测权系数．

下面用一实例来说明．

1,2,3三种单项预测方法组合而成．其预测误差的信息矩阵设某组合预测问题有N为：

Eeij33835344

546其中e11,e22,e33分别是1,2,3这三种单项预测方法的预测误差平方和．本例采用方差倒数加权法，其一般计算公式为：

n1l1,l2,,lneiii11e11111．（17） ,e22,,enn所以按照（17）式1,2,3这三种单项预测方法在组合预测中的加权系数为：

111111364l1,l2,l3．

846846131313再按照（15）式得

1835T364364 JN3444.3314，

131313131313546即vNJN4.3314，同理，采用方差倒数加权法可得

v1,21.9172，v1,31.7041，v2.32.5562， v18，v24，v36

按照（5）式计算得：

1v81.917241.70416 3123同理可得

4.33142.55622.3196．

132v0.6213，3v1.5859．

按（16）式计算组合预测加权系数得：

l10.16139，l20.60255，l30.23606．所以

835 JN0.161390.602550.23606344•

5460.161390.602550.236064.09734．

T若1,2,3这三种单项预测方法按（15）式利用Mathlab软件包可求得最优组合预测加权系数得：

0． l10.1667，l20.8333，l3对应的最小的预测误差平方和：

JN3.8333．

由此可见，本例用Shapley值法确定的组合预测加权系数明显优于用方差倒数加权法确

定的，且与最优组合预测方法预测精度很接近．该方法不仅适用于以误差平方和为准则的组合预测模型，而且适用于基于预测有效度的组合预测模型．

6 结束语

本文主要阐述了解决多人合作博弈中联盟分配问题的一种方法——Shapley值法．举例说明此方法在利益分配问题，费用分摊问题，以及组合预测权系数的等方面中有着较好的应用，而且利用Shapley值法解决这些方面的问题具有一定的公正性和合理性和一定的实用价值．

但是，从理论上来说，在多人合作博弈中，如果局中人数量越多，在利用Shapley值法计算时需要的信息量也就越大，也从不同程度上加大了计算量．因此，在实际应用中，是否采用Shapley值法来分配联盟的收益也要根据具体问题而确定．

致谢：感谢盛宝怀老师的悉心指导！

参考文献

[1] 刘德铭，黄振高．对策论及其应用[M]．国防科技大学出版社，1995 [2] 胡运权等．运筹学基础及应用[M]．第四版．高等教育出版社，2004 [3] 谢政．对策论[M]．国防科技大学出版社，2004

[4] 任民．铁路客运收入分配的多人合作对策问题[J]．宝鸡文理学院学报（自然科学版），1999，19(3)：

24～29

[5] 贾平，刘雷．企业动态联盟的博弈分析[J]．生产力研究，2003，02：254～255 [6] 陈伟，查迎春．关于成本分摊的合作博弈方法[J]．运筹与管理，2004，13(2)

[7] 李波，杨灿军，陈鹰．基于合作对策的行业联合采购费用分摊研究[J]．系统工程理论与实践，2003，

11：65～70

[8] 陈文颖，侯盾．基于合作对策思想的总量控制优化治理投资费用分摊方法[J]．环境科学学报，1999，

19（1）：57～62

[9] 周玉霞．合作对策方法在确定组合预测权系数中的应用[J]．重庆师范学院学报（自然科学版），2003，

20（2）：6～8

[10] 陈友华．组合预测权系数确定的一种合作对策方法[J]．预测，2003，1：75～77

Game Analysis and Its Applications

Ge Liping

(Department of Mathematics,Shaoxing College of Arts and Sciences,Shaoxing,Zhejiang 312000)

Abstract: In this paper, we introduce the game theory of many people’s cooperation, and put forward a method of calculating the distribution of every player with Shapley values. The method has some impartialty and rationality. Especially, it has extensive applications in payoff allocation, cost allocation and combination forecasting weight coefficient’s determination, some practical examples of the applications of such method are presented.

Key words: cooperative games; Shapley values; payoff allocation; cost allocation; combination forecasting

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

博弈分析及应用