本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 ) k8 `* v: A5 T7 q7 C" y* U
2 \& `1 k8 R0 o, O
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* L% }; c) W' v5 y6 A' j2 S Y
以下三个定义:" S9 p6 M! {5 _" d+ M% |" x5 y4 E
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 G6 y/ Z1 x' g, N# e1 C. ~ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' L( o. r9 O8 M# D' C! `! c7 X% T$ ]5 c 所谓的双方优势策略则是指双方利益总和最大的策略。
3 E' k. p/ K B- Y0 k% Y. B6 ?[编辑本段]严格优势策略举例分析% s& H1 E4 Y( z# m' \* @, c, V- y
一、经典的囚徒困境
+ O3 x' p4 H1 z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 }1 A$ _ c" v; Q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & |! t2 O3 `' F5 E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 t( O3 \ Y5 ]% ]; W, {, Y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 a( R; C' M, i' E# ] 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 W7 r g- d' G% r' O1 }
) z2 A: Q0 L9 o" z+ z
用表格概述如下:. ^1 k" S. T# P
6 z) L9 ~( f6 ]2 s; \, J. [( ]! I/ x 甲沉默(合作) 甲认罪(背叛) . _: O/ E3 }- e9 y- ~
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
& I" i' s# [$ S7 R- k乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ o3 t# F2 W, r- G. x) [' a
) U% ?+ C; d: M: m( `$ u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 ?( O$ D! N/ ]! s* R 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 C- R* M/ l# h Y5 w! R/ L2 e
若对方沉默、背叛会让我获释,所以会选择背叛。 , n+ V3 Y S3 M
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : v- r0 y+ f/ T3 h, k8 S0 f% ~3 o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - J3 o& ?5 W/ K# C! i0 l/ F
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' c, q6 Q1 M; W$ T* Y 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% O* c! o2 ^7 F" L" ]1 V m j[编辑本段]二、智猪博弈理论' h8 c" p5 N3 W# m& e3 a
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! U% @6 X5 n- j( x9 k 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 _/ O! g- ^: E! A7 K: | 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ ^( }4 i, {* v7 U( I
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : i3 Q2 E5 N# k) s
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % F: W0 V5 B+ V$ E+ R5 k7 u) h; T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: N$ G3 u1 @6 x- j o% [% Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, V0 k1 p0 X) {4 ?2 j
. R$ W/ Y4 B' T8 p三、关于企业价格策略
8 ^+ }# E% G8 U, S
, g; a& s$ H0 o; L, |, C
! p; _# H1 G! B4 B: \ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 T5 y7 ^# ?" K5 V+ T* X& v% k
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 [0 l* v! U; c5 ?% r* B
以下三个定义: |4 W3 R7 G. ^5 w2 b
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( ?( ]; X0 I& _8 g
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 h8 M" ~! }" B 所谓的双方优势策略则是指双方利益总和最大的策略。 8 K5 b/ W! p' w) k9 `
[编辑本段]严格优势策略举例分析
2 ~4 ^4 @! y& O( t 一、经典的囚徒困境
. q4 ^; F! a( A( `& m$ A 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & K9 J7 p9 N& B0 {2 q) _" ]
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 Y: k( S0 ]0 \: B1 D 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) G! z: ]7 `5 K6 `- `- q
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) P9 a, J& W a! G 若二人都互相检举(互相“背叛”),则二人同样判监2年。
: X: s4 j# m* A8 c: f; j0 s
) ?3 I: P$ `# z% v( W3 r1 I @用表格概述如下:
/ \2 ~7 Q9 _) w3 x& q! S4 U, O3 _% k0 c$ ~+ ?, c
甲沉默(合作) 甲认罪(背叛) - v$ i4 P, l9 x
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) s6 I; e) y/ g j1 ]" u乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
9 e( t5 Y9 ^4 h+ h- ^5 {) I+ Y( S T* m. O% d% q/ D: j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 l6 O5 l# v' o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# ? [( Z9 r% l) Z 若对方沉默、背叛会让我获释,所以会选择背叛。
3 x* P- Z0 B4 g5 Q7 I Y8 @ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 Q* j' R" F! M4 }# D
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 U! x! g8 h/ u& A
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; a* z, K4 J) D; q8 h9 L: B
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ n8 g3 E" J. s. B
[编辑本段]二、智猪博弈理论' Q! d& x6 Y- j- Z6 F: {' J
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 Y5 v$ P8 l/ }" N7 y i 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 X% ^: {/ N( t! K6 L 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( |) v. T3 m7 \& p# A! S
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) Q. m7 |7 |: f7 c “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 a1 x. l7 l& w# R 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( O0 P) ?( y; D. d0 O% @) B3 \- Y/ \ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' k3 e: E9 f4 C5 q( F
- r% r, m2 x3 g' |& t1 S) b
三、关于企业价格策略
6 N* [8 `- O1 [$ m, E1 v: V
9 j8 |2 X7 h% B
% J5 e( {5 }& g2 k- V9 ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * v/ |, k8 h( y: G' b1 |+ w6 n9 i4 J5 b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: ]/ Q( U- G5 q8 i# c$ }$ k; K
以下三个定义:
$ p7 ?: _( q* H+ \! c 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 ]. \3 G- t( F( O" Y3 A9 ?
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 ?# j3 I! Z2 A9 z
所谓的双方优势策略则是指双方利益总和最大的策略。
7 n9 h. C" m; l6 i; O. K' d, F& M0 x[编辑本段]严格优势策略举例分析
9 e$ e" R1 I; e6 `' z" b# j 一、经典的囚徒困境
) s: |! B! S, c& p3 P2 x% G+ J 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( a3 x4 v6 K/ T4 ?' b2 i4 t2 I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , m# w7 _9 S6 C4 s5 P( H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ n6 f6 f# P1 Q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 k3 _# l% d) A& g
若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 G5 b0 g( h3 y% L5 n
' Y7 G' A9 C$ h6 k用表格概述如下:2 M' [' y2 j" x+ W
% t$ X6 L- p$ h1 ~ 甲沉默(合作) 甲认罪(背叛)
5 [4 D K) \- k* I; W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 T+ M1 [3 s1 O8 |# e* g8 T) \& t乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ( z2 v9 @0 W5 U9 j( _( _
6 D% U; N P+ f! ^ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 j4 J, I J& K5 U. F1 o. }' v 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : y$ w+ X0 b. u) J( m# P
若对方沉默、背叛会让我获释,所以会选择背叛。
# y* J& C; n' z b) T5 ^- [ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 p6 d) V% c! [* J& k/ W9 p
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 ?0 u! Y1 O: ?
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * j+ i4 @, H% a6 L0 k
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" B; D! L G' F' z' Z[编辑本段]二、智猪博弈理论6 l+ f; _8 j9 C( b" P8 s
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & Q9 T# p5 ^9 q7 R" b1 T
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 w8 r' h# n( @9 K" P- Q
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; b) ^/ q# j. O
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 z- |$ b: H$ Y1 f1 ~) q7 F% x4 v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ i, T" z, Y$ \9 K$ R
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' k- ~' N5 w- V2 N! ~' G' t5 B4 v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" ?: Z& Y0 A& ?# V& b8 [: O
8 c2 [9 M# j/ L三、关于企业价格策略
+ d; A! [4 J# t8 C
5 b, C$ ^+ |2 f* Z/ P/ z q 0 {7 p: }, [$ T5 K& E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- t7 i2 w3 C0 o+ M8 ?( W% L4 E) z& S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# Z# N, U: H% n: D+ d0 ^ 以下三个定义:
4 h5 N T A4 a3 X) n# M0 T' k, N: T 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ ]0 |) Y" [1 L# Q$ ~. S, H 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) X! h" x8 Z# ~- f
所谓的双方优势策略则是指双方利益总和最大的策略。 & c* O) ~/ P8 t9 K
[编辑本段]严格优势策略举例分析 `, F- ^' j( X3 F M
一、经典的囚徒困境 ' {- a1 r8 z: Z/ e% V! v' ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / d" i4 ~3 [( W! H
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 T, q! h, r4 X5 ^9 p" K1 v! ~ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 b% `9 s# p5 _ h* v( C
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) }, h) p! v* S* q; }+ V z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
- z+ i1 q$ Q# j% e' v 0 G8 ]* G7 C# d9 i! |3 q
用表格概述如下:) S: b1 W0 m' p# ~" K
3 {% \0 d6 U1 o/ H 甲沉默(合作) 甲认罪(背叛)
! Q: Z$ |0 w! y# m3 c乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 x* L5 o d P. j4 P
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ _8 f/ J; r/ H/ n
6 d0 @8 {$ G4 ]2 E; H, R _ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 l' @1 l w6 Z0 ~. y5 R 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # Y. H- g2 @) Y' Y
若对方沉默、背叛会让我获释,所以会选择背叛。
3 L" m' k9 s! D1 { 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - n6 N" q4 m- F" A$ N Q
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; L$ a5 w! A Q6 [ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# e" d/ z. i5 F; q+ C% _ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, ^# U% e+ K* k
[编辑本段]二、智猪博弈理论' n5 ^$ d+ s- `/ R1 s' q7 P3 H
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; o, C5 I7 R5 ^4 `5 t4 [5 x( M
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
) v! `+ K+ ]% y) Z3 V& C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 w5 C; Y0 T5 |, m9 W& h# o
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / N* e6 y0 @: c) i+ H/ m
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ u/ D. G; h0 Q X) c, w; T9 `, { 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( e' U$ J* r+ t3 p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; z/ R9 r, u, e7 V' P- |* X I
/ z4 [- M% `5 L
三、关于企业价格策略
; g* \: W; C% H/ a5 G) O5 y9 p) Y6 q0 {0 }; Y
+ v" ?; y0 I# R+ k 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) k8 \' V& i5 o 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |