关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
1 f+ }8 G& K$ @( g5 o0 K- a7 ?* ?/ s- Z
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. e% h$ S0 z2 D) P  以下三个定义:8 a  N$ t) p! C' {) p1 j% }/ V. ^
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ ~+ M5 R- P4 ]  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( v- ~1 F% ~  i2 w7 h9 K  所谓的双方优势策略则是指双方利益总和最大的策略。  
  r' a6 t6 N8 J9 ]0 u1 W[编辑本段]严格优势策略举例分析
2 u5 L2 S& N+ D# E8 N  一、经典的囚徒困境
! x/ {. ]% Y. U" U' z5 k  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: h* E, f! f2 }  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; r* ^& Z" B# ~1 N) R
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, `7 k4 Y! W5 a: ?! J  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 + d% ^" v5 T0 y5 Z1 e# U  ]3 |& G
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
! u2 v& |- i# m$ A( }8 d. W9 R  % S; N/ a$ ?8 ]2 ~# p
用表格概述如下:
+ |: U* M$ B! f  ^6 _+ a8 O/ W# `2 v% S3 _7 x+ x+ u8 I
    甲沉默(合作)  甲认罪(背叛)  ! G$ g- n# S5 u
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
: Q3 T! h/ n% U乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  : D& y- \7 ~1 M* o

2 m" X' Q/ G2 }4 T$ C$ U; D' u" y! Z/ H! L  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + ^' h, d7 Z1 p- L- j, A0 w! k
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- D, i" i# S( A  y  ^, [8 Q  若对方沉默、背叛会让我获释,所以会选择背叛。
, {3 J0 Y3 i( c5 e1 I1 m$ ]6 s  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # L% p5 G9 ^" J7 S+ L; ^, P# m  z
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 I  a: k9 g+ V3 h/ t7 ~6 w
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' O# U3 o6 Q& U1 G6 c& l- @  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* ^8 n5 R9 c: {7 Q% \
[编辑本段]二、智猪博弈理论
7 n1 J. O; y  i1 g0 |& R, Q1 ]* G  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( d. ?; i9 J" h9 F+ [+ ^
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 [: w: W8 a5 q/ W; G- o0 R: b. N  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
  M0 Y% y9 @; b6 g% ?+ f& K/ W! {  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ x  S4 k9 s. o  |/ M# \9 m
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ q% R8 V7 j6 u) z" p) v6 ~4 H; I. v  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. G  y- T1 _* z) a6 i  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ B5 c4 c; ~( \; k% U, u  , F7 ?9 r2 ~. O; |2 N+ w# ~
三、关于企业价格策略
% B4 M  ]; E6 E7 ?' G/ ^: `( {4 G( G* O4 D/ M3 w0 `
  1 c/ l+ A) Q2 e+ K5 ?
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! w7 Y% g, Z3 Z. @) H5 N/ ~" m
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% e, A. J$ W6 H
  以下三个定义:
2 {6 [. H. ~3 j  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 k2 _. Y2 q7 ?- A' j
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 A( L; p" O; _; v4 t) @  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 }) r1 f0 H. ~) R& I0 Z[编辑本段]严格优势策略举例分析
( J. ^$ L7 b9 {2 C' ]3 s  一、经典的囚徒困境
, }+ g* U) q( [, ]$ C, X  q7 z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  D- h/ ^! m; X3 L8 Y1 [7 h  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   ^* I/ X' ?) r% I6 S6 }
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ~% H: l8 d, G# [- B
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 o2 Z+ h8 P( [+ F5 l: S- v  若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 n9 f; ~% I+ U$ S- t+ \2 o# {  
! s: j" ~3 g% b% m8 R5 U0 k5 A用表格概述如下:
& b4 Y8 X6 J: k2 h7 l
, z6 b' l4 ^+ {& W    甲沉默(合作)  甲认罪(背叛)  
( S0 x. q% J5 D: b- ~8 K- j0 b乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; y' r7 a4 R3 b( ^4 r, g
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 [5 s9 S. Y8 R3 o( ?8 n
! ?  O1 ?9 Y2 A7 E) Z4 |
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 f7 t9 ]4 _! I5 T  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 u; I1 K! D. P: x' ], Z) C4 B5 o  若对方沉默、背叛会让我获释,所以会选择背叛。
% [2 P$ _* f6 M; R7 [/ T  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ l8 g) W  I4 F* r
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 X. J# `2 M2 S: F  o
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 $ S2 X* c- B( h. u3 a  s
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# z6 h" R( w2 _  _2 R( Y0 N[编辑本段]二、智猪博弈理论
! d! N9 [  G& H  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; y2 T- J% J3 K* g  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % o. H, k: F6 [( D# o
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: D8 K/ |* _& X0 ~& r  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' B0 a# z" |9 i) E* ~- X  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( {4 f$ V3 {! g6 p0 D7 D  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 Y" b  i$ y" E: C4 U# \  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% d7 Q1 Y/ E0 j! ^  z1 L  : L" Z- ?# w9 N, B; e- @
三、关于企业价格策略
; p/ B5 a% x( w0 d6 \* U  N' D, c( v# k
  
* X$ ^! O0 L# O  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , b3 z4 T3 p4 g
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! \9 d/ A2 Z1 G+ R+ U: s  以下三个定义:% z. u: ?& ~& G
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # t4 q& w6 e; P$ C1 y8 h
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 a" b+ u1 U$ {" L- L0 O! d* g
  所谓的双方优势策略则是指双方利益总和最大的策略。  
+ o; q) @  k( G* f* U" W3 ~( a[编辑本段]严格优势策略举例分析" Q( x! X2 O- J& O5 p# C0 R
  一、经典的囚徒困境
+ @$ E; ?, V( z. U% _  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 y$ \9 e8 z% O5 j0 ?
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 }, P' u2 H/ t# f- G, h  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + [2 ^' m* K5 x
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : `% Y) n( D- I  {( Z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 j! Q8 N/ o: Z5 A$ {+ z' [, k: S! p; O  
) h5 X) |/ A' r8 B. X& k& {% [  N用表格概述如下:9 {3 s; O5 U8 n1 c+ I; d8 {

+ G2 `) K/ G( n    甲沉默(合作)  甲认罪(背叛)  
% x, k9 x, o. ?0 ]乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
% K1 L7 L6 b1 M乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  , `6 h: z) o+ S! V6 i5 n9 y9 @! m- I

0 u) E- C9 G* i  V  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 L2 g: f5 u0 j  a; O
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 Z( ~1 I& ]# X/ h5 h4 N1 M  若对方沉默、背叛会让我获释,所以会选择背叛。 - P8 n3 X3 h3 B# q: f7 p# j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 W7 s8 M. _( C  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" N* C: y2 w' J  x+ z5 i- F  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   h3 L0 K: R0 \! V. ~
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: `3 Y8 _/ x+ D+ y6 K
[编辑本段]二、智猪博弈理论4 n3 J# z, L' r& \
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 G4 l5 Z% n; ^: L$ V
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( b* D) e* T6 f8 `- H7 H; q
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) t/ V7 L5 h( _8 q1 T" x  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 j  x) v; ^* A( A
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( ^7 [! j  o8 P' \- s4 k1 l7 E  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  e0 w6 ^8 `7 V! S: S" l  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ {! M  w( B8 ?  $ _' K  A( z# ^& S. ~, ?
三、关于企业价格策略
, Q  D" ^) t! p2 T) f+ a
+ s6 @5 Q0 k: T( A5 [& i: u' ?  
' L; W/ p1 h5 e; `  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ {! u3 L3 U* y* p2 b5 e  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( g% A$ R; s/ ?, s
  以下三个定义:$ S$ ?% Q3 I/ Z5 s  W" U
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , h& x* c6 K( ?, X, r" M( \; ]
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. O4 @, H. m( R3 j* b" L$ B) o  所谓的双方优势策略则是指双方利益总和最大的策略。  5 X. h0 W8 T! J. }
[编辑本段]严格优势策略举例分析6 p6 A+ y7 N: Y$ D8 m
  一、经典的囚徒困境 4 e1 B* M6 P1 [! R; M0 @% e
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* {6 X6 A) p5 F8 d) w. P  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) \) d0 U5 H: Y% W  D! l4 @  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! [4 Q( e  o- T, F# ]# S' R
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% r7 n! u9 I1 Y. I: n  若二人都互相检举(互相“背叛”),则二人同样判监2年。& u; C2 v8 \. c  N
  
( w+ s; O! G) d用表格概述如下:( P4 V0 q4 s" p; t5 H$ c
: l* i! `; S4 H
    甲沉默(合作)  甲认罪(背叛)  7 o; ~9 a, d7 Q# _; T
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 n, }8 I( v4 n# W0 H% i' ?
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 g% C2 A7 B* I. x, D5 n  K9 g2 i. w2 P: l$ j& K* v$ c
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 A* o& e  a' \5 u  d& a6 C8 F  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 W. ^& J: w$ C( z  D2 C6 C( O
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 @& R' I: l! Z/ I& O! O" }  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 z8 _/ J$ F/ d5 L
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ P2 L$ H* \# o- p8 l9 c  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; I* D4 t. y' h3 V  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* |5 f9 ~; M# H
[编辑本段]二、智猪博弈理论- G! f+ \$ U7 m0 P3 g3 L( f  B
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ O0 x2 U- |8 {  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) q/ f/ J) p; B- V1 m
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + W9 u" @+ a! n4 K
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. d  }" Q+ c' d8 T  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' o0 u3 z! h/ D* X! n4 Y5 a* V6 {
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 l7 g0 Y: J5 y% w9 s5 l
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! {1 v( r2 L0 m9 `9 o' p4 y  \
  
$ b0 x* m7 v* G三、关于企业价格策略
9 h/ K' j- d7 K$ \
' K. d0 g* t  q. e7 |( j  ! c2 m/ y& Q  K6 T' }
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , I1 Y& X& z8 I) p" B
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )