- 积分
- 138
- 注册时间
- 2009-12-14
- 最后登录
- 2010-1-15
- 在线时间
- 4 小时
TA的每日心情 | 擦汗 2010-1-29 19:36 |
---|
签到天数: 1 天 [LV.1]初来乍到
少年侦探团
出其不意的怪盗
- 积分
- 138
- UID
- 36
- 元宝
- 177 个
- 金币
- 172 枚
- 热度
- 23 ℃
- 魅力
- 0 点
- 贡献值
- -2 点
- 玫瑰
- 0 朵
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册关闭
×
博弈之我见
这节课我们先来做一个智力测验:海盗分珠宝。
有五个海盗抢得100颗价值连城的珠宝,这100颗珠宝完全相同。那么现在就要分脏了(海盗不会按我们常规的分法,每个人都想分得最多),于是有人提出一个方法,大家都同意了,这个方法是:抽签将五个海盗排成1,2,3,4,5号,由1号海盗开始,让他来提出一个分配方案,决定每个人该分多少,然后所有海盗(包括他自己)一起进行举手投票,如果有50%以上(包括50%)的海盗同意,那么就按他的分配方案来,但如果没有达到这个标准,那他将被扔进海里喂鲨鱼,而后由2号来提方案,以此类推,直到只剩5号海盗为止。
条件:
1.每个海盗只想获得最大利益。
2.所有海盗都是非常理智的
这就是一个博弈问题,大家可以想想,如果你是海盗,你希望是第几个海盗?如果你是第一个海盗,你怎么分这100颗珠宝?
下边的问题有点枯燥,我来讲一下博弈的概念,如果没兴趣的,可以动笔分析解答海盗问题。
一、博弈的概念
博弈简单的看,弈,就是下棋的意思,博弈,就是很多人下棋的意思。像象棋、五子棋、扑克等等都是最直接的博弈。
博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。
博弈存在于我们生活的方方面面,从我们早上起床穿哪件衣服,吃什么早饭,老师讲课,我是听还是聊天....这些都是博弈
再像2000多年前,《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著,2000年后,毛泽东提出的“人不犯我,我不犯人;人若犯我,我必犯人”也是一种博弈。
现在给大家5分钟时间思考一下海盗问题......答案是 98 0 1 0 1
现在我们再来看一个例子:让10000个人从1-100里选择一个数,最后选择离大家的平均值的一半最接近的就获胜。
通常认为,人数够多,选择的数字就分散,所以最后的平均数应该接近50,所以我选25=50/2应该获胜把握大。
但我再想,我知道这个其他人也知道这个,所以假定他们也都选25,那我就该选12.5=25/2。
同样道理,别人也会想到这点,如此不断,最后大家都选1。没有获胜者。
二、博弈的种类
1、博弈可以分为动态博弈和静态博弈。
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。像前边讲的平均值问题。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。像前边讲的海盗问题。
三、我们为什么学习博弈
我们说过任何一个人做的任何一件事多多少少都有博弈的因素在里边。
诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:
要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。
也可以这样说,要想赢得物流管理,不可不学博弈论;要想赢得生活,同样不可不学博弈论,甚至你的感情也与博弈有关。
理论的不讲了,我们现在就通过几个例子来学习博弈:
1、经济学中的“智猪博弈”(Pigs’payoffs)
这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
2、囚徒困境博弈
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
分析:略,A通过分析可得,无论B如何选择,自己选择坦白都是明智的,同理可得A也是选择坦白,而我们知道最优方案应该是都抵赖。
这就是个人利益最大并不能实现整体的利益最大化,这个问题最先被纳什发现,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。
《美丽心灵》就是讲纳什的
如果他们4个全部去追那漂亮女生,那她一定会摆足架子,谁也不搭理;这时再去追其他女孩子,别人也不会接受,因为没人愿意当次品。”突然,纳什自言自语道,“但是,如果他们4个先追其他女生,那漂亮女生就会感到被孤立,这时再追她就简单得多。
《老友记》
瑞秋和罗斯爱情坦白博弈
当然电视剧追求完美结果,现实中如何处理爱情博弈。
从“囚徒困境”这个典型博弈问题,我们可以深刻体会到企业实施“供应链管理”的必要性。(略)
2
|
|