信息级联(informationcascades)(基于第16章)“随大流”(从众、跟风)•常见的社会心理现象–产品的选择,委员会的抉择,政治观念的采纳•为什么会随大流?–(1)直接获益,(2)好奇(信息)•感性的还是理性的?–信息(私有信息,群体行为背后的信息)、推理与结果•依据信号的决策vs依据结果的决策一个群体实验•注意,每个人只公开宣布自己的判断,不告诉他看到的颜色(即不揭示自己的私有“信号”)。•判断对了有奖,错了受罚。•两个坛子,以p=0.5的概率拿出一个来进行实验•参与人(1,2,3,…,N)顺序来到跟前,随机摸出一个球看看,然后大声宣布他认为坛子是“蓝多”还是“红多”•放回小球,离开假若你是第3个人,摸到了红球,但前面听到的是:蓝多、蓝多,你会(应该)宣布什么?关于概率的一些基础知识•正方形(X),边长1•其中圆形A的直径0.5,B的直径0.3•随机投针(设每次都会落在正方形中)•问:投针落在圆形A中的概率是多少?•问:第一次落在A中,第二次落在B中的概率是多少?APr[A]=3.14×0.252/12»0.196Pr[A,B]=Pr[A]×Pr[B]=3.14×0.252×3.14×0.152»0.0044XB关于概率的一些基础知识•正方形(X),边长1•其中的圆形(A),直径0.5•随机投针(不一定都落在正方形中)•投针落在圆形A中的概率是多少?•说不清楚!那要看有多少落在了X中?AXPr[A|X]=3.14×0.252/12»0.196Pr[A]=Pr[X]×Pr[A|X]Pr[A]»0.196×Pr[X]关于条件概率的另一个视角APr[A|X]=Pr[A]Pr[X]=3.14*0.252/total12/total=3.14*0.252/12»0.196X一般地,Pr[A]?全概率公式X2X1X3X4X5APr[A]=Pr[X1]×Pr[A|X1]+Pr[X2]×Pr[A|X2]+Pr[X3]×Pr[A|X3]+Pr[X4]×Pr[A|X4]+Pr[X5]×Pr[A|X5]关于条件概率的一些基础知识•还是随机投针,对于落在B中的那些,同时也落在A中的概率是多少?APr[A|B]=?Pr[B|A]=?XBAÇB用表示A和B的相交部分对称地,贝叶斯公式(规则)Pr[A|B]=Pr[AÇB]Pr[B],Pr[B|A]=Pr[AÇB]Pr[A]Pr[A|B]×Pr[B]=Pr[B|A]×Pr[A]Pr[A|B]=Pr[B|A]×Pr[A]Pr[B]=Pr[B|A]×Pr[A]Pr[B|A]×Pr[A]+Pr[B|A]Pr[A]贝叶斯规则的简单应用例•设一个城市,出租车的颜色有两种,其中黑色占80%,黄色占20%。•出现了一个交通事故,肇事出租车逃离,现场目击者说是“黄色”,但他可能看错了–假设出错概率0.1(即黑说成黄,或者黄说成黑),–换句话说,黄说成黄或黑说成黑的概率为0.9•问,那辆车真是黄色的可能性(概率)有多大?•判断肇事车的颜色:Pr[是黄色|报告黄色]?–我们有–Pr[报告黄色|是黄色]=目击者正确率=0.9–Pr[是黄色]=城市中黄车的百分比=0.2–于是,分子=0.9*0.2=0.18•分母,Pr[报告黄色]可表为下面两个量之和–Pr[报告黄色|是黄色]*Pr[是黄色]=0.9*0.2=0.18–Pr[报告黄色|是黑色]*Pr[是黑色]=0.1*0.8=0.08•结果:肇事车是黄色的概率为9/13Pr[A|B]=Pr[B|A]*Pr[A]/Pr[B]贝叶斯规则应用:垃圾邮件检测•垃圾邮件,通常按照一定的经验规则进行判断–例如邮件“主题”栏出现特别的字符串(书上用的是“checkthisout”,下面用cto代表)。•但看到“cto”不是简单的给出“是”或“否”,实际上是要算(按贝叶斯规则)Pr[spam|cto]=Pr[cto|spam]*Pr[spam]Pr[cto]=Pr[cto|spam]*Pr[spam]Pr[cto|spam]*Pr[spam]+Pr[cto|notspam]*Pr[notspam]其中涉及的量可以从邮件系统运行经验数据中得出回到开始的实验,你要考虑的问题是•工具--贝叶斯公式Pr[A|B]=Pr[B|A]×Pr[A]Pr[B]=Pr[B|A]×Pr[A]Pr[B|A]×Pr[A]+Pr[B|A]×Pr[A]Pr[maj-blue|giveninformation]0.5?信息:蓝多、蓝多、红球•第一个人为什么报“蓝多”?他一定是抓到了一个蓝球。因为他会如下判断:Pr[B|b]=Pr[b|B]×Pr[B]Pr[b]=Pr[b|B]×Pr[B]Pr[b|B]×Pr[B]+Pr[b|R]×Pr[R]=(2/3)(1/2)(2/3)(1/2)+(1/3)(1/2)=23Pr[B|r]=Pr[r|B]×Pr[B]Pr[r]=Pr[r|B]×Pr[B]Pr[r|B]×Pr[B]+Pr[r|R]×Pr[R]=(1/3)(1/2)(1/3)(1/2)+(2/3)(1/2)=13信息:蓝多、蓝多、红球•第二个人为什么报“蓝多”?他一定也是抓到了一个蓝球。因为他除了会反推出第一个人拿了个蓝球,还会做如下计算:Pr[B|b,b]=Pr[b,b|B]×Pr[B]Pr[b,b]=Pr[b,b|B]×Pr[B]Pr[b,b|B]×Pr[B]+Pr[b,b|R]×Pr[R]=(2/3)(2/3)(1/2)(2/3)(2/3)(1/2)+(1/3)(1/3)(1/2)=45注意,我们也需要看Pr[R|b,r],得到的结果是0.5,在那种两可情况下,合理假设他会选择自己的信号,即R。但他选择了B,因此抓到的不可能是红球。信息:蓝多、蓝多、红球•轮到你了!抓的是红球,坛子为“红多”的概率是多少?Pr[R|b,b,r]=Pr[b,b,r|R]×Pr[R]Pr[b,b,r]=Pr[b,b,r|R]×Pr[R]Pr[b,b,r|R]×Pr[R]+Pr[b,b,r|B]×Pr[B]=(1/3)(1/3)(2/3)(1/2)(1/3)(1/3)(2/3)(1/2)+(2/3)(2/3)(1/3)(1/2)=13•这说明,即使你抓了红球,但坛子为“红多”的概率小于0.5,因此应该忽略自己得到的信号,理性地选择随大流--宣布“蓝多”!信息:蓝多、蓝多、蓝多、红球•现在看第四个人,假设她也摸到红球,但她已经不能推断出第三个人抓的什么球,只会做如下计算:Pr[B|b,b,*,r]=Pr[b,b,*,r|B]×Pr[B]Pr[b,b,*,r]=Pr[b,b,*,r|B]×Pr[B]Pr[b,b,*,r|B]×Pr[B]+Pr[b,b,*,r|R]×Pr[R]=Pr[b,b,*,r|B]Pr[b,b,*,r|B]+Pr[b,b,*,r|R]=Pr[b,b,r|B]Pr[b,b,r|B]+Pr[b,b,r|R]=(2/3)(2/3)(1/3)(1/2)(2/3)(2/3)(1/3)(1/2)+(1/3)(1/3)(2/3)(1/2)=23这说明她也应该忽略自己抓的红球,跟着喊“蓝多”!类似地,后面所有人的理性选择都是随大流了,无论拿到什么球。也就是说,从第三个人之后•人们听到了(B,B,B,…),能分析得知前面两个人对应拿的是蓝色的球,但不知道你当时拿的是什么颜色的球–如果你拿的是蓝色球,计算结果当然更会显示不可能是“红多”了•这样,每个人面对的都是和你一样的情形,于是只能和你一样--无论拿到的是什么颜色的球,都宣布“蓝多”级联形成尽管也都知道这判断可能一开始就是错的!也知道拿到红球的人实际上可能要比拿到蓝球的多!三人成虎级联开始的条件抓到的红球个数与蓝球个数之差信息级联现象•信号:b,b,r,r,b,r,r,r,b,r,…•判断:B,B,B,B,B,B,B,B,B,B,…•信号:b,r,b,r,r,b,b,r,b•判断:B,R,B,R,R,B,B,R,B•信号:b,r,b,r,r,r,b,b,…•判断:B,R,B,R,R,R,R,R,…信息级联现象的一种通用模型•事物以两种状态之一随机出现,好(G)状态与差(B)状态,概率分别为p和1-p•基于某种随机“探测”,得到关于事物状态的两种信号之一,高(H)信号与低(L)信号–信号的概率取决于状态:如果G状态,则H信号出现的概率大,否则L信号出现的概率大。假设两种情况的较大概率相等,记作q(这样,对应较低概率就是1-q)•任务:根据已知信息,判断事物处于什么状态Pr[G|knowninformation]p在人们依次做判断的设定下,已知信息可以是先前人们的信号或者判断(后者使问题变得有意思起来)。则判断状态为G模型上的推理(Bayes)•Pr[G|s1,s2,…,sN]=p?–结论,若S=(s1,s2,…,sN)中H的个数多于L的个数,则“”;相等则“=”,少于则“”•Pr[G|r1,r2,…,rN]=p?•Pr[G|r1,r2,…,rN]=Pr[G|s1,s2,…,sk,*,…*,sN]=Pr[G|s1,s2,…,sk,sN]为什么有第一个等号?理性假设+推理为什么有第二个等号?概率分析结果Pr[G|s1,s2,...,sn]=Pr[s1,s2,...,sn|G]×Pr[G]Pr[s1,s2,...,sn]=Pr[s1,s2,...,sn|G]×pPr[s1,s2,...,sn|G]×Pr[G]+Pr[s1,s2,...,sn|B]×Pr[B]=Pr[s1|G]×Pr[s2|G]×...×Pr[sn|G]×pPr[s1,s2,...,sn|G]×p+Pr[s1,s2,...,sn|B]×(1-p)=qn1(1-q)n2pqn1(1-q)n2p+(1-q)n1qn2(1-p)=pp+1-qqæèçöø÷n1q1-qæèçöø÷n2(1-p)=pp+1-qqæèçöø÷n1-n2(1-p)令:n=n1+n2,对应高低信号个数由模型假设,有q1-q讨论n1和n2的相对大小模型上的推理(Bayes)•Pr[G|s1,s2,…,sN]=p?–结论,若S=(s1,s2,…,sN)中H的个数多于L的个数,则“”;相等则“=”,少于则“”•Pr[G|r1,r2,…,rN]=p?•Pr[G|r1,r2,…,rN]=Pr[G|s1,s2,…,sk,*,…*,sN]=Pr[G|s1,s2,…,sk,sN]为什么有第一个等号?理性假设+推理为什么有第二个等号?概率分析结果k=?k的性质:满足s1~sk中H和L个数之差为2的最小数N∞,产生级联的概率1•洞察:在依次判断过程中,一旦有相继的三个人都拿到同样的信号,级联一定就开始了•于是,证明如下就够了:对N个信号的序列,当N足够大时,存在连续3个相同信号的概率为1。•事实上,考虑将N个信号的序列按每3个分一组,其中任何一组的3个信号相同的概率是q3+(1-q)3,于是没有任何一组的3个信号相同的概率就是(1-q3-(1-q)3)N/3,随N增大趋向0。关于信息级联的认识•级联可能是错误的(虚假的“火”)•基于很少的信息,级联也可能开始(级联效应,连锁反应--“多米诺骨牌效应”)•级联是脆弱的,中间信息的微小扰动就可能终止甚至改变级联方向•级联现象与“群体智慧”不矛盾•级联现象的防止和利用–独立决策与商讨决策的平衡–新产品的推广,虚假火爆的终止作业:练习16.1我们考虑一种特殊情况,即如果每个人只能看到他的近邻而不是先前所有人的选择行为,是否可能发生一个信息级联。这里,保留16章对信息级联的所有设置,唯一不同的是,当i选择时,只能观察到自己的信号以及i-1的选择行为。a)简要解释在这种条件下,为什么1号和2号个体的决策行为性质不变?b)3号个体能观察到2号的选择行为,但观察不到1号的选择,3号从2号的选择中能够获得什么信息?c)3号个体可以从2号的选择中推断出1号的信号吗?为什么?d)如果3号个体得到一个高信号,并且知道2号选择接受,会怎样选择?如果3号得到一个低信号,且知道2号选择了接受,会怎样选择?