AdvancesinPsychology心理学进展,2015,5(10),604-608PublishedOnlineOctober2015inHans.://dx.doi.org/10.12677/ap.2015.510078文章引用:过继成思,朱滢(2015).随机序列生成中赌徒谬误的神经学习机制.心理学进展,5(10),604-608.’sFallacyBiasinRandomSequencesGenerationJichengsiGuo1,YingZhu21DepartmentofPsychology,TsinghuaUniversity,Beijing2DepartmentofPsychology,PekingUniversity,BeijingEmail:zhuy@pku.edu.cnReceived:Sep.28th,2015;accepted:Oct.23rd,2015;published:Oct.27th,2015Copyright©2015byauthorsandHansPublishersInc.ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).’sbiasreferstothepreferenceforalterationpatternswhenpeoplegeneraterandomsequences.Thatis,forexample,whentossingfaircoins,ifonesideappears,peoplewouldprefertoanticipatetheothersidetobemorepossibletoappearnext.Thegambler’sbiasisgenerallythoughttobehumanbrain’smisperceptionofrandomsequenceswhichresultsfromtherepre-sentativenessbias.However,Sunetal.(2015)uncoveredthelatentstructureinrandomsequen-ces,andprovidedaneurallearningmechanismforthegambler’sbiasusingthisstatisticalstruc-ture.Thisfindingnotonlygivesarationalexplanationforthebiasbutalsoprovidesamathemati-caldescriptionforthecognitiveprocessingofuncertaintyandrandomnessinhumanmind.KeywordsRandomSequences,Gambler’sBias,NeuralNetwork,BayesianModel随机序列生成中赌徒谬误的神经学习机制过继成思1,朱滢21清华大学心理学系,北京2北京大学心理学系,北京Email:zhuy@pku.edu.cn过继成思,朱滢605收稿日期:2015年9月28日;录用日期:2015年10月23日;发布日期:2015年10月27日摘要赌徒谬误指人们在产生随机序列时更偏好于使用交替模式,即认为在类似于投无偏硬币事件中,如果出现了硬币某一面,那么接下去则更可能出现另一面,而不是继续出现同一面。赌徒谬误一般被认为是一种人脑对随机序列的错误知觉,是由于“表征偏见”(representativenessbias)引起的。但Sun等(2015)发现即使在一个p=0.5的经典随机过程中,也存在一定的潜在结构(latentstructure)则表明赌徒偏见的神经基础可以通过神经网络模型来解释。这一结果为赌徒谬误偏见提供了一种理性的解释,也为人脑对不确定性和随机性的认知过程提供了一种新的数学描述。关键词随机序列,赌徒谬误,神经网络,贝叶斯模型1.引言赌徒谬误指(gambler’sfallacybias)人们在产生随机序列时使用交替模式(alternationpatterns)超过重复模式(repetitionpatterns)的偏见。赌徒谬误也称蒙特卡洛谬误,这个名称来自赌徒谬误的一个具体事例——1913年在蒙特卡洛赌场的轮盘赌上出现连续26次黑色导致人们在15次重复黑色后过度押注红色的事件。赌徒谬误一般被认为是一种人脑对随机序列(randomsequences)的错误知觉(misperception),是由于“表征偏见”(representativenessbias)引起的。Sun等(2015)的文章“Latentstructureinrandomsequencesdrivesneurallearningtowardarationalbias”主要关注点是赌徒谬误偏见,研究了人脑对不确定性和随机性的认知。但Sun等(2015)则表明赌徒偏见的神经基础可以通过神经网络模型来解释。并且这一神经模型能够产生一个最优参数,来最优拟合对生成随机序列的行为进行描述的一种贝叶斯模型。对于投无偏硬币这一经典随机事件,一般人们会认为这之中没有复杂的统计结构(statisticalstructure),这是因为只考虑了投一次硬币这一事件中p=0.5的结果(无论是H面还是T面)出现概率。但对于随机序列(即连续投多次硬币的情况),这只是其中一部分故事,即遇到一个结果的平均时间(themeantimesta-tistics,相当于frequency)。而第一次遇到某种结果组合的等待时间(thewaitingtimestatistics,正比于varianceofmeantime)则是另一个值得注意的统计量。举例来说,即使出现H和出现T的概率一样,首次遇到重复组合(HH或TT)的等待时间会大于首次遇到交替组合(HT或TH)的等待时间,其期望分别为6次和4次。从另一个角度来说,重复组合出现时总是一次出现多个(comeinbursts,例如序列HHH包含了2个重复组合HH),但两次出现之间的间隔更大。如Sun等(2015)的图1(a),如果pA(probabilityofalteration,出现交替组合的概率)=1/2,那么离开当前一状态后再次出现重复组合的最短路径(如HHHTTHHH)比再次出现交替组合的最短路径长(如HTTHHT)。Sun等(2015)图1(b)则描述了pA和再次出现某一状态的次数之间的关系:如果重复组合和交替组合的平均时间一样,则pA=1/2到达平衡态;如果重复组合和交替组合的等待时间之和一样,则pA=1/3到达平衡态;如果重复组合和交替组合的平均时间和等待时间一样,则pA=3/7达到平衡态。因此,从等待的角度讲,即使在一个p=0.5的经典随机过程中,也存在一定的潜在结构(latentstructure):重复组合(HH或TT)的等待时间大于交替组合(HT或TH)的等待时间,与赌徒谬误偏见印合。过继成思,朱滢606(a)(b)Figure1.Timeofpatternsdescribedbytheprobabilityofalternationbetweenconsecutivetrials(pA)图1.重复和交替组合的生成路径,以及重复和交替组合出现时间随交替组合出现概率(pA)的变化(来自Sunetal.(2015))2.时间整合的神经网络模型基于随机序列中的统计结构,Sun等(2015)提出了解释人类生成投多次硬币这样的随机序列时得神经网络模型。他们的神经网络模型包含两层,一层是记录H和T序列的感觉输入层(sensoryinputlayer),第二层是编码感觉输入并整合对下一次序列做出预测的内部预测层(如图2(a))。这种神经网络的结构类似于新皮层神经元的整合时间信息的结构特征(如layer5b和layer6)。Sun等(2015)这一模型的最主要假设是脑皮层对于产生随机序列的过程同时对平均时间和等待时间这两个特性敏感。这一假设使得这一模型产生的预测会基于对神经网络式学习并且对输入序列的统计结果具有充分的敏感。这些特性使得模型中的参数不是随机拟合的产物,而是在产生随机序列的行为中有着重要意义的参数。他们的模型在不同的pA条件下进行了每一条件10,000次投硬币事件的训练,这些训练以重建序列的准确性为指标,并在训练后进行1000次测试。经过这样的训练和测试,得到长度为2的重复组合辨识器(repetitiondetectors)或交替组合辨识器(alterationdetectors)通过神经网络模型中重复组合辨识器的数目,可以得到预测的重复组合出现的次数(R),同样的,通过交替组合辨识器的数目可以得到预测的交替组合出现的次数(A)。在Sun等(2015)的模型中,如果pA=1/2(即无偏硬币),那么模型产生的R/A比(预测重复组合/预测的交替组合)为0.70。这一结果是令人惊奇的,因为在一个无偏硬币随机序列中,重复组合和交替组合出现的期望数次应该是一样的,换句话说,R/A比应是1。模型R/A比小于1说明模型学到了其它关系而使重复组合辨识器比交替组合辨识器少。从R/A比=0.7进而可以计算得到主观感受的交替组合出现概率11ARpRARA′==++(公式1)=0.59。而实证研究中发现在这种情况下的主观感受概率在0.58~0.63之间(Falk&Konold,1997),与这一概率接近。Sun等(2015)在总结pA和R/A比的关系后得到图2(b),并且发现这一关系是一条光滑的曲线,而在pA=3/7时,R/A比达到1的平衡态。回顾图1(b)可知,pA=3/7达到平衡态说明产生随机序列的过程受到平均时间和等待时间之和的影响,这也说明Sun等(2015)的神经网络模型中产生随机序列的行为(即R/A比)受到平均时间和等待时间之和的影响,并且这种影响可以用[][]2**AARRETETRAETET+≈+(公式2)描述。过继成思,朱滢607(a)(b)Figure2.Neuralmodeloftemporalintegrationtocapturethestatisticsofpatterntimesinrandomsequences图2.基于时间整合的神经网络模型,以及模型受随机序列中交替组合出现概率的影响(来自Sunetal.(2015))3.随机序列生成的贝叶斯模型要说明神经模型与生成随机序列的人类行为的联系,就需要先介绍一个下研究生成随机序列的行为的贝叶斯模型。Griffiths和Tenenbaum(2001)使用了贝叶斯模型()11ekkLPRHλ−==+(公式5)来对“Zenith比例实验”(Goodfellow,1938)的数据进行拟合。“Zenith比例实验”共有20,099人参加,参与者要求依次生成5个二进制标记的随机序列。Griffiths和Tenenbaum(2001)的贝叶斯模型对16个可能序列中的15个都有着较好的拟合(图3(a)),但是对于序列HTHTH却出现了高估。Sun等(2015)认为这是因为HTHTH看似为交替组合,其实有高阶的重复组合的成分(即HT交替组合出现重复),因此他们在Griffiths和Tenenbaum(2001)的模型基础上加入kM项1log1TkHOMO+=+(公式6),得到新的贝叶斯行为学模型()11ekkkLMPRHλ−==+(公式7)。更重要的是,无论公式5还是公式7都需要一个参数λ来拟合数据。从图3