心理科学进展2008,16(6):892~898AdvancesinPsychologicalScience892二级强化程序在药物成瘾研究中的应用*张静李新旺马兰花(首都师范大学心理系,北京100048)摘要二级强化程序是一种以物质的强化效应为基础,评价药物的精神依赖性潜力的方法,将其应用到自身给药实验中,即为二级强化自身给药模型。在这个模型中,动物在条件性刺激的影响下按压杠杆以寻求药物的行为反映了其对成瘾性药物的渴求。使用二级强化程序,人们发现:条件性刺激既能够影响觅药行为的获得和保持,也能够影响这种行为的消退;伏隔核的核区、杏仁核基底外侧部和内侧前额皮层等部位在药物相关的条件性刺激诱导动物产生觅药行为的过程中起重要作用。二级强化程序的应用为开发治疗药物成瘾的物质提供了一条新思路。关键词二级强化程序;药物成瘾;条件性刺激;觅药分类号B8451引言二级强化程序(second-orderschedules)是一种以物质的强化效应为基础,评价物质的精神依赖性潜力的方法,具体表现为:实验动物对一种程序(如短暂呈现的灯光等简单刺激)做出按压杠杆的反应,而这种反应又会受到另一种刺激(如食物)的强化。灯光由于经常伴随一级强化物而出现,成为二级强化物。与一级强化物一样,二级强化物也可以维持动物的觅食行为。自身给药(self-administration,SA)动物模型利用药物的正性强化作用(positivereinforcement),通过一定的条件控制(如只有按压规定次数的杠杆才能得到奖赏药物),使动物将特定的操作行为与奖赏(如按压杠杆行为与药物引起的欣快感)联系起来,从而模拟人类的药物滥用行为,直接考查药物的强化效应。二级强化程序应用到以成瘾性药物为一级强化物的自身给药实验中,即称为二级强化自身给药模型(second-orderscheduleofdrugself-administration),该模型具有其它动物模型不可比拟的优点:与食物等自然强化物相比较,成瘾性药物作为强化物对机体的影响更加复杂,它不仅具有强化效应,还具有直接药理效应(如给予动物安非他明等精神兴奋剂会带来精神运收稿日期:2007-12-03*北京市教委科技发展计划项目(KM200710028021)资助。通讯作者:李新旺,E-mail:pro_xwli@yahoo.com.cn动效应,对于阿片类药物来说,低剂量给药具有刺激机体运动的效应,而高剂量给药则有镇定作用,使动物的运动反应次数减少)。由于这种直接药理效应会影响动物的运动机能,所以只有在排除药物的药理作用的前提下,人们才能正确判断实验动物行为的变化是由药物的强化效应、而不是其毒性作用所引发的[1,2]。在二级强化自身给药模型中,动物是对二级强化物(即条件性刺激)而非药物本身进行反应,所以可以排除药物的直接药理效应影响,研究自身给药过程中药物的强化效应。由此也可以看出,该模型突出条件性刺激(另有文献称环境刺激)对维持实验动物在自身给药过程中的行为反应的重要影响,更加贴切地模拟了人类药物滥用过程中药物相关的环境线索引发成瘾者对药物的强烈渴求、进而产生复吸的现象。本文主要介绍二级强化程序的含义、二级强化自身给药模型在药物成瘾研究中的应用及其临床治疗方面的意义。2二级强化程序二级强化程序来源于Skinner的操作性条件作用理论。该理论认为:人类行为主要是由操作性反射构成的,而强化对这种操作性行为的获得起重要作用。具体表现为:如果一个操作发生后接着给予一个强化刺激,那么随后发生的该操作的强度就会增加[3]。强化物分为两类:一级强化物和二级强化物。一级强化物指满足有机体的基本生理需要的物质,第16卷第6期二级强化程序在药物成瘾研究中的应用-893-如食物、水等。中性刺激由于与一级强化物反复联合,会获得强化性质,成为二级强化物。强化程序指强化的时间和频率安排,即在什么时候、以何种频度对一种行为反应施加强化,它决定强化因子与行为反应间的数量关系及时间关系。基本的强化程序分为间隔程序(intervalschedule)和比率程序(ratioschedule)两种。间隔程序反映动物按压杠杆行为与获得强化药物的时间延迟关系,又可以分为固定间隔(fixedinterval,FI)、可变间隔(variableinterval,VI)和累进间隔(progressiveinterval,PI)三种。FI指在规定的间隔期内的反应不能得到奖赏,直至间隔期满时给予奖赏(如FI10min指动物在某一时间点之后10min内的按压开关行为不能得到奖赏,直到10min间隔期满之后的按压杠杆行为才能获得奖赏);VI指间隔期的长短是可变的;PI的每次间隔期按倍数或指数关系递增。比率程序则反映动物按压杠杆行为与获得强化药物的数量关系,又可以分为固定比率(fixedratio,FR)、可变比率(variableratio,VR)和累进比率(progressiveratio,PR)三种。FR指完成固定次数的操作即可获得强化(如FR10指动物每按压开关10次,可获得奖赏1次);VR指获得每次奖赏所需的操作次数都不同(如VR5指获得1次奖赏平均需要按压开关5次);PR指获得每次奖赏所需的操作次数按倍数或指数关系递增(如设定初始值为1,累进率为2,则获得每次奖赏所需的按压开关数依次为:1,2,4,8,16,…,2n-1)。间隔程序和比率程序中,动物获得强化物(如食物、精神活性药物)的条件相对较简单,但人类药物滥用的情况则要复杂得多。昀显著的区别是吸毒者往往是通过一系列与环境密切相关的复杂行为过程才得到一次药物[4]。二级强化程序在基本强化程序的基础上引入了条件性刺激(conditionedstimuli,CS)作为二级强化物,以维持实验动物较高的行为,动物需要在较长时间内获得多次甚至仅仅一次药物强化。二级强化程序是间隔程序和比率程序的两两组合,而昀为常用的是FI和FR的组合,其中一个子程序(unitschedule)FR(或FI)是另一个程序FI(或FR)中的一次操作,在完成第一个程序后再按第二个程序的要求进行,第二个程序全部完成后给予强化物。程序的基本构成有:FI(FR:S)、FR(FI:S)、FI(FI:S)、FR(FR:S)四种,其中S表示条件性刺激,FI表示固定间隔,FR表示固定比率,括号内的内容表示子程序。举例来说,在程序FI30-min(FR10:S)中,子程序是FR10,即实验动物每按压10次杠杆呈现一次S(如灯光),30min后,呈现S的同时给予强化物。3二级强化自身给药模型二级强化程序昀初被广泛用于自然强化物(如食物、水)的操作性模型研究中,并重点考察CS在模型中的作用。通过条件反射,灯光等简单刺激获得了二级强化效应成为CS。与一级强化物(食物)一样,CS也可以维持动物的觅食行为。当CS被撤消或被其他刺激代替时,实验动物的行为反应次数会发生变化。20世纪70年代,二级强化程序逐渐被用于药物滥用研究中,原来作为一级强化物的食物被具有精神活性的药物所取代,从而建立起二级强化自身给药模型。在二级强化自身给药模型中,使用昀多的给药方式是静脉给药。静脉给药的具体方法是:给实验动物实施静脉埋管手术,将导管插入颈静脉或股静脉,使药物通过插入静脉的导管进入动物的循环系统。静脉给药方式较好地模拟了人类成瘾者使用吗啡(主要是静脉注射)等阿片类药物的方式,其给药量准确,容易控制,起效迅速。但是这种埋管技术也存在着自身的弊端:动物实验的持续时间较长,而插入静脉的导管长期留在体内容易堵塞、脱落。基于这个原因,早期的二级强化自身给药模型多用于灵长类动物。20世纪90年代以来,由于实验设备和技术的更新,运用大鼠等啮齿类动物的实验逐渐多了起来。对精神药物产生依赖的人或动物在再次得到药物之前的特定行为反应称为觅药(drugseeking)行为,以区分给药后的用药(drugtaking)行为[5]。由于药物的直接药理效应的影响,在FR、FI等简单程序中,动物的反应大都发生在给药后的一段时间,即大多是用药行为。而在二级强化自身给药模型中,人们可以操控实验程序以观察动物获得药物前发生的较长序列的行为反应,即觅药行为,从而排除药物对实验动物行为的直接药理影响,研究其强化效应。在具体的实验过程中,通常采用两种方法排除药物的直接药理效应:一是延长两次给药之间的时间间隔,典型的做法是实验期间每天只给一次药,这样两次给药之间的时间间隔是24h,药物在体内得到比较充分的代谢,从而避免一次给药对下次程序的行为反应造成影响[1]。另一种方法是先采用简单-894-心理科学进展2008年程序,训练动物将按压杠杆的行为与预示药物出现的CS联系起来,也就是获得条件反射性的成瘾行为,然后进入正式实验。正式实验共包括两个二级强化程序[如进行两次FI5min(FR10:S)程序],实验动物完成第一个二级强化程序后得到一次药物,之后,进行第二个二级强化程序。由于正式实验的第一个程序中动物按压杠杆的行为发生在药物奖赏之前,是由先前简单程序训练时药物的强化作用引发的,即动物此时按压杠杆的行为反映了先前按压杠杆所获得的药物的强化效应,因而其按压杠杆的次数可以作为前测数据。第二个程序发生在给药后,动物的行为会受到药物的直接药理效应的影响,其按压杠杆的次数可以作为后测数据。这样,前后测数据之差即代表了药物的直接药理效应[2]。很多实验已经证实药物相关的环境刺激对人类药物成瘾行为的保持和复吸起重要作用,而建立动物模型的目的主要是考察模型中动物的行为反应,并据此模拟人类在相似情境下的行为。二级强化自身给药模型的运用,使人们可以研究药物相关环境刺激在觅药行为的获得、保持和消退后的恢复中所起作用的特点。3.1条件性刺激对二级强化自身给药模型中行为的获得的影响模型建立之初,先要训练动物学会将按压杠杆的行为与CS的出现联系起来。具体方法是:运用FI等简单程序,实验动物在固定时间间隔后获得适当剂量的药物同时伴随灯光等CS的呈现。数次训练后,动物形成稳定的反应次数,并且在程序的开始阶段,动物按压杠杆的次数较少,而在每次CS出现前动物按压杠杆的次数显著增加。表明动物将按压杠杆的行为与CS的呈现联系起来,训练阶段即完成。早期的研究表明CS对二级强化模型中的行为获得起重要作用。研究者用FI10min程序训练恒河猴,每间隔10min给予动物一次伴随灯光出现的30μg/kg的可卡因注射,动物形成稳定的反应次数时,训练阶段即完成。他将动物分为三组,一组自始至终使用简单程序FI10min。另外两组都先采用二级强化程序FI10min(FR10:S)——动物每按压10次杠杆就会得到一次持续2s的灯光刺激,10min后给予一次药物注射。四次给药后,子程序改为FR3,即程序变为FI10min(FR3:S),此程序进行5次。然后第二组继续维持程序FI10min(FR3:S),而第三组沿用原来的程序FI10min(FR10:S)[6]。实验结果表明,两个二级强化程序组的反应次数远大于简单程序组。对这两种程序进行比较,它们都是间隔10min给药一次,不同的是二级强化程序组增加了CS。这说明与简单程序相比,二级强化程序中动物觅药行为的获得更易受CS的影响,从而表现出更多次数的按压杠杆行为。3.2条件性刺激对二级强化自身给药模型中行为的保持的影响二级强化自身给药模型中,对于按压杠杆这种行为反应的保持的研究也集中在CS上。行为反应的保持主要通过反应次数的保持来衡量。举例来说,二级强化程序FI15min(FR10:S)的每次给药期内,动物每按压10次杠杆呈现一次灯光。一开始动物的反应次数很少,但随着灯光的逐次呈现动物的反应次数逐渐增加,尤其是动物预期灯光即将到来时反应次数达到峰值。以时间为横坐标、反应次数为纵坐标作线性图来表示反应次数随时间发生变化的趋势,可以看到每次给药期间(15min),反应次数的变化呈现为逐渐升高的扇形。图1二级强化程序FI15min(FR10:S)的一次给药期内,动物的反应次数随时间变化的趋势图。每条斜线处表示动物完成一次子程序FR10后得