总第250期2014年第9期收稿日期:2014-03-24收修改稿日期:2014-04-23*本文系国家大学生创新性实验计划(A类)基金项目“在线商品虚假评论识别及其治理研究”(项目编号:220-20111201316)的研究成果之一。XIANDAITUSHUQINGBAOJISHU81基于评论产品属性情感倾向评估的虚假评论识别研究*陈燕方1,2李志宇1,2,31(华中师范大学信息管理学院武汉430079)2(华中师范大学湖北省电子商务研究中心武汉430079)3(中国人民大学信息学院北京100872)摘要:【目的】提出一种基于评论产品属性情感倾向评估模型(ReviewAttributeofProduct-BasedEmotionEvaluate,RAPBEE模型),用于在线商品虚假评论的识别。【方法】针对在线商品虚假评论采用评论产品属性情感倾向离群度量方法,结合已有评论效用研究对评论结果进行综合排序,从而得出评论的可信度序列。【结果】基于R语言实现,在模型试验集上,通过RAPBEE模型识别处理后的评论序列和当前商品真实情况的符合度为86.2%,实验结果表明RAPBEE模型有较强的实际应用能力与适应度。【局限】需要依赖于已有属性词典的建模方式,在大规模的数据运行效率上有待改进。【结论】提供一种新的针对中文商品虚假评论识别处理方法,具有较强的扩展能力。关键词:情感倾向虚假评论垃圾评论商品评论虚假评论识别分类号:TP391随着现代电子商务的高速发展,在线商品评论已经成为消费者进行网络购物决策的重要参考依据之一,同时也能够为商家进行服务或商品的改进提供良好的指导依据[1]。近年来,国内外关于在线商品评论的研究重点逐步由观点挖掘转向虚假评论的识别(ReviewSpamDetection)。其中,国外较为具有代表性的研究是Jindal等[1-4]的系列文章,这也使得虚假评论成为社会计算方向下有关情感分析和观点挖掘的重要研究热点之一。相对来说,国内有关这方面的研究起步较晚,且研究内容相对国外而言缺乏新颖性和实质性的进步[5]。本文首先对在线商品评论的分类进行重新界定,并就在线商品“虚假评论”与“垃圾评论”的区别进行了辨析,然后针对现有虚假评论识别方案存在的问题,提出了基于评论产品属性情感倾向评估方案(ReviewAttributeofProduct-BasedEmotionEvaluate,RAPBEE)的逻辑模型,并分析了模型实现的两个主要算法及其特点,进而采用R语言实现。本文的主要贡献包括:(1)提出利用产品评论属性情感倾向的离群度对在线商品可信度进行排序的方法,以此达到对虚假评论进行有效处理的目的,为虚假评论的识别提供了一个新的可行方案。(2)解决了当前中文虚假评论识别存在的问题,并取得了良好的实验效果,为社会计算方向下——观点挖掘与情感分析的扩展提供了一定的思路。(3)基于R语言实现,并公开了全部的词典和数据,为后续研究增加了可行的实验方案和材料。82情报分析与研究1背景知识及相关工作1.1在线商品评论和在线商品虚假评论在线下市场,消费者购买商品时的决策依据在很大程度上依赖于现实生活中相互之间的产品口碑传播。随着互联网应用的高速发展,在线商品评论开始产生,传统口碑开始向电子口碑过渡,在线商品评论信息已成为消费者进行网络购物决策时的重要参考依据之一。伴随着在线商品评论的丰富化和多样化,在线商品虚假评论开始逐步进入人们的视野。在线商品虚假评论至今并没有一个独立统一的定义,由于目前对在线商品虚假评论的研究多等同于“垃圾评论”的研究,因而大部分学者采用Jindal等[3]提出的对“垃圾评论”的定义和分类,即“垃圾评论”分为虚假评论(UntruthfulOpinion)、无关评论(ReviewsonBrandsOnly)以及非评论信息(Non-reviews)三种类别。孟美任等[6]将“虚”和“假”分开定义,其中“虚”是指滥发却没有任何价值的评论信息,事实上这里的“虚”即指Jindal等定义中的第二和第三类垃圾评论。而笔者认为,国内学者在对Jindal等文章中关于“ReviewSpam”一词的引用存在误解,即将它释义为“垃圾评论”是有偏差的。国内学者在引用“垃圾”一词时,多源自“垃圾邮件、垃圾链接”之类的计算机专业术语。但从本义上来讲,这里的“ReviewSpam”则应被称为“虚假评论”。在Jindal等的研究网站[7]中,关于“ReviewSpam”列出了三个等价词语:“FakeReview”、“BogusReview”和“DeceptiveReview”,由此可以看出以前国内学者将这类评论定义为“垃圾评论”是存在误解的,如果解释为“垃圾”则更加倾向于“无用”之意,因此笔者将其改称“虚假评论”。然而无论是将虚假评论等同于垃圾评论来研究,或是将“虚”和“假”分开,以上学者对在线商品虚假评论的界定都是从行为主体者动机出发。即虚假评论指那些为达到促销自家商品、提升自身信誉或诋毁竞争者商品的目的而发表的不真实的过高或过低的评论,从而故意误导消费者或是干扰平台意见挖掘系统。这里的行为动机主要来源于商家为提升自身销售量,实现利益最大化。笔者认为,在线商品虚假评论的分类应该从评论最终的作用主体——消费者为起点进行分类,即从评论信息效用的角度进行分类。分类方式如图1所示:图1在线商品评论的分类在线商品评论从评论信息效用的角度可以分为有用和无用评论。有用评论是指能够对消费者的购物决策产生作用(这种作用既可能是正面的促进,也有可能是负面的误导)的评论,而无用则是指类似广告、乱码之类和商品本身无关的信息评论,无用评论信息往往对于消费者而言极易辨别,无法误导其购物决策。在有用评论中,根据其对消费者购物决策的作用类型,将其分为“正面作用”和“负面作用”。正面作用能够辅助消费者做出正确的购买决策,包括促使消费者购买到符合心理预期的产品和阻止消费者购买到掺假虚夸的产品;负面作用评论则是误导消费者进行错误购买决策的相关评论,包括阻止消费者购买到符合心理预期的产品和诱导消费者购买到掺假虚夸的产品。因此在处理模型中,最终目的是将可能的负面作用评论识别出来,即进行可信度排序。1.2在线商品虚假评论的识别模型在已有的研究中,在线商品虚假评论识别主要从三个方面展开:(1)元数据特征:包括评论者元数据(评论者信誉、年龄、方式等)、评论内容元数据(包括评论字数、有用性得票、评论时间等)、产品元数据(包括产品价格、平均得分等)等;(2)文本特征:评论内容的相似度、评论行为(风格)的相似度、评论特征内容(如第一人称、第二人称等)等;(3)情感特征:评论积极、消极词汇比例(数目)、句子的主客观程度等。较为常用的识别模型主要有:总第250期2014年第9期XIANDAITUSHUQINGBAOJISHU83基于元数据特征与虚假评论或评论者的相关性评估模型[4,8-9],基于评论文本特征的相似度检测模型[3,10-11],基于文本特征内容评价模型[12]等。笔者认为,虚假评论的识别应以增加用户对评论内容的体验效用为出发点,展开模型的设计与评价。如众多研究者所述[1,6-7,10]:虚假评论的识别目的是减少虚假评论对消费者的误导,辅助消费者进行正确的决策。那么虚假评论的识别问题和在线商品效用排序的问题应该是紧密联系的。换句话说,评论的可信度越低,则对消费者的效用也就越低。因此,在RAPBEE模型构建的末尾环节,在基于评论可信度排序的基础上,进一步利用评论效用排序算法[13]改善评论质量,从而辅助消费者在可信前提下做出正确的购物决策。模型的实验结果表明,该模型具备较强的适应性和可扩展性以及较高的消费者辅助决策满意度。2基于产品属性情感倾向动态评估模型:RAPBEE模型2.1关键词典定义RAPBEE模型中的关键词典主要包含三个部分:通用属性词典、个性化属性词典、情感倾向词典。定义1:通用属性词典。通用属性词典是指由用于描述商品或者服务的特征词组成的词典,主要包括服务评价、产品评价、指导性评价、整体性评价4个方面。通用属性词典是对产品评论的抽象集合,即消费者有关产品属性的评论内容集中于表1所示的部分,并且具备很强的相关性。该词典总共包含743个通用特征属性词汇,由近100万条来自淘宝、京东、当当网等大型网络购物商城的商品评论通过分词、词频统计后分类筛选而来,具备较强的通用性和代表性,词典中字段及其释义如表1所示:表1通用属性词典字段通用类型词典项目词典代码词项解释服务评价客户服务CSCustomerService,包括售前售后的沟通交流等服务进行评价特征词发货物流服务LSLogisticsService,包括发货、运输、配送等服务的特征词包装服务PSPackagingServices,包括产品包装服务特征词产品评价使用体验CUCustomerUsing,包括用户使用产品和服务后的体验特征词尺寸规格DIDimensions,包括产品尺寸、大小、轻重等规格的特征词产品质量PQProductQuality,包括产品质量、真假、好坏的特征词产品价格PPProductPrice,包括产品性价比的特征词产品描述PDProductDescribe,包括产品与商家描述是否相符的特征词指导性评价对比性评价CRContrastofReview,包括和商家、平台、以前和现在使用感受对比特征词“评论”评价RRReviewothers’Review,包括对其他评论者评论进行评价的特征词推荐与告诫RWRecommendandWarning,推荐与告诫其他买家是否值得购买的特征词整体性评价代买与赠送GFGiftforFriends,该产品非本人使用或代其他人购买的特征词泛指评价GRGeneralReview,泛指性评价,没有针对特定属性进行评价的特征词定义2:个性化属性词典。个性化属性词典是基于特定评论内容以及产品介绍而产生的属性词典。对于特定的商品,个性化属性词典与通用属性词典关系如图2所示(以某款咖啡为例)。个性化属性词典的产生算法将在2.3节详细展开。个性化属性词典主要用于获取属于该商品特殊属性的相关词语,在意义上和通用属性词典既有交叉重叠部分,也有自身的特征,它的完善与好坏取决于当前商品的评论数量。一般而言,随着用户评论数量的增多,商品个性化属性词典越加丰富和完善。图2通用属性词典和个性化属性词典的关系84情报分析与研究定义3:情感倾向词典。情感倾向词典的构建是RAPBEE模型实施的基础,因此一个较好的情感倾向词典将在一定程度上决定模型的识别效果。目前而言,常用的中文情感词典主要包括知网HowNet情感词库[14]、台湾大学的情感极性词典[15]以及其他研究人员的情感词典。由于在线商品评论的特殊性,笔者在上述情感词库的基础上,结合现有的网络情感词、购物情感词,筛选出常用的在线商品评论情感词库(总共约2800个情感倾向词汇),该词库对算法的运行效率和计算结果都有较好的改善作用。2.2模型逻辑结构在已有的研究中,对于在线商品虚假评论的处理多采用“一次性”方案,如文献[1]中的评论相似度匹配、文献[6]基于用户行为的识别、文献[16]基于群体用户行为等处理方案。这类方案主要有以下缺点。(1)忽视了新增评论对已有评论造成影响的可能性。由于在线商品评论的实时性与动态性,时刻都可能有新的评论产生,因此对于特定商品的新评论是否会影响已有评论的有效性和真实性,这在以往研究中往往被忽略。(2)忽视了商家服务或者商品本身发生变化而导致已有评论“失真”的可能性。商家以盈利为基本目的,因此商家极有可能在得到一定的好评数后降低服务质量,但由于多数识别处理方案无法处理此类情形,使得降低质量后的差评无法得到有效的展示而使消费者受害。反之,同样可能存在商家发现自身服务或者商品存在不足后予以改进,此时,以前发表的有关不足的评论将变得“不真实”。RAPBEE模型在解决上述不足的基础上,形成了如图3所示的逻辑解决方案。图3RAPBEE模型逻辑结构在该方案中,对于商品的新增评论,有两部分需要重新计算和处理:(1)个性化评论属性词典的重建。新增评