新闻推荐系统中的“信息茧房”问题:议题综述与解决思路

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

龙源期刊网新闻推荐系统中的“信息茧房”问题:议题综述与解决思路作者:林微来源:《新媒体研究》2018年第06期摘要主要针对新闻推荐系统,考察其中的“信息茧房”问题并提出解决思路。通过对国内新闻传播学、计算机科学、情报管理学中的相关文献的梳理,辅以对webofscience中国外SSCI文献的计量分析,介绍与“信息茧房”相关的主要议题与最新进展。在此基础上,构建新闻在推荐系统情境中包含信息流和数据流的“创作,发布/抓取,分发/点击,阅读”流程模型,并针对这一模型,提出在内容筛选、技术创新、心理考察三个角度上可能的思路,以期通过多学科、学业界的研究与实践互动,推动“信息茧房”问题的解决。关键词信息茧房;回音室效应;个性化推荐;推荐系统中图分类号G2文献标识码A文章编号2096-0360(2018)06-0001-071研究缘起与概念界定1.1研究缘起通过算法完成资讯的个性化推荐和分发,正成为今天新闻业内越来越多媒体的选择。无论是技术出身的内容推荐引擎“今日头条”“一点资讯”、ZAKER等,还是传统媒体出身的四川报业集团与阿里巴巴合作推出的“封面新闻”、门户网站的移动端应用“腾讯新闻”等,都将信息的“个性化推荐”作为自己的产品亮点。个性化推荐是一种信息过滤技术,“个性化”是其技术目的,推荐算法是其方法。它期望通过分析大量用户行为日志,给不同用户提供不同的个性化页面展示,来提高网站的点击率和转化率[1]4。它在不同产品中的应用已由来已久。电子商务领域有亚马逊被RWW(读写网)称为“推荐系统之王”。影视领域有美国视频公司Netflix为了更精准地对用户进行电影推荐,自2006年起开始举办著名的NetflixPrize推荐系统比赛,悬赏百万美元,希望将算法的预测准确度提升10%。在信息阅读领域,“今日头条”是于“GoogleReader”“鲜果网”等阅读工具开发的后继实践者。它从2013到2015年间异军突起,迅速占取国内大量网络新闻受众,也在2017年到2018年来遭遇数次公众舆论质疑。2017年9月,人民日报连续发表3篇文章就算法推荐问题质问“今日头条”过度依赖技术导致用户受困“信息茧房”。2018年1月,其陷入“麦克风事件”。众多网友质疑“今日头条”开启了手机麦克风权限收集用户声音信息进行内容推荐,之后“今日头条”回应表示其技术达不到也不会去进行这样的信息收集。尽管“今日头条”做出了澄清,网友的质疑则侧面表现出人们对于被自己的浏览历史、社交足迹“包裹”的恐慌。龙源期刊网这种“被包裹”的恐慌,是美国学者桑斯坦在其2006年出版的著作《信息乌托邦——众人如何生产知识》一书中提出“信息茧房”(InformationCocoons)概念的现实诠释。书中他所描述“信息茧房”由“个人日报”形式呈现。人们可以借助网络平台和技术工具在海量的信息中随意选择自己关注的话题,完全根据自己的喜好定制报纸和杂志,即一种完全个人化的阅读[2]。同时桑斯坦指出,在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中。桑斯坦对此概念阐述的主体是用户,侧重描述基于用户选择的阅读个性化。而推荐系统的设计意图描述则更侧重信息分发者针对用户个体进行的点对点的传播个性化。但这两层含义并不是相对立的关系,而是存在叠合的交集,这是因为推荐系统个性化传播决策的执行极大依赖着基于用户浏览行为的日志数据。这一点将会结合新闻在推荐系统情境中“创作,发布/抓取,分发/点击,阅读”传播的流程模型详述。本文希望将此模型图作为本次多学科文献梳理的总结,并针对模型图的3个环节,提出在内容筛选、技术创新、心理考察3个角度上的应对思路,推动新闻推荐系统“信息茧房”问题的解决。1.2主要概念与辨析1)新闻:本文中指广义上的信息资源,包括文字、图片、视频、问答、直播等不同的形式。新闻推荐系统中,前台展示的新闻主要是来源于网络爬虫、合作媒体和自媒体创作[3]。网络爬虫爬取社交媒体、门户网站等信息资源;合作媒体指中央、省级、各地市、县级及以下媒体;自媒体创作主要提供专业学习信息、新闻、生活休闲类等其他“长尾”信息资源。2)算法:是一系列解决问题的清晰指令,也可抽象理解为解决问题的方法。理解算法的概念可以从理论与应用层面展开。以推荐算法为例,CF、CBF、DNN算法等属于理论层面的数学方法,而亚马逊、Youtube、Facebook、今日头条等产品属于算法在应用层面的实践成果,包含商业逻辑在内的复杂运作。3)推荐系统与推荐算法:Resnick等于1997年给出了推荐系统的定义。一个完整的推荐系统由用户模型、产品模型与推荐算法三部分组成[4]。推荐系统包含推荐算法作为其核心组成部分,同时需要对所推荐的物品和用户建模。对于一个推荐系统来说,推荐算法决定其类型及性能优劣。目前主流的推荐算法有:协同过滤(CF)、基于关联规则的推荐、基于二部图的推荐等[5]。2关于新闻推荐系统“信息茧房”的主要议题梳理龙源期刊网中文文献的参阅依循各文献之间的引文网络,在CNKI中选取以下相关关键字按学科分组、以“主题”为搜索条件,选取本世纪至今(2001—2018)被引较多或影响因子较高的文献进行梳理。选取学科分组:新闻与传媒、图书情报与数字图书馆、计算机软件及计算机应用。主要使用的关键字包括:“信息茧房”“信息窄化”“群体极化”“回音室效应”“个性化推荐”等。涉及其他关键字包括:“推荐算法”“社会化推荐系统”“信息偶遇”等。英文文献搜索中,在webofscience平台中使用关键字Echochamber在SSCI索引下搜索,从2001年至2018年3月3日,共得到106条文献。2.1新闻推荐系统“信息茧房”问题背景:还未尽善的技术与大众心理的共谋概念的提出者桑斯坦将“信息茧房”的产生背景定义在网络与技术环境中。首先从计算机科学与应用的视角下看,推荐系统是为了解决信息过载问题而发展出的一套技术。纵观因特网的发展源流,它由单个网络ARPANET升级到现今多层次ISP结构的互联网,这代表着更复杂的网络层级和更大的用户覆盖面,带来了更多的信息生产和更快的信息交互。为了解决信息过载问题,提升人们获取信息的效率与质量,分类目录、搜索引擎、推荐系统、智能问答等技术应运而生。在具体新闻场景的应用中,相应地出现了以雅虎为代表的门户网站、以谷歌为代表的搜索引擎、以Facebook上的Newsfeed、今日头条等为代表的内容智能分发工具和Quartz、微软小冰等对话式新闻产品。新闻推荐系统在对搜索引擎中PageRank等经典排序算法的继承和改造的基础上,它的特点在于不需要用户表达明确的特定信息需求。不同于搜索引擎被动等待用户的“搜索”操作,进行信息呈现,推荐算法能够主动收集用户的特征信息。但由于用户没有显式地提出特定信息需求,新闻推荐系统就必须做到挖掘用户的潜在需求,这也使“精确度”成为其系统优劣的首要评价指标,为“信息茧房”问题埋下隐忧。在计算机界,早在2006年就有学者意识到在推荐系统仅关注精确性远远不够,可能会导致用户得到一些信息量为零的“精准推荐”,导致视野越来越狭窄的情况[6]。这种“越推越窄”的情况被称之为计算机界的探索利用问题,有时也称为EE问题(Explore&Exploit)。2011年,在ACM组织的第五届推荐系统国际会议上,专门召开了一个讨论推荐系统多样性的研讨会(DiveES2011)。此后,2013年国内学界推出第一篇系统地对推荐系统多样性进行综述的文章[7],在分析多样性类型的基础上,重点概括、比较和分析了信息物理、二次优化、社会化网络和时间感知四种提高个性化推荐多样性的方法,期待未来更多算法的有效组合研究。此后,计算机学业界将研究重心转移到推荐系统信息窄化的解决,即推荐算法的优化与更多指标的测试中。例如在发现用户新兴趣上,基于关联规则的推荐优于基于内容的推荐和协同过滤推荐[5]。在测试指标设置上,学者项亮总结出包括准确率、覆盖率、多样性、新颖性、惊喜龙源期刊网度、信任度等10余个推荐系统评价指标[1]23-33。另有一批学者的研究成果发表在《复杂网络观察》《复杂系统与复杂性科学》等专业刊物上。新闻传播学界在“信息茧房”概念提出后也很快加入讨论。学者程士安等以科技进步与传播规律的演进为视角,考察数字化时代的组织传播理论时,对“信息茧房”的概念进行了组织传播视角的重新阐述。提出通过分析新技术条件下的信息聚合与社群的构成,看新技术条件下网络组织微观关系下的“纽带”与“锁扣”特征。对于基本的网络结构“结点与边”(vergesandedges),并不局限将“结点”看作单一用户,而是聚合着某同类信息需求的人群,而“边”既是信息聚合体内部的构成纽带,也在外部连接着组织与组织,社群与社群。这使“信息茧房”的研究视域从个人的茧房,扩大到群体的茧房。接着,文章从动态的传播视角,提出了“茧房的迁移”。指小“茧房”通过网络游移,相似的几个子“茧房”会在一个特定大“茧房”平台上达成共识[8]。文章从组织传播和网络传播的视角微观、动态地描述了茧房形成与变化的机理;对茧房之内、之间联系的研究,将网络作为基本数据结构之一所定义中物理性质的“边”,融入了社会心理因素的考察。这一观点的提出,也进一步明确了“信息茧房”与“群体极化”等议题之间的紧密联系。在技术之外,新闻传播界的研究着重指出了“信息茧房”形成在思想渊源、心理特性等方面的原因。2013年,新闻界期刊首先将此定义正式介绍到国内时,学者梁锋指出“信息茧房”的思想渊源可以追溯到19世纪初法国思想家托克维尔发现的,民主社会天然地易于促成个人主义的生成,并随着身份平等的推广而扩散[9]。学者刘华栋基于对社交媒体的观察,认为个人兴趣引导人们的信息接收行为使其陷入“信息茧房”,而社交媒体使用进一步促进“信息茧房”的形成[10]。学者陈昌凤等认为信息茧房、信息偏向等问题的产生与人们的“证实性偏见”有关[11],即人们倾向于寻找信息确认自己的观点。新闻传播界往往在分析原因后提出关于“信息茧房”危害的议题探讨,网络是信息自由传扬的乌托邦抑或滋养极端意见分子的温床,“信息茧房”与“群体极化”等社会政治议题有何关联,这是此后新闻传播学界的一个研究方向,并综合运用了基于案例观察的或实验设计等实证研究方法,将在本节下一小点再做介绍。情报管理学界对新闻推荐系统“信息茧房”问题机制的研究起步较晚,2018年1月出版首篇网络信息系统视角下的机制研究论文[3]。首先从内容智能分发平台信息资源组织方式、信息受众用户行为与信息运动方式三方面分析影响平台信息运动效率的因素。在此基础上探讨“信息茧房”的形成机制时,创新地使用了运动规律、平台情境两个视角。总的来看,新闻推荐系统“信息茧房”问题的出现,从技术发展的脉络来看,是推荐系统完善过程中必然面对的难题,而动态的网络信息空间环境、复杂的个人与群体心理等因素丰富了它可归因的维度,使得这一问题不应仅仅作为技术带来个人视野的局限看待,同时奠基其他群体性社会议题的产生。龙源期刊网新闻推荐系统“信息茧房”认识现状:趋于关注细节、量化的实证研究,总结从个体到社会的多层次危害分析思路“信息茧房”问题提出后,计算机学界转入问题解决领域进行算法优化研究。目前关于“信息茧房”现状的认识主要来源于新闻传播学界。为丰富研究素材的维度,笔者引入国外SSCI相关文献的计量分析与阅读梳理,总结得到主要关于“茧房”程度、“茧房”危害两个研究角度。国内新闻传播学者在考量新闻推荐系统“信息茧房”问题时,常联系“个性化推荐”“算法分发”“智能分发”“算法新闻”等关键词,应用新闻推荐系统的典型产品“今日头条”是主要的研究对象。由于大部分社交媒体在信息推送设计(feed流)中也多使用到推荐系统技术

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功