大数据时代,新闻生产有什么不同?——浅析大数据技术对新闻生产的影响吕阳201300052021文学与新闻传播学院2013级新闻班摘要:在传媒领域,大数据技术的产生使媒介工具有了更进一步的延伸。通过海量数据的获取和分析,媒体能够获得更多有价值的资源和信息,并应用于新闻生产。大数据的到来使得新闻行业的生产方式和思维都发生了变化,对于受众而言,新闻的获取方式和其产生的传播效果也与以往不同。本文将基于大数据时代的传播环境,分析大数据技术对新闻传播领域产生的几大影响。关键词:数据驱动新闻;人机合作新闻;数据共享;新闻的相关关系与因果关系大数据技术的产生,使得世间万物之间似乎都存在着千丝万缕的联系。通过信息获取系统采集海量的信息,将这些信息以量化的指标加以分析和归类,也许就能得到某些事物之间的相关关系。对于新闻生产而言,大数据概念的引入使得新闻的视角更广。如今,许多人力难以获取的信息,通过传感器便能够采集到,新闻从业者也许在无意中就能够发现从未得到关注的现象或事物之间的关联。但从另一个角度来看,大数据的思维使得新闻的生产停留在“发现”,而这种“发现”是建立在海量没有明确容错阈值的数据分析之上,是否背离了新闻的真实性原则,有待探讨。大数据带来的技术变革,有如工业革命,各行各业都开始了信息量化的进程。而它所带来的影响,也如工业革命,既带来了生产力的飞跃,也带来污染。以下,笔者将从新闻采集、新闻报道方式、新闻内容等几个方面分析大数据技术对新闻生产产生的影响。一、新闻由“跑出来”转向“算出来”大数据时代带来的最大的思维变革,在于对各类信息进行量化,被量化的信息成为存储、传播、获取更为便利的数据。在某种程度上,对于新闻从业者而言,大数据时代随处可得的数据资源极大地开拓了记者的视角,提升了记者的采访能力。记者可以利用大数据挖掘传统媒体、网络媒体、社交媒体上的数据信息,从中得到新的新闻线索。而大数据的另一个创举,在于为新闻从业者提供了更强大的数据分析能力。与探究因果型不同的是,大数据更看重事物之间的相关关系,而这种定量的分析思维在处理被量化的数据时效率极高,大量的云计算技术能够为新闻采集迅速提取出有效的信息,并提供各种信息之间的相关关系。对于新闻行业而言,新闻生产似乎也出现了能够一键生成的“傻瓜机”。只需要事先设置好信息获取的算法和数据分析的建模,记者们就能挖掘出人力不可及的信息。以Facebook为例,Facebook借助大数据技术收集社交平台上的热点信息,通过不间断的监控,采集最受用户关注、转发量最大的热点信息,加工形成新闻产品向用户推送。在互联网和物联网技术逐渐发展的当今,每一个个体在社会生活中的小小举动都可能成为新闻信息采集的来源。英国学者维克托·迈尔·舍恩伯格在其著作《大数据时代》中举例,谷歌利用大量的搜索记录,对用户搜索中如“咳嗽”、“发烧”等特殊词条进行分析,能够比官方机构提前一至两周预测流感的爆发。通过数据的分析,记者甚至能够对未来发生的事件进行预测,而不必为了找寻新闻线索而东奔西走。在大数据时代,数据有三个主要来源,一是互联网上人与人的交互信息,媒体能够像Facebook那样迅速掌握用户的兴趣点所在,据此进行议题设置。二是物联网中的数据,借助附着在物体表面或体内的传感器,发现许多人力难以采集的信息,制作传感新闻。如《休斯顿记事报》的一名记者为了探测当地一些化工厂是否释放有害物质,在化工厂周围设置了一些传感器,以探测污染情况。第三个来源是企业之间的经营交易数据,媒体能够通过搜集这些数据来预测金融危机或提供经营策略的建议。在数据爆炸的当代,仅依靠人力是不可能发现极具价值的新闻线索的。在大数据时代,新闻需要借助大数据“算出来”。二、大数据技术辅助新闻生产的方式将广泛应用“机器人写作新闻”最早运用于体育报道领域。2010年,美国西北大学开发出StatsMonkey软件,利用此软件可以自动从网页中抓取比赛数据信息,在接收到信息后的2秒内快速生成新闻标题,并将相应的数据填入已有的模板中。法国《世界报》等媒体利用此软件来报道体育新闻,最初因技术限制只能集中在垒球报道领域。美国叙述科学公司开发的同名软件在2012年时写出了越150万条关于么过少年棒球联盟的报道。此后,“机器人写作新闻”还设计了股票分析、房地产等经济领域。通过事先设定信息获取的算法和规则,大数据技术可以找到相应地新闻线索,并通过相关的搜索和分析提供新闻的背景材料和最新消息。再将这些数据套用到已经设定好的模板之中,一篇由机器人写作的新闻稿就完成了。由于写作模板的限制,目前这种写作模式还仅运用在体育和金融领域的报道中,尚未在全领域全面开展。大数据技术带来的价值并不仅仅在帮助记者在相对简单的新闻稿写作中偷懒,借用大数据,记者同样可以完成更有深度的报道。在深度报道中,记者可以根据自己得到的新闻线索,借用大数据技术进行背景资料的搜索和整合,获取更多人力难以获得信息,如前文提到的使用传感器就是进行深度报道一种很有效的信息采集方式。同时,这些信息可以被大数据信息进行分析,得出相关的预测。在通过计算机得到充足的信息后,记者可以根据新闻事件的逻辑关系对信息进行梳理,完成新闻稿件的写作。这种人机合作的新闻生产方式,无疑极大地提高了新闻生产的效率,也是对传统的依靠记者写稿的报道方式的变革。三、媒介组织更强调数据共享大数据概念的核心不仅在于“数据”,还有海量、全面的“大”,即海量而全面的交互数据。大数据时代,数据是最大的资源,只有拥有了足够多的数据样本,媒介组织才能够在新闻生产上占据主动权。在大数据时代占据先机,最根本在于数量上的积累。以互联网巨头腾讯为例,与传统的新闻聚合类门户网站不同,腾讯将自己定位为产品和服务的提供商,它本身也不生产新闻产品。但在最新的新闻类app市场份额数据中,腾讯新闻占据的市场份额遥遥领先,这一切都有赖于腾讯旗下的即时通讯软件、各类游戏为其积累的庞大的用户群体,通过记录这些用户群体的使用习惯,更能了解用户的兴趣点,提供个性化定制的新闻推送。数据的流动和开放也是非常重要的。根据大数据的数据分析原则,大数据技术对数据进行分析时采用的是定量分析,并且用于分析的数据没有明确的容错阈值。在可能存在大量偏差的情况下,对数量越大、越全面的数据进行分析,得到的相关关系将越接近事实。而一家独立的媒介组织掌握的数据数量有限,不可能涵盖所有的方面,因此媒介组织之间的数据共享十分必要。在这种实际情况的要求之下,新闻媒体将不得不搭建互动式的信息平台,积累新闻信息和受众的数据信息,通过数据共享以满足大数据时代新闻生产的需求。四、大数据带来的争论大数据备受争论的观点是,大数据仅追求事物之间的相关关系,而忽视了其中的因果关系。刘建明在《“大数据”的迷思与新闻媒体的应对》中提出,大数据时代放弃对因果关系的渴求,只关注相关关系的做法,会使人类走向无知。前文提到了数据缺少明确的容错阈值,进行数据分析时存在着出现差错的可能性。在当下全民皆媒体的时代,传播存在谬误和偏差的信息的现象屡见不鲜,在网络媒体和社交平台上采集得到的数据很可能存在大量的错误。大数据的分析结果无法体现事物之间的因果关系,倘若在新闻生产过程中一味依赖大数据分析,新闻的真实性将无法得到保证。另外,大数据距离人工智能尚有很大的差距。大数据技术擅长分析和统计,但却无法在海量的分析结果中挑选最重要的信息,这时就更需要强调新闻生产中把关人的作用。大数据时代,技术和思维的革新给新闻生产带来了更高效的生产工具,但由于大数据技术本身存在的一些缺陷,这种革新没能从根本上改变新闻生产方式。在未来的一段时间内,新闻生产依然将以人为主导,人机合作的形式将逐渐普及,但距离新闻生产的自动化,依然有很长的一段路要走。