“大数据时代”科技期刊的出版革命及面临挑战

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

“大数据时代”科技期刊的出版革命及面临挑战2013年08月28日14:38:00吴锋出版发行研究浏览:摘要:伴随着海量数据生产、关联、消费和处理的常态化,“大数据”成为新近学术界、IT界和各国政府关注的热点,也成为科技期刊界不可回避的焦点问题。研究认为,大数据对科技期刊出版具有革命性的影响,将推进科技期刊编辑流程的再优化、科技期刊出版业态的多媒体化和科技期刊评价规则的多元化。但大数据也是一把“双刃剑”,科技期刊面临赢利模式、竞争环境透明化,工作量加大等挑战,而政府立法和国际合作亦面临全新课题。关键词:大数据科技期刊出版革命早在1980年,美国著名未来学家托夫勒就预测了“大数据”将在“第三次浪潮”中扮演重要角色;2009年,“大数据”作为一种新的专业术语和商业模式引起各界瞩目,它不仅是学术界的下一个创新前沿,而且是商业界另一个热门市场,还是各国政府关注的战略领域,许多外国媒体和专家将2013年称为“大数据元年”[1]。那么,“大数据”会给科技期刊出版带来哪些革命性的影响?科技期刊又将面临哪些严峻挑战?一、“大数据”的概念及基本特征虽然“大数据”作为一个名词早在1980年托夫勒出版的《第三次浪潮》一书中已经出现,但新近流行的大数据概念是一个新的专业术语。[2]进入新世纪以来,随着物联网、云计算、移动互联网等信息技术的快速扩散,社会各领域的数据种类和生产规模正以前所未有的速度增长。在公共领域,国际社会对数据透明化与数据共享的需求日益强烈,全球范围内广泛兴起的数据关联运动、政府数据公开运动增加了数据资源的可获得性与可用性。[3]在私人领域,随着PC、智能手机、iPad、iPhone等新型数字产品的普及,以论坛、微博和微信等为代表的自媒体迅猛崛起,公众每天都在生产、交换、消费或积累着海量的多样化数据。国际数据公司(IDC)的最新研究显示,2011年全球数据生产量达1.8ZB,且全球信息总量每隔两年增长一倍。[4]海量数据的产生深刻地改变了人们对客观事物的描述手段,也为人们探寻数据背后的客观规律提供了新的分析工具。2007年,计算机图灵奖得主吉姆·格雷(JimGrey)在美国国家研究理事会计算机科学和远程通讯委员会(NRC-CSTB)的一个演讲报告中提出了科学研究的“第四范式”,即以数据为中心,以协同化、网络化与数据驱动为主要特征的数据密集型科学研究,[5]强调大数据对现今科研工作的重大影响。2008年《自然》杂志率先推出了“大数据”专刊,[6]使其迅即成为全球计算机科学界的显学。2009年初,微软、IBM、甲骨文、惠普等IT巨头纷纷携巨资挺进大数据市场。国际信息产业界认为,大数据包含两大市场:一是大数据核心技术及相关的硬件、软件和个人服务市场。2010年全球该领域的市场规模达到30亿美元,2015年则将超过170亿美元;未来中国大数据潜在市场规模近2万亿元,并将成为全球最大的大数据市场。[7]二是政府及行业公共领域的服务市场。据麦肯锡预测,通过高效使用公共大数据,美国医疗服务业每年可节省3000亿美元,欧洲的公共管理每年可节省2500亿欧元,英国政府每年可节约开支330亿英镑,制造业在产品开发、组装等环节可节省50%的成本。[1]缘于此,2012年美国奥巴马政府发布《大数据研究和发展倡议》,投资2亿美元启动“大数据发展计划”。关于大数据的定义,目前尚无统一说法。有论者从数据规模的量级上进行度量,认为仅当数据累加量值在10TB至1PB(P为T的千倍)以上方可称为“大数据”[8]。维基百科认为,大数据是指无法在一定时间内用通常的软件工具进行捕获、管理的数据集合。[9]笔者认为,大数据是在数据密集型科学环境下的一套用于超大规模数据的采集、存储、分析及知识再发现的信息处理范式的统称。学术界普遍认为大数据具有3V特性,即反映数据量级的规模性(volume)、反映数据类型属性的多样性(variety)和反映数据产生及变化时效的高速性(velocity)。但笔者认为还应强调其“3R”的特性:一是可记录性(recordable),大数据存在前提是客观事物的活动状态得以便捷高效、低成本、全方位地数字化记录;二是关联性(relevance),只有数据孤岛被打破、数据公开获取成为常态,海量数据之间的关联才成为可能;三是再组织性(reorganization),利用数据分析工具对常规数据进行再组合加工,推动“知识的再发现”,进而构建“以数据为核心”的商业服务模式。二、大数据时代科技期刊的“出版革命”及战略机遇1.科技期刊编辑流程的再优化大数据技术对科技期刊的影响首先表现在助推期刊作业的流程再造,实现编辑操作的流程革命。过去许多难以控制、不能细化、不可数字化描述的流程转为可控制、可细化、可用数据精确描述的作业流程;过去许多无序的手工作业模式将逐步转为标准化、程序化的作业模式;过去因人而异、隐蔽无序的编辑规则模式转为统一规范、透明有序的编辑规则模式。可以预见,未来基于大数据的科技期刊编辑系统是以多维度数据处理为基础,以计算机网络和人工智能计算工具为手段,以增加编辑透明度为原则,以减少重复劳动和简单劳动、提升编辑质量及效率为目标的复合型、动态型、智能型编辑管理工具。在大数据时代,由于作者、编者、专家的信息传输和决策行为等均纳入了数字化管理轨道,并与中外公共文献数据库实现了连接与共享,这使期刊编辑中的数据互通共享、数据计算分析及数字化作业成为可能(图1),进而催生出“智能编辑管理”“时间管理”和“透明化管理”等全新的编辑管理模式。其一,基于大数据平台的“智能编辑管理”,引入人工智能计算分析工具,对作者来稿进行“预处理”编辑,自动生成反映作者学术水准、学术贡献、学术知名度等特性的分析和评估报告,自动生成反映来稿内容特性及分类的监测、分析和评估报告,进而大大减轻编辑的人工作业负担。其具体功能:一是学术不端来稿的智能甄别功能,利用作者投稿与已发表的中外公共文献数据进行比对,可有效甄别有抄袭、中文重复发表、跨语言重复发表嫌疑的来稿。此外,若多家科技期刊共用一个期刊编辑系统平台,或者国内多家期刊编辑系统实现了后台数据的连接协作,则可利用科技期刊编辑系统后台的数据查重计算工具,进而识别有“一稿多投”嫌疑的来稿。换言之,在大数据平台背景下,计算机智能编辑可从投稿环节杜绝学术不端类稿件,减少无效劳动。二是作者评估分级功能,帮助编辑对来稿作者的层级分布属性进行科学评估,并加以分级或排序。如利用来稿的作者信息与中外已发表公共文献数据库平台中的作者进行比对,利用投稿作者的发表数和弃用稿数信息,计算作者稿件的发表比例,对作者发表论文的数量、期刊层次、被引次数等历史信息进行梳理,可将作者分为权威作者、高端作者和一般作者等层次类型,便于对不同作者的来稿做个性化处理。三是稿件属性预评估,引入在线文本分析工具,将作者来稿关键词与国内外公共文献数据库进行比对分析,帮助编辑对海量来稿的时效性、选题热度、学科领域等属性进行评估和分类,进而判断来稿是否属于特定学科领域的新近热门主题或重要选题。最后,依据上述三方的数据自动生成综合性评估报告或报表(见图2)。其二,基于大数据平台的“时间管理”,对论文的审稿周期和出版周期进行控制管理,达到编辑流程的可控化目标。对期刊社来说,可以依据期刊的学科特性和自身条件,自主决定稿件编辑的周期,对需要快审的重头稿件、需要多方审定的难点稿件、需要反复斟酌的争议稿件等设置个性化的时间节点,进而提升编辑的质量和效益;对审阅者而言,期刊编辑平台可以利用三网融合工具,用短信、微博、微信等移动工具自动提醒专家及时审阅稿件,审稿专家可利用移动通信工具登陆审阅系统,在iPad或智能手机平台上进行审阅,进而加快审稿进度;对作者而言,不仅可获知稿件动态,而且可以及时获取论文发表后被转载、被引等情况的信息。其三,基于大数据平台的“透明化”管理,打破编辑流程中的信息阻隔和信息孤岛,使得多方信息的连接与互动成为可能。传统科技期刊编辑过程中,编辑和评审人的决策多不为外界知晓,其决策不透明的方式一直饱受诟病。在大数据编辑平台中,编辑亦可将修改建议、专家审稿结论等信息及时反馈给作者,并允许作者进行答辩或申诉,进而建立作者、专家和编者三者之间的良性互动框架,最终实现编辑流程的透明化,确保审稿和编稿的公平公正。2.科技期刊出版业态的多媒体化近年来,全球生态恶化问题凸显,以节能减排和清洁生产为核心诉求的低碳经济成为全球经济的主流。期刊印刷中的纸张、油墨等皆属高能耗、高污染产品。自2008年起全球范围的原油价格暴涨,使纸质出版物物流成本大幅攀升。在此背景下,传统出版物的“业态革命”由理念层面的前沿构想变为实践层面的实际行动。2009年4月,曾七获普利策新闻奖的美国百年大报《基督教科学箴言报》停止纸质印刷日报出版,转为每天24小时随时更新的电子出版物;2010年9月,拥有119年历史的《巴西日报》停出印刷版,成为巴西第一家仅以网络版形式存在的报纸;2013年1月,全球知名的老牌期刊《新闻周刊》正式放弃印刷版杂志,实现全部数字化。目前,国内科技期刊仍沿用传统的纸质出版模式,但在世界范围内,除极少数综合性知名科技期刊外,大多数科技期刊属于专业性期刊,传播对象局限在较窄的细分领域。由于发行量小,大多数科技期刊的印刷量均在批量印刷临界点以下,故而印刷成本高昂;缘于科技期刊的发行面分散,其投递发行成本亦居高不下。科技期刊的上述特性和实情表明,由传统的纸质出版转向数字出版将是未来不可逆转的趋势,而大数据的理念与技术使得这场转型成为现实。大数据将为科技期刊出版新型业态的实现提供全面的技术支持和平台支撑,并将引发科技期刊出版介质的革命、传播平台的革命和多媒体编辑的革命。首先是科技期刊出版介质的革命,即由原来单一的纸质出版介质转为多媒体出版介质,能够容纳平面媒体和数字媒体等多种形式,并可将音频、视频等动态信息纳入期刊出版框架。数字出版只需运用软件将通过审核的论文转化为符合数字出版的格式即可,不仅省去了印刷与投递环节、大幅降低了科技期刊的出版成本,而且可以实现实时发布,大大提高了科技论文的传播时效,具有无可比拟的优势。在可以预见的一段时间内,未来科技期刊的纸质版将与数字版并存,纸质印刷的数量会保持现有印量或逐步减少单期印量;未来另一种可能的出版模式是:科技期刊每期论文直接制作成电子版上传至数据库平台出版,但无须每期每篇文章均印刷出版,而是精选部分下载量大、被引频次高、社会影响较大的最优内容,推出精简的双月或季度印刷版、半年或年度印刷版,使优秀科技论文获得更好的传播效果。其次是传播平台的革命,即由传统的单一纸质传播平台转为多样化平台共存的传播模式,包括纸质传播平台(含纸质转载)、综合性数据库和专业数据库平台、iPad和iPhone平台等,达到科技期刊全媒体传播的效果。最后是多媒体编辑的革命,即科技期刊需突破平面文本信息编辑的传统模式,能够编辑包含文字、图片以及音频和视频在内的多媒体文件,实现由平面编辑向多媒体编辑的转型。在大数据时代,缘于科技期刊出版实现了完整的数字化,科技论文既不受版面容量的限制,亦不受媒体符号样式的制约,预计未来科技论文发表的多媒体文本结构将可能包含三方面的信息:一是由文字和图片表述的平面媒体信息,它是论文的主体,与传统论文的表述方式类似;二是用音频和视频表述的动态性质的数字媒体信息,它是对主体论文信息的重要补充,也是对传统论文单一平面表述方式的重要突破;三是附件信息,即在论文后附带的用以描述实验过程的视频、用以证明科技论文结果的原始数据或实验过程数据等(见图3)。这种多媒体的论文结构框架,不仅便于作者更为充分地展示自身的科研过程和创新程度,而且可以有效遏制数据造假等学术不端行为,这将是科学研究史上的重大进步。但这对科技期刊编辑提出了更高的要求,即不仅要精通平面文字符号的编辑,而且还要熟悉多媒体音频及视频信息的编辑。3.科技期刊评价规则的多元化在世界科技期刊发展中,评价规则的创设、应用与发展起到了风向标的作用。目前,全球科技界普遍采用基于文献计量学的定量评价规则来评判科技期刊及论文的影响力,科技期刊的

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功