大数据时代科技情报工作挑战与思考孙建军南京大学信息管理学院报告提纲1.大数据时代特征2.大数据时代科技情报工作面临的挑战3.大数据时代科技情报工作的思考1.1大数据时代的背景facebook社交网络…淘宝、ebuy电子商务…微博、Apps移动互联…21世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。“大数据”的诞生:半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸的学科如天文学和基因学,创造出了“大数据”这个概念*。如今,这个概念几乎应用到了所有人类智力与发展的领域中。1.2数据增长统计GBTBPBEBZB地球上至今总共的数据量:在2006年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;5年后,这个数字达到了1.8ZB。而有市场研究机构预测:到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)!1PB=2^50字节1EB=2^60字节1ZB=2^70字节1.3大数据的特征体量Volume多样性Variety价值密度Value速度Velocity非结构化数据的超大规模和增长总数据量的80~90%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效2、大数据时代科技情报工作面临的挑战•2.1科技情报服务机构的优势转变问题•2.2科技情报工作的重心转移问题•2.3科技情报工作流程重构问题2.1数据开放大趋势下,科技情报服务机构如何确立优势?资源独占优势情报加工优势科技大数据体系建设与开放化公共信息资源共享学术信息资源开放•科技信息资源开放化下,科技情报机构依托于资源独占的优势不应、也难以持续;•大数据时代的资源开放,强化了科技情报机构的另一优势:资源融合与深度加工。数据开放大趋势下,科技情报机构社会责任:积极建设科技大数据、推动其开放化。2.2科技情报工作的重心转移问题科技信息(Information)科技情报(Intelligence)科技解析(Analytics)另一方面,大数据时代科技情报资源更为复杂,科技情报工作重心转移带来两个问题:(1)如何在减少数据处理与分析时间的同时,保证其质量?(2)情报解析工作如何纳入到整体流程中?科技情报服务的发展应深入到科技解析阶段。科技情报工作应由传统的“重数据分析轻情报解析”向“重情报解析”转变。2.3科技情报工作流程重构问题纳入用户、情报人员、数据工作者、专家的科技情报工作流程重构。•注重全流程中角色协作、快速迭代;•注重智能化、可视化技术应用;•情报服务延伸到客户需求各个环节。问题确定调查与分析专家识别数据采集数据分析结果可视化结果解读专家评审服务推送3、大数据时代科技情报工作的思考•3.1建立全面、高质、开放的科技情报大数据保障体系•3.2提升科技情报深加工能力•3.3创新科技情报服务模式3、大数据时代科技情报工作的思考思考1:建立全面、高质、开放的科技情报大数据保障体系扩大数据的来源——全面建立高效的数据质量评价体系——高质降低数据获取的成本——开放第三方分析报告3.数据时代科技情报工作的思考思考2:提升科技情报深加工能力多源数据深度融合多源数据内在关联发现3.大数据时代科技情报工作的思考思考3:创新科技情报服务模式轻量化科技情报服务模式细粒度科技情报服务模式一体化科技情报服务模式谢谢!