-1-数据价值链:大数据时代漫谈洪文兴博士厦门大学信息科学与技术学院hwx@xmu.edu.cnhong.xmu.edu.cn-2-ThinkBig-3-提纲何为大数据?–谁来定义?–4V特征大数据与云计算?数据价值链:从采集到利用大数据产业链(案例)–搜索引擎-知识图谱–搜索引擎-比价、评论综合–社会化网络-推荐系统–大数据可视化-4-致谢本演讲所引用之数据大部分来自于分析:大数据在现实世界中的应用(IBM,2012)本演讲所引用之部分学术观点来自于大数据研究的技术层面与主要研究内容(黄宜华,Hadoop与大数据技术大会,2012)-5-大数据(BigData)2007年,图灵奖获得者JimGray,提出“数据密集型科学发现(Data-IntensiveScientificDiscovery)”将成为科学研究的第四范式,“数据科学”拉开了帷幕。2008年,《Nature》杂志出版专刊,讨论大数据处理相关的一系列技术问题和挑战[1]。2012年3月底,美国政府发布了大数据研发专项研究计划(BigDataInitiative),拟投入2亿美元用于研究开发科学探索、环境和生物医学、教育和国家安全等重大领域和行业所急需的大数据处理技术和工具,把大数据研究上升到为国家战略[2]。2012年10月,中国计算机学会于成立大数据专家委员会,并在2012年12月发布调研报告,说明数据科学的热点问题和发展趋势[3]-6-大数据-7-大数据-8--9--10-大数据-4V特征-11-提纲何为大数据?–谁来定义?–4V特征大数据与云计算?数据价值链:从采集到利用大数据产业链(案例)–搜索引擎-知识图谱–搜索引擎-比价、评论综合–社会化网络-推荐系统–大数据可视化-12-大数据与云计算大数据是云计算的两大核心内容之一。-13-大数据与云计算-14--15-数据价值链(DataValueChain)-16-数据价值链(基本处理方法)-17-数据价值链(基本处理方法)-18-提纲何为大数据?–谁来定义?–4V特征大数据与云计算?数据价值链:从采集到利用大数据产业链(案例)–搜索引擎-知识图谱–搜索引擎-比价、评论综合–社会化网络-推荐系统–大数据可视化-19--20-案例:搜索图谱GoogleKnowledgeGraph搜狗知立方中搜搜索华尔兹(soso,腾讯)-21-案例:搜索比价、评论综合GoogleShopping(GoogleProductSearch)一淘网自动评论(实验室产品)-22-案例:推荐系统VolumeVarietyVelocityVeracity-23-案例:推荐系统截图-24--25-案例:研究对象变迁图2010关键技术典型特征研究对象201320122011实例课题支撑cloud.xm.gov.cni.xmrc.com.cn双向特征表示及匹配互惠推荐人才特征提取cadal.cn数据价值链多媒体推荐音乐、图书diapers.com基础推荐商品企业横向知识资源港智能服务创新驿栈、政府个性化门户智能推荐人才信息智能搜索与推荐专家、新闻社交网络推荐多源数据及多维度结果-26-交通实时数据(厦门)(北京)街景地图GoogleStreetView(香港会展中心)SOSO街景.故宫案例:数据可视化(数值表示)-27-案例:数据可视化(模式发现)PeopleTopicSportsPoliticsHealthLawScienceEntertainmentEnvironmentEconomyOct15thOct16thOct17thOct18thArtistsScientistsSportsStarMovieStarsTopicInterest:BasketballActionFilmUserProfilePeoplePreference:BasketballStarsIdolMovieStarsFlexibleQueryPeopleTopicTimeOct16thTimeOct15thMenWomenNBAWorldChamMenWomenFictionCriminalTitle:HeatPreseason…Title:Red:He’sgottimetokill.Title:Settlein:LeBronJamesTitle:KnicksVSLakers…Title:Conviction…Title:AsgoodasDead…-28-数据价值链:大数据时代漫谈Q&A洪文兴hwx@xmu.edu.cn谢谢!