大数据与人工智能(ljs20171209)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

大数据与人工智能河北师范大学刘劲松目录•国家战略•大数据•人工智能•互联网+•国内信息化发展特征•建议一、国家战略•我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。•解决矛盾的抓手是大力提升发展质量和效益。•在经济建设方面,要着力深化供给侧结构性改革,推动互联网、大数据、人工智能和实体经济深度融合,在中高端消费、创新引领、绿色低碳、共享经济、现代供应链、人力资本服务等领域培育新增长点、形成新动能。•建立以企业为主体、市场为导向、产学研深度融合的技术创新体系。一、国家战略•京津冀协同发展•雄安新区建设•绿水青山就是金山银山•蓝天保卫战•水污染防治•土壤污染管控与修复•扶贫攻坚•……人口结构难题2017年阳原县农村人口金字塔畸高的出生人口性别比0%10%20%30%40%50%一人户二人户三人户四人户五人户六人户七人户八人户九人户十人及以上2000年2010年2015年河北省家庭户规模演变图河北省家庭户模式演变图环境污染难题限产减排难题产业升级难题二、大数据•天文学和基因学创造了“大数据”概念。•《自然》2008年《大数据专刊》•一张哈勃望远镜高清相片,高达数十GB字节什么叫大数据?•2000年,SloanDigitalSkySurvey项目,一周收集到的数据超过了人类历史上收集到的所有数据的总和。•2016年,智利LargeSynopticSurveyTelescope五天获得的信息量,相当于SDSS以往全部的信息量。大数据源于天文观测大数据源于对地观测大数据源于网络基础设施•Google每天需要处理超过24PB的数据•——等于美国国家图书馆书籍总量的上千倍•Facebook每天更新的相片超过1000万张,每天人们发送的“赞”或者书写的评论超过三十亿次。•Twitter每天发布的微博超过4亿条。大数据源于互联网的数据洪流大数据分类大数据价值•大数据已成为国家管理实力的核心指标。•大数据已成为各行各业健康发展的的重要推力。•下面给出两组大数据的应用实例•2002/09/06日上午9时的AIRS卫星影像,通过这些影像,回顾那一刻北美大陆自平流层到近地面的风云变化。•河北人口与自然的演变特征!京津冀土壤特征京津冀土壤特征京津冀土壤特征京津冀土壤特征京津冀社会环境特征京津冀社会环境特征京津冀人口发展特征京津冀人口发展特征京津冀人口发展特征京津冀人口发展特征05001000150020002500300005101520253035404550556065707580859095100年龄人口数(个)河北省新民居1人户的年龄构成分布图据全员人口数据库汇总数据显示,河北省新民居建设示范村共涉及314.34万人,涉及家庭91.4万户,户均3.44人。其中1人户10.3万,占11.3%,60岁以上1人户约占62%。建议“在新民居建设过程中,要注意解决好鳏寡孤独户的居住养老问题”,得到省领导肯定。京津冀人口发展特征京津冀人口发展特征京津冀人口发展特征•构建家庭网络优化人口数据质量基于家庭网络,评估家族势力在基层政权产生中的作用京津冀人口发展特征国产高分二号土地对象化以户管地地块“形态提取”+“类型判别”+“指标反演”+农户农业生产评估2016年泥河湾土地利用2015-2016泥河湾中分系列影像京津冀人口发展特征京津冀人口发展特征•特征尺度人口密度-人迹罕至和古河道滹沱河平原段陈家疃清嘉庆六年(1801年)6月,大水。磁河决口陈家疃北堤,改道木刀沟。摘自《正定水文志》R=13大数据的5V特征过往皆是序曲!大数据的挑战-存不起大数据产生的新问题•大数据不仅存不起,而且垃圾多,利用率低。应该存些什么?•是不是数据越大越好?•是不是干什么事,都需要数据?有了大数据资源人类思维必须变革二、大数据•古典认识论:“科学始于观察”•当代认识论:“科学始于问题”•现代认识论:“科学始于数据”•人类试图通过“机器学习”或“人工智能”,将部分科学认知任务“外包”给计算机和互联网•经验归纳法正在发展成为“大数据归纳法”人类过往的认识论抽样的局限•观察是否成功依赖于采样的绝对随机性。•实现采样随机非常困难。大数据思维大数据模式:样本=全体•大数据的局限在于,面对海量数据,分析人员不知道想捞的“针”是什么?数据海洋里究竟有没有“针”?不知道!也就是说,工作人员需要知道要解决什么问题?•必须把“科学问题”与“科学数据”有机结合起来。水滴1(x1,y1)水滴2(x2,y2)水滴3(x3,y3)……水滴n(xn,yn)n+1水滴?水滴1(x1,y1)水滴2(x2,y2)水滴3(x3,y3)……水滴n(xn,yn)喷头的位置和通量大数据分析的本质-追根溯源数据分析的目的:生产小型数据集•弱水三千,只取一瓢饮。12.8GB54MB海量的、离散的、价值密度低的数据结构化的统计数据输入1:路上车辆实时分布图输入2:道路交通图输出:交通阻塞实时分布图根据当前局面,判断下一步走哪里!•人工智能实际上是大数据科学的自然演化发展阶段,具有历史必然性!三、人工智能•人工智能(AI):是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的新兴技术科学。是人类智能的计算即实现。•人类智能包括:逻辑、语言、空间、感知(音乐、图像、图形)、肢体控制、内省、探索、人际等能力。•通常谈到的人工智能包括机器人、语言识别、图像识别、自然语言、对弈系统。•人工智能模拟人的意识和思维,像人一样思考、可能会超越人类。人工智能的发展阶段•第一阶段(1956-1976)哺乳阶段•逻辑主义学派(或称符号主义学派)•第二阶段(1976-2006)幼儿园阶段•连接主义学派(以神经网络为代表),误差反传网络(BP神经节)•第三阶段(2006-今)小学阶段•自适应进化学派(以深度学习为代表,image-net,李凯、李飞飞)需要记住的人和事1950年,《计算机器和智能》摩尔、麦卡锡、明斯基、塞弗里奇、所罗门诺夫1956年达特茅斯会议当事人洛克菲勒基金会资助会议7500美元霍伯特·德瑞福斯星星之火,可以燎原!人工智能擅长解决的问题•集合是封闭的。•规则是完备的。•问题的约束是有限的,算法是可以递归的。AI产业革命AI企业分布65%的企业在美中英三国80%的企业在京津冀、长江、珠江AI专利分布美中日德是AI创新基地北京、上海、江苏、广东是AI创新基地AI发展预期AlphaGoZero的惊人成绩,意味着AI领域一场理论交锋的尘埃落定:“无监督学习”战胜了“监督学习”。简约而不简单,大道至简。AI所展示出来的震撼力量0days仅仅输入了围棋基本规则,完全从零开始学习3days打败碾压李世石的AlphaGo版本)对弈成绩为100:0。21days打败战胜柯洁的AlphaGo版本)40days完全靠自学,超过所有AlphaGo版本,达到人类不曾企及的高度。从AlphaGo引起的……集成人工智能的养老社区德国敦豪集成人工智能的城市社区德国敦豪人类未来在哪里?算法人生原子VS比特人类VS机器人四、互联网+为什么要社会转型?互联网具有黑洞效应•国内产业融合变迁是互联网引发社会转型的真实写照!•动力来自于国内6亿在线消费者的消费行为。营销、零售采购、生产金融、物流++互联网++云、网、端互联网+意味着无处不在•互联网浪潮的本质和逻辑是什么?•对行业、企业将会带来哪些冲击?•对个人意味着什么?互联网+=社会转型•经济新常态:•实体经济互联网化•产业发展互联网化•工作方式互联网化•生活方式互联网化•本质:从粗放到集约,从低端到高端,从低效到高效•逻辑:以消费为轴心,精准发力!发展增速要换档,产业结构要均衡,调控政策要有定力!!把市场交给80后74%•80后、90后既是创业主力、也是消费主力。•他们的消费观念、消费权力、消费意识、消费话语决定了未来世界的商业模式。•企业处在焦虑和尴尬的时代。•过去不再成立,未来看不清晰。•“被征服”并不可怕,可怕的是“不知道会被谁征服”!创业者的窘境用互联网技术改造现有业务•不用互联网,就会被淘汰,被用互联网的同行淘汰!只要用互联网,就不会被淘汰。•——万科董事局主席王石•只有“在线”,才能实现数据的沉淀、积累、挖掘和使用,最终抓住C(消费者),而推动B(企业),实现消费者对企业的转变;•只有“联网”,才能开展大规模社会化协同,催生专业化分工,促进效率的提升。只有“互动”,才能创造价值。取势•取势就是整合内外资源,用互联网的玩法,重构整个商业价值链,进行内部赛马和自我革命。例如:马云命令淘宝无线,干掉淘宝;腾讯用微信,攻击手机QQ。•取势就必须关、停、并、转、创。•为了取势,采用免费模式,实施降维打击。•为了取势,采用跨界合作,整合各类资源。•2017年10月11日,马云宣布投资5000亿元,成立阿里全球研究院(达摩院),“因为我相信,未来一定是技术带来利润,必须靠创新,才能取得未来市场规模”。如何衡量互联网+企业的生命力?•看多少项业务“在线”,看关键流程是否“在线”;•看多大程度实现了“互动”理念,看多大程度上“遵照”用户反馈,优化自身产品和服务;•看非业务线性流的其他节点上是否“联网”,是否与全网发生着互动与交换,并因此产生的新的流程和服务。判断互联网转型成败的三个指标参数•用户层面:用户参与热情、用户参与范围,用户是否主动向朋友介绍产品。•员工层面:大家是否更愿意主动发挥潜能?员工发自内心的自主自愿行动?•战略伙伴层面:是否有更多的伙伴,参与创造更大价值的平台(涉及协同机制,还有利益分配)。是最大化的让利给用户,还是最大化的获取垄断红利?五、国内信息化发展特征•信息化已上升为国家战略。•信息基础设施大幅提质增速,但“提速降费”尚不明显。•跨部门开始整合电子政务,但“一体化”进程缓慢。•大数据应用进入国民经济各领域,但管理机构尚未建立。•制造业涌现互联网+生产模式,但缺乏行业规范。•互联网垂直市场寡头化、垄断化趋势明显,同行业的小微企业很难生存!政府的优势•法律授权的教育管理主体----厅(局)•具有依法办事权•具备设计发展路径的规划权•具备制度设计和统筹协调权•具有组织、发动权•伴随管理,具备沉淀各类管理数据资源的机会政府的劣势•编制定额,人手不足•专事管理,但学习、研究、开发、推广的精力不足•亟待改进推广手段--实现资源配置扁平化•亟待改进分析手段--实现分析制度化、报告专业化•亟待改进调研手段--实现抽样调查日常化、制度化•亟待改善沟通手段--实现互动实时化共享民生管理数据•地理空间(地形、地图等)•统计(人口普查数据、资源等)•福利(住房、医疗保险等)•交通和基础设施(公共交通时间表、宽带接入点)•医疗卫生(处方数据、绩效数据)•科研、司法安全(犯罪统计、食品安全)•地球观测(气象/天气等)•教育(学校绩效等)•能源环境(污染水平、能源消费)•金融预算、企业(公司注册信息等)•政府责任和民主(立法和法令、三公经费)•全球发展。六、建议•选好项目(有自主知识产权的自动数据、有国家标准、有高端用户、有明确目标、有清晰的边界、能长期积累、能交叉复用、有不可替代性)。•与国家战略趋同(有稳定的政策环境)。•与区域发展相关(有长久的发展诉求)。•与百姓利益相关(有扎实的民意基础)。•选好带头人(有归属感、有眼界、有情报、有话语权)。•开放组团(有规则、有规划、有担当、有纪律、有力量)。•要成为产业主链条中的关键一环。不谋全局者,不足谋一隅!不谋万世者,不足谋一时!河北师范大学AR重点实验室•亮风台创始人-廖春元博士•上海创业千人计划获得者•完成近亿元的B轮融资•推动中国AR产业化和国际化•专注于智能图像识别和视觉交互•推出AR开发引擎HIAR增强现实开发平台(包括HiARSDK、HiAR云识别以及HiAR管理后台)•AR智能眼镜HiARGlasses平台路线数字教育E-SchoolE-Class轻松课堂E-Vke易微课E-DataMining易分析E-Marking易改卷E-DistanceEdu易远程E-Comm易沟通领导管理辅导环节授课环节E-Sc

1 / 82
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功