余凯⼤大数据⼈人⼯工智能2014年8⽉月14⽇日,⿇麻省理⼯工学院科技评论杂志介绍百度的⼈人⼯工智能之梦⾃自诞⽣生第⼀一天起,百度就是⼀一家⼈人⼯工智能公司搜索数据MegaData商业价值Monetization⼤大数据⼈人⼯工智能Data-drivenAI⼈人⼯工智能,正在成为科技创新的主战场什么是⼈人⼯工智能?感知控制思考⽆无处不在的“智能XX”智能⽔水杯智能⼿手表智能⼿手环智能汤匙智能冰箱智能⼿手机如何区分这些产品是否真的智能?VS.随着经验演化,越变越聪明学习的能⼒力,是智能的本质!⼀一个时代正在来临移动设备上的摄像头,逐渐成为⼈人类眼睛的延伸移动设备上的摄像头,逐渐成为⼈人类眼睛的延伸201020082014201220042020200620162018电脑智能⼿手机平板联⺴⽹网设备联⺴⽹网电视联⺴⽹网汽⻋车可穿戴设备260亿互联设备移动时代万物互联40ZB数据量201020082014201220042020200620162018万物互联数据暴增数据来源:IDC万物互联万物智能⼤大数据时代深度学习为2013年⼗十⼤大技术突破之⾸首MITTechnologyReview,April23rd,2013深度学习迅速影响了最前沿的⾼高科技公司GoogleMicrosoftFacebook百度IDL–中国第⼀一家深度学习研发机构◆百度历史上第⼀一次成⽴立研究院◆InstituteofDeepLearning(IDL)◆聚焦⼤大数据驱动的⼈人⼯工智能国际上最早把深度学习上升为战略技术⽅方向的四家公司的之⼀一百度⼤大脑⽆无时不刻在学习和演进百亿级参数构建世界上最⼤大规模深度神经⺴⽹网络世界领先的深度学习算法:语⾳音识别,图像识别,⾃自然语⾔言理解,⼲⼴广告精准匹配,⽤用户建模,…百度⼤大脑,让连接变得更智能⼈人百度1.理解⽤用户意图:⽂文本分析,图像识别,语⾳音识别,…12.匹配⽤用户需求:优化搜索结果的智能排序,…信息23.精准推送⼲⼴广告和服务:估计和优化点击率和转化率,…⼲⼴广告服务3为什么深度学习受到重视?•模拟⼤大脑的⾏行为•特别适合⼤大数据•End-to-end学习•提供⼀一套建模语⾔言模拟⼈人类⼤大脑的分层结构以及⾏行为图像像素不同⽅方向的边界物体的各个部位整个物体深度学习特别适合⼤大数据12/12/2014统计和计算⽅方⾯面的原因Generalizationerrordecomposition●Approximationerror–modelclass●Estimationerror–datasize12/12/201424推广误差=A+E统计学习理论的范畴–假设无限计算资源Generalizationerrordecomposition●Approximationerror–modelclass●Estimationerror–datasize●Optimizationerror–algorithm12/12/201425CS的范畴:考虑计算的不完美推广误差=A+E+O●Approximationerror–modelclass:usecomplexmodel●Estimationerror–datasize:collectbigdata●Optimizationerror–algorithm:design“anOKalgorithm”12/12/201426Generalizationerrordecomposition推广误差=A+E+O数据规模效果传统⼈人⼯工智能算法深度学习算法⼤大数据和深度学习深度学习是⼀一套灵活的建模语⾔言LossLayerLayerLayerInputlabelLossLayerLayerLayerInput1labelInput2LossLayerLayerLayerInput1labelLayerLayerLayerInput2深⼊入百度⼤大脑:Adeepmodelforimagerecognition29深⼊入百度⼤大脑:DLmodelforquery-docrelevancePoolingPoolingQueryDoc1NNScore1PoolingPoolingQueryDoc2NNScore2LossRelevancepreferenceItuseslinearmemorycellssurroundedbymultiplicativegateunitstostoreread,writeandresetinformationInputgate:scalesinputtocell(write)Outputgate:scalesoutputfromcell(read)Forgetgate:scalesoldcellvalue(reset)深⼊入百度⼤大脑:Long-shorttermmemoryfortimeseries⺴⽹网上抢票验证码识别运单⼿手写电话号码识别述说图⽚片的故事Ayellowbusdrivingdownaroadwithgreentreesandgreengrassinthebackground.Livingroomwithwhitecouchandbluecarpeting.Theroomintheapartmentgetssomeafternoonsun.这些字幕是深度学习程序写的深⼊入百度⼤大脑:同时理解图像和⾃自然语⾔言深度学习的成功应⽤用深度学习显著提升了百度凤巢⼲⼴广告系统世界上⾸首次深度学习成功应⽤用于⼲⼴广告变现凤巢系统从浅层模型时代到深度模型时代显著提升CTR达XX.X%⽤用户百度⼲⼴广告主未⽤用深度学习⽤用了深度学习语义模型之后深度学习显著提升了百度搜索满意度领先优势世界上⾸首次将深度学习成功应⽤用搜索引擎迄今为⽌止深度神经⺴⽹网络作⽤用于⾃自然语⾔言最成功的例⼦子。VoiceSearchVoiceType-settingLBSvoiceserviceVoiceAssis-tantSpeechrecognitioninmanyproducts百度Google移动语⾳音搜索,世界⾸首屈⼀一指的中⽂文语⾳音识别率安静环境噪声环境Accuracy⾃自然图⽚片OCR:百度翻译⾃自然图⽚片OCR:百度作业帮涂书笔记–iOS应⽤用商店2014年度精选⾼高峰时⽤用户⼀一天上传9000万张照⽚片,连续三周iOS应⽤用商店总榜排⾏行第⼀一百度魔图:基于深度学习的⼈人脸识别技术百度魔图:基于深度学习的⼈人脸识别技术百度魔图:基于深度学习的⼈人脸识别技术百度魔图:基于深度学习的⼈人脸识别技术百度结果竞品结果输⼊入检索图⽚片百度拥有世界领先的基于内容的图像搜索技术百度拥有世界领先的基于内容的图像搜索技术输⼊入检索图⽚片百度结果竞品结果百度拥有世界领先的基于内容的图像搜索技术输⼊入检索图⽚片百度结果竞品结果百度拥有世界领先的基于内容的图像搜索技术百度拥有世界领先的基于内容的图像搜索技术0.380.40百度⾕谷歌全球最好的物体检测模型来源:ImageNetChallenge2014MeanAveragePrecisionNo.1No.2⼿手机百度v5.5–拍照实物搜索世界上第⼀一款基于深度学习的拍照实物搜索书籍蔬果玩具⼿手机百度v5.5–拍照实物搜索世界上第⼀一款基于深度学习的拍照实物搜索Logo服饰包包2014年⾕谷歌深度学习负责⼈人AndrewNg加盟百度MITTechnologyReview,May16th,2014“Ithought the best place toadvance the AImission is at Baidu”2014/12/1256⼈人互联⺴⽹网索引知识⼈人机交互物理世界传感器,3D建模百度⼤大脑DeepLearningPlatform⾼高性能计算搜索,⼲⼴广告,预测,决策智能硬件,机器⼈人,⾃自动驾驶探索发现,3D打印信息感知思考,学习决策,⾏行动,创造全景图:基于百度⼤大脑的⼈人⼯工智能HumanBrainvs.Supercomputer571.5kg,2%ofbodyweight,butconsume20%energy100billionneuronsEachneuronhas5000synapsesfiringrate:200persecondComputationcapacity:-10^11*5000*200=10^17=100petaflops-20W,5petaflops/wThemostpowerfulsupercomputer(天河⼆二号)-33.86petaflops-18*10^6w,2.14Gflops/w百度⾃自⾏行⻋车DuBike打造出互联⺴⽹网⽣生态下的环保、绿⾊色出⾏行的新体验通过DubikeOS系统(百度⼤大脑为核⼼心)助⼒力传统⾃自⾏行⻋车⼚厂实现智能改造百度⾼高度⾃自动驾驶项⺫⽬目RemodeledLBSstreet-viewcarTwoBMW335iLiDAR+Camera+Radar+GPS/IMUTheATVcarasaquicktestbed三维⾼高精度地图和感知定位•开发大规模的三维高精度地图技术(已完成G7和五环)•达到业界最领先精度10~20厘米•高精度定位是包括自动驾驶在内的很多应用的核心技术3DpointcloudsaroundtheBaiduheadquarterA3Dhigh-precisionmapoftheG7highwayCurbWeight:1650kgWheelbase:2.92mTurningCircle:11.8mGeometryandPhysicsParametersEngineModelandParametersBMWN55B303LTransmissionModelandParameters*byestimation百度⾃自动驾驶项⺫⽬目–动⼒力控制系统建模仿真SuspensionModelandParameters基于图像的实时道路场景理解•利用深度学习开发各种图像识别技术•低成本的摄像头和其他感知设备是关键(comparetoGoogle).SceneparsingwithCDNNReal-timevehicledetection从辅助驾驶到⾼高度⾃自动驾驶辅助驾驶主动安全特定条件下的⾃自动驾驶⾼高度⾃自动驾驶关于⼈人与机器VS.PK⼤大咖拍照写诗关于⼈人与机器图灵测试指导下的⼈人⼯工智能研究,致⼒力于研发能取代⼈人的机器导致机器和⼈人的PK关于⼈人与机器VS.关于技术的思考VS.伟⼤大的技术关于⼈人与机器-我的思考不在于让机器更伟⼤大⽽而在于让每个平凡的⼈人变得更伟⼤大世界是我们的,也是机器⼈人的,但归根结底,是属于会做机器⼈人的⼈人的