类脑计算1CONTENTS深度学习处理器从脑机接口到脑机融合神经形态认知计算计算神经科学类脑计算的理念与实践2类脑理念与实践GeneralAI认知NarrowAI感知传统思想:认知科学了解大脑意识的形成模仿人脑设计算法(Empirical)当前思想:神经生物学了解大脑结构结构仿真形成一定规模的神经元网络再思考可以做什么(Heuristic)3类脑理念与实践感知:PerceptronLeNetAlexNetVGGGoogLeNetResNet认知:BrainScaleSNeurons4millionSynapses1billionPower10kWTrueNorthNeurons16millionSynapses4billionPower1WSpiNNakerNeurons460millionSynapses460billionPower50kWHumanBrainNeurons100billionSynapses100TeraPower20WDeeperthanDeeperBiggerthanBigger4上界:认知科学功能模拟类脑计算下界:神经科学解析仿真上确界:神经科学结构模仿类脑实践下确界:传统计算机体系结构类脑理念与实践5神经形态认知计算神经元状态方程:Hodgkin-Huxley方程6神经形态认知计算CMOS模拟:忆阻器:忆阻器是天然的突触模拟器件,生物突触释放Ca、Na离子改变传导性,忆阻器通过释放氧离子改变传导性。1个忆阻器可以模拟一个突触的行为。当前集成水平可以达到10GB/cm^2存储密度(近似人脑神经元密度),主频200MHz(比人脑脑电频率快10^6倍),未来可达到500G/cm2@1000MHz。7SpikingNeuronsandSpikingNeuralNetworkFunctionsandConsumption神经形态认知计算8ANNAssumedthatneuronsrepresentinformationthroughtheirmeanratesofactionpotentialfiring.NonLinear(Sum(…))SNNHowSpikesconveyinformation?Rate:spikecountwithinatimewindowTemporal:precisetime=timearray神经形态认知计算9FeatureMapSpatiotemporalPatternsClassificationSolved.HowtoCode?Unsolved.神经形态认知计算10ImplementingInstances神经形态认知计算11ImplementingInstancesConvolutionMaxPoolingSTDP(UnsupervisedLearninginFeatureExtraction)SupervisedLearningrulestofinetuningSpikingNetwork神经形态认知计算12STDPTheprocessadjuststheconnectionstrengthsbasedontherelativetimingofaparticularneuron'soutputandinputactionpotentials(orspikes).神经形态认知计算13ImplementingInstances神经形态认知计算14NeuronSoftware分子层面精细建模最大程度模拟神经元与突触行为对视网膜中央区域2mm范围内所有神经元进行建模天河2号超算辅助运算类脑理念与实践15SpikingArray时空关系上的连续性超高速视屏20,000Frame/sLineMotionIllusion视网膜与V1层功能区的协作产生线运动错觉V1区含有方向选择细胞V1区脑皮层之间的互联形成对位置方向的感知V1区脑皮层在无刺激输入时也会产生自发性放电现象类脑理念与实践16NeuralEncodingofMotionDirectionSingleNeuronNeuralPopulation计算神经科学CANNContinuousAttractorNeuralNetwork17DynamicalandAdaptiveInformationProcessingFromRatetoCorrelationCodeSFASpikefrequencyAdaptationNeuronalresponseattenuatesafterexperiencinglongtimefiring.Slownegativefeedbackmodulationtoneuronalresponse.TravelingWaveinCANNAmovingbumpinthenetworkwithoutrelyingonexternaldrive.计算神经科学18ThestrategyofthebrainEveryanimaladoptstoitsownoptimaltimescalesuitableforitsownsurvivalinthenaturalenvironment.Thebrainco-evolvesstrategiestocompensatedelays.WhyNeuralDelays?Toimplementtemporalcode.Tointegratemultiplesensorycues.Tointegratetemporalinformationovertimeforreliableresponding.WhyAdaptive?Respondingfasttoanovelobjectwithstrongindependentfiring-ratecode.Encodinginformationefficientlywithlowfrequencybutcorrelationcodelately.计算神经科学19深度学习处理器图像处理:GPU信号处理:DSP智能处理:DianNaoFamily未来的硬件设备可能都需要一个深度学习算法的硬件处理器目前GPU芯片每年出货量:0.64Billion产值:50Billion$NameSpeedupEnergyEfficiencyDianNao:1.1xGPU100xCPUDaDianNao:21xGPU330xGPUPuDianNao:1.1xGPU200xGPUShiDianNao:28.94xGPU4688xGPU320mW20深度学习处理器如何加速?把数据从内存搬运到硬件运算单元,甚至比运算本身更耗能量。小尺度但支持大规模神经网络速度:把访存带宽用起来,尽可能提高性能能耗:通过优化片上存储层次尽量减少访存次数21深度学习处理器DianNao16NeuronsWin8KBWout8KBWeight32KBDisadvantage:MemoryExchangeASPLOSBestPaper22深度学习处理器DaDianNao16Cores16Neurons全网络模型片上存储无内存访问EDRAMMICROBestPaper23深度学习处理器PuDianNao关注数据局部性设计专用功能器件三根柱子:InstBuf指令缓存HotBufColdBuf常见运算:向量内积向量距离计数非线性函数排序24深度学习处理器ShiDianNao集成在摄像头中的视觉处理器直接对输入图像进行识别理解消除DRAM读写操作?DaDianNao+可编程VLIW处理器结构25忆阻器阻变式存储器,RRAM被认为是电阻、电容、电感外的第四种基本原件耐久性高、传输速度快、更低的功耗、可擦写26Q&AThankYou27