DDR4存储器关键技术分析王小玲(东南大学无锡分校,江苏无锡,214135)摘要:随着DDR4SDRAM内存技术标准的发布,其在内存领域将会引起越来越多的关注,因此对DDR4内存进行深入分析很有必要。本文从计算机硬件技术分析的角度,结合与DDR3的比较,对DDR4内存的关键技术进行了初步系统的分析。关键字:DDR4;DDR3;高速率;低功耗;技术分析AnalysisofDDR4SDRAM’sessentialtechnologyWangXiaoling1,LiBing2(1.WuxiBranchofSoutheastUniversity,WuxiJiangsu,214135;2.SchoolofIntegratedCircuits,SoutheastUniversity,NanjingJiangsu,210096)Abstract:WiththepublicationofDDR4SDRAMmemorytechnologystandard,itwillattractmoreandmoreattentionsinthefieldofmemory.Soitisnecessarytomakein-depthanalysisofDDR4memory.Fromtheperspectiveofcomputerhardwaretechnologyanalysis,combinedwiththecomparisonwithDDR3,thisarticleanalyzesthekeytechnologiesofDDR4memorypreliminarily.Keywords:DDR4;DDR3;Highdatarate;Lowpowerconsumption;Technicalanalysis在无数的电子产品发展中,从电脑到游戏机到电视再到通讯设备,半导体存储器都发挥着重要的作用。JEDEC(JointElectronDeviceEngineeringCouncil)标准包含了如今半导体存储器市场上每一个关键特征。微电子产业标准机构JEDEC固态技术研究会在2012年9月发布了下一代同步DDR内存技术标准:DDR4。它规定了更高性能和稳定性以及更低的功耗。相对于以前几代的DRAM内存技术,又是一次新的突破。目前,DDR3SDRAM广泛用作PC机和服务器的内存。但是,随着诸如智能手机、平板电脑等移动设备的迅猛增长,我们需要大量的服务器系统。并且,网络带宽容量和多媒体容量越来越高,这些都驱使我们开发更高性能服务器系统[1]。内存是服务器系统的关键部分之一,这就促使了新一代低功耗高性能的DDR出现——DDR4。三星早在2011年初便推出了30nm到39nm工艺下2GBDDR4内存模组,而Hynix海力士(现代旗下)也与同年4作者简介:王小玲,(1988-),女,硕士研究生,E-mail:w123xl@126.com月推出了2400MT/s的2GBDDR4。2012年9月新思科技公司(Synopsys)宣布其DesignWareDDR接口IP产品组合已经实现扩充,以使其包括了对基于新兴的DDR4标准的下一代SDRAM。同月,Cadence公司也宣布,其DDR4SDRAMPHY和存储控制器DesignIP的首批产品在TSMC的28HPM和28HP技术工艺上通过验证[2]。DDR4提供了一系列创新特性来获得高的速度和广阔的应用包括,服务器、笔记本、台式机和消费类产品。因此,研究DDR4的技术标准,具有十分重要的意义。1DDR4与DDR3不同之处DDR4SDRAM将是下一代电脑和服务器的内存。相比目前的DDR3SDRAM,DDR4内存技术具有更高的性能、更好的稳定性和更低的功耗的优势,进步显著。1.1基本特征表1是DDR4内存与DDR3内存的一些基本参数对比。表1DDR4与DDR3基本参数对比SpecitemsDDR3DDR4Speed1.6~2.1Gbps1.6~3.2GbpsDensity512Mbp~8Gb2Gb~16GbVoltage(VDD/VDDQ/VPP)1.5V/1.5V/NA(1.35V/1.35V/NA)1.2V/1.2V/2.5VVrefExternal(VDD/2)Internal(training)DataIOCTT(34ohm)POD(34ohm)#ofbanks816(4BG)Pagesize1KB/1KB/2KB512B/1KB/2KBDDR4内存沿袭了DDR的本质架构,它的首要任务就是提升传输频率,其它的很多改进也都与此息息相关。DDR4的数据传输速度比DDR3快了一倍,它的起始数据传输率为1.6GT/s,初期最高值为3.2GT/s,也就是相当于最低DDR4-1600、最高DDR4-3200。考虑到DDR3已经大大超过了最初设计的1.6GT/s,DDR4日后速率继续提升的可能性也是非常大的,预期最高传输速率可达到6.4GT/s[3]。除了提高速率以外,降低电压也是每一代DDR内存的任务,这是降低功耗的主要因素之一。DDR3的电压标准为1.5V,DDR4将标准电压降低到了1.2V,也就是新的JEDECPOD12接口标准(工作电压1.2V),未来还有望进一步下调。值得一提的是当前很多的移动智能终端都已采用了1.2V的低功耗(如LPDDR)内存。而下一代产品LPDDR3,将能在现有的基础上降低35%至40%的功耗,但它的成本会比DDR4高出40%(LPDDR产品生产成本更为昂贵)[3]。此外,DDR4还增加了一个2.5V的辅助电源Vpp来降低电荷充放电时的负荷。DDR4数据总线中的一个显著变化是参考电压VREFDQ从外部集成到内部,这是与终端截止方案的改变配合改变的。新的终端截止方案放弃原来的从中间抽取终止CTT(CenterTappedTermination),采取了“伪开漏”POD(pseudoopendrain)方式。换句话说,在DDR4中数据总线的终止电压不是VDDQ的一半,而是可以转移终止到等于VDDQ,这样做可以降低寄生引脚电容和I/O终端功耗,并且即使VDD电压降低的情况下也能保证稳定。POD技术也用于显卡内存GDDR5(GraphicsDDR5)中,有效的降低了功耗。不同于GDDR5的是,DDR4的通道环境可以随着系统架构的改变而改变[3]。这就需要不同的参考电压供选择,因此把参考电压集成到内部。DQ0~DQ3中的任意一位可用来表示内部参考电压Vref,根据供应商确定使用哪个DQ表示。1.2核心架构表2DDR4与DDR3的核心架构ItemsDDR3DDR4#ofBK816(x4/8),8(x16)#ofBG-4(x4/8),2(x16)Pagesize1KB(x4/8),2KB(x16)512B/x4,1KB/x8,2KB/x16Package78/96ballsFBGA0.8mmpitchSameasDDR3Module240pin/204pin284pin/256pinORGx4/8/16/32SameasDDR3TypeSO-DIMM/U/R/LRSameasDDR3DDR、DDR2、DDR3分别是2n、4n、8n预取,每一代都翻一番,但是DDR4依然停留在了8n预取上,也就是内部数据率是外部频率的1/8。Bank群组结构是一个8n预取群组结构,它可以使用两个或者四个Bank组,这允许DDR4内存在每个Bank群组单独被激活、读取、写入或刷新操作,这样可以带来更高的内存和带宽,尤其是在小容量内存颗粒的时候。DDR4的单个内存颗粒容量为2Gb-16Gb,DDR3最高为8Gb。同时提供了三种数据宽度:X4,X8和X16。DDR3里的所有Bank都是共享I/O栅极结构的,DDR4则进行了分组优化调度,不同分组之间的写入-读取转换速度会更快。DDR3有8个bank,DDR4在X4/X8下有16个bank,分为4个bank组,每个组4个bank。X16下有8个bank,2个bank组,每组4个bank。在不提高突发长度的前提下,Bank组结构对于提高数率非常重要。按照之前的惯例,DDR内存的突发长度总是比前一代提高一倍。它来自于这样一个事实,内存的核心操作周期基本固定在5ns。通过双倍预取数据和突发长度,DDR3的数率从DDR2的800MT/s提高为1600MT/s。但是,突发长度提到16时,对大多数系统而言都太长了。因此,DDR4采用了bank组的结构,如果不采用bank组的交叉访问,DDR4的最高带宽将无法实现。在相同的频率下访问不同的bank组中的bank,命令时间间隔commandtocommand(CCL)将比访问同一个bank组中的bank减小一半[1-3]。1.3功能特性表3DDR4的功能特性ItemsDDR4NoteCMDencodingVKeeppincountPreambletrainingVSpeedCALVPowerInternalDQVrefVSpeed/PowerLowPowerArraySelfRefreshVPowerTemperatureControlledAutoRefreshVPowerCAparitycheckVReliabilityCRCVReliabilityDBIVPowerMaxpowersavingVPower2tCKpreambleVSpeedGeardownmodeVSpeedPerDRAMAddressabilityVPower/SpeedMPRreadoutVReliabilityODTControlVSpeedFinegranularityrefreshVPower/EfficiencyBoundaryScanVReliabilitySingleloadstackingVPower/SpeedFastSRexitVEfficiencyAndmore…注:“V”代表valid。正常和动态的ODT:改进ODT协议,并且采用新的ParkMode模式可以允许正常终结和动态吸入终结,而不需要去驱动ODTPin。数据总线倒置(DBI):可降低IO功耗并且通过降低同时切换输出SSO(SimultaneousSwitchOutput)提升数据信号完整性。用DBI_n信号标志传输数据是否翻转:DBI_n为低表示数据在DDR4中已经翻转过,为高则表示没有翻转是原数据。写操作DBI有效时,内存翻转输入的数据。读操作DBI有效时,此时必须有数据第0位上的一个字节值大于4,才翻转数据,否则不翻转[4]。GDDR5DRAM中也使用了DBI技术,但是,具体细节和需求不同。作为主存,面积和电流降低对比于成本高的GDDRSDRAM而言更重要。为了保证数据即使在高频下的稳定传输,DDR4采用了双重错误检测方案,即针对数据通道的CRC(cyclicredundancycheck)循环冗余校验方案和针对命令地址通道的CA(Command/Address)Parity奇偶校验。新的数据总线循环冗余校验技术在写操作时支持,在读操作时不支持。写入CRC可以在DDR4数据总线上提供实时的错误检测,保证数据传送的完整性,特别对非ECC内存进行写入操作时有帮助。在DDR4内存中,CRC是基于72比特、突发长度固定为8的,这72比特由64位突发数据加上8位CRC组成。通过设置模式寄存器,CRC编码被加到突发数据的末尾。DDR4并不是第一个使用CRC方案的内存,在GraphicsDDRDRAM中早就使用了。如果有CRC错误,内存阻塞写操作并丢弃数据[4]。通过MR5使能奇偶校验功能。奇偶校验会带来延时,延时由MRS配置。通过设置模式寄存器可以让DBI引脚为DM引脚。DDR4用ALERT_n引脚标记CRC错误和命令地址奇偶校验错误。在错误之后,ALERT_n信号变低,经过内部一段时间后恢复成高。1.4模组架构方面的改变表4DDR3与DDR4模组架构ItemsDDR3DDR4DIMMPinCount(PinPitch)240pin(1.0mm)204pin(0.6mm)284pin(0.85mm)256