TMS320C55xDSP应用系统设计赵洪亮、卜凡亮、张仁彦、黄鹤松编著章节安排第1章绪论第2章TMS320C55x的硬件结构第3章TMS32055X的指令系统第4章TMS320C55x汇编语言编程第5章集成开发环境(CCS)第6章C语言程序设计第7章应用程序设计第8章C55x的片上外设第9章C55x应用系统的硬件设计第1章绪论本章内容提要:主要对数字信号处理器(DSP)进行简要介绍。DSP的基本概念DSP芯片的发展、特点、分类DSP产品概况1.1DSP的基本概念一个典型的数字信号处理系统抗混叠滤波A/D微处理器平滑滤波D/Ax(t)x(n)y(n)y(t)微处理器是数字信号处理系统的核心部件,通常采用DSP芯片,也可采用其它处理器芯片A/D与D/A转换器建立起了数字世界与现实模拟世界之间的桥梁。数字信号处理的特点灵活精确重复性好)1(...)1()()()(11010LnxhnxhnxhinxhnyLLii一个典型的数字信号处理算法—FIR滤波器乘与累加(MAC)是数字信号处理中的典型计算数字信号处理系统中微处理器的选择通用微型计算机(PC机)普通单片机(如MCS-51、96系列等)用专用集成电路(ASIC)DSP处理器优点:编程容易,便于实现缺点:速度慢、成本高、体积大,难以进行实时信号处理和嵌入式应用优点:成本低廉缺点:性能差、速度慢优点:速度高、大规模生产成本低;缺点:开发成本高、通用性差。针对数字信号处理的要求而设计,是数字信号处理系统设计中采用的主流芯片。优点:灵活、高速、便于嵌入式应用DSP的含义数字信号处理(DigitalSignalProcessing)数字信号处理的理论和算法数字信号处理器(DigitalSignalProcessor)实现数字信号处理算法的微处理器芯片1.2DSP芯片简介DSP芯片的发展历史、现状和趋势DSP芯片的特点DSP芯片的分类DSP芯片的应用领域选择DSP芯片考虑的因素1.2.1DSP芯片的发展历史、现状和趋势发展历史诞生于20世纪70年代末第一阶段,DSP的雏形阶段(1980年前后)1978年,AMI公司生产出第一片DSP芯片S28111979年,美国Intel公司推出商用可编程器件DSP芯片Intel29201980年,日本NEC公司推出μPD7720,第一片具有乘法器的商用DSP芯片1982年,TI公司成功推出其第一代DSP芯片TMS32010及其系列产品TMS32011、TMS320C10/C14/C15/C16/C17日本Hitachi公司第一个采用CMOS工艺生产浮点DSP芯片1983年,日本Fujitsu公司推出的MB8764,指令周期为120ns,具有双内部总线,使数据吞吐量发生了一个大的飞跃1984年,AT&T公司推出DSP32,是较早的具备较高性能的浮点DSP芯片第二阶段,DSP的成熟阶段(1990年前后)硬件结构:更适合数字信号处理的要求,能进行硬件乘法和单指令滤波处理,其单指令周期为ns。如:TI公司的TMS320C20和TMS320C30,CMOS制造工艺,存储容量和运算速度成倍提高,为语音处理、图像处理技术的发展奠定了基础。主要器件有:TI公司的TMS320C20、30、40、50系列,Motorola公司的DSP5600、9600系列,AT&T公司的DSP32等。第三阶段,DSP的完善阶段(2000年以后)信号处理能力更加完善,而且使系统开发更加方便、程序编辑调试更加灵活、功耗进一步降低、成本不断下降各种通用外设集成到片上,大大地提高了数字信号处理能力DSP运算速度可达到单指令周期10ns左右,可在Windows下用C语言编程,使用方便灵活广泛应用:通信、计算机领域,并渗透到日常消费领域DSP芯片的发展现状制造工艺存储器容量内部结构运算速度高度集成化运算精度和动态范围开发工具具有较完善的软件和硬件开发工具,如:软件仿真器Simulator、在线仿真器Emulator、C编译器和集成开发环境CCS等,给开发应用带来很大方便。CCS是TI公司针对本公司的DSP产品开发的集成开发环境。它集成了代码的编辑、编译、链接和调试等诸多功能,而且支持C/C++和汇编的混合编程。开放式的结构允许外扩用户自身的模块。普遍采用0.25μm或0.18μm亚微米的CMOS工艺。引脚从原来的40个增加到200个以上,需要设计的外围电路越来越少,成本、体积和功耗不断下降。芯片的片内程序和数据存储器可达到几十K字,而片外程序存储器和数据存储器可达到16M×48位和4G×40位以上。芯片内部均采用多总线、多处理单元和多级流水线结构,加上完善的接口功能,使DSP的系统功能、数据处理能力和与外部设备的通信功能都有了很大的提高。指令周期从400ns缩短到10ns以下,其相应的速度从2.5MIPS提高到2000MIPS以上。如TMS320C6201执行一次1024点复数FFT运算的时间只有66uS。集滤波、A/D、D/A、ROM、RAM和DSP内核于一体的模拟混合式DSP芯片已有较大的发展和应用。DSP的字长从8位已增加到64位,累加器的长度也增加到40位,从而提高了运算精度。同时,采用超长字指令字(VLIW)结构和高性能的浮点运算,扩大了数据处理的动态范围。DSP技术的发展趋势DSP的内核结构将进一步改善DSP和微控制器的融合DSP和高档CPU的融合DSP和FPGA的融合实时操作系统RTOS与DSP的结合DSP的并行处理结构功耗越来越低1.2.2DSP芯片的特点采用哈佛结构采用多总线结构采用流水线结构配有专用的硬件乘法-累加器具有特殊的寻址方式和指令支持并行指令操作硬件配置强,具有较强的接口功能支持多处理器结构程序存储器和数据存储器分开,有各自独立的程序总线和数据总线,可独立编址和独立访问。可同时进行取指令和多个数据存取操作,使CPU在一个机器周期内可多次对程序空间和数据空间进行访问,大大地提高了DSP的运行速度。在单指令周期内完成数字信号处理中用得最多的乘法-累加运算时钟取指令指令译码取操作数执行指令T1T2T3T4NN-1N-2N-3N+1NN-1N-2N+2N+1NN-1N+3N+2N+1N四级流水线操作1.2.3DSP芯片的分类按照数据格式定点、浮点按照字长大小16位、24位、32位按照不同生产厂家的产品系列TI公司的TMS320系列AD公司的ADSP21系列AT&T公司的DSP16/32系列Motorola公司的MC5600/MC9600系列NEC公司的µPD77系列等1.2.4DSP芯片的应用领域信号处理通信语音军事图形与图像仪器仪表自动控制医疗家用电器汽车1.2.5选择DSP芯片考虑的因素运算速度MAC、FFT、MIPS、MOPS、MFLOPS、BOPS价格硬件资源片内RAM、ROM数量,可扩展程序和数据空间,接口等运算精度(字长)定点:一般16位,少数24位浮点:一般32位,累加器为40位开发工具功耗其他因素1.3DSP芯片产品简介TI公司的DSP芯片概况其它公司的DSP芯片概况TMS320C5000概况1.3.1TI公司的DSP芯片概况经典产品TMS320C1X、TMS320C25、TMS320C3X/4X、TMS320C5X、TMS320C8X目前主流系列TMS320C2000,用于数字化控制领域TMS320C5000,用于通信、便携式应用领域TMS320C6000,音视频技术、通信基站1.3.2其它公司的DSP芯片概况AD公司的DSP芯片AT&T公司的DSP芯片Motorola公司的DSP芯片1.3.3TMS320C5000概况为16位定点整数DSP处理器迄今已有三代产品,即:TMS320C5x、TMS320C54x和TMS320C55x同代产品具有相似的CPU结构和不同的片上存储器和外围电路存储器、外围电路与CPU集成在一个芯片上,构成了一个单片计算机系统,降低整个系统的成本、体积,提高可靠性1.TMS320C54x概况采用改进的Harvard结构CPU结构192K字的存储空间片上外围电路典型指令周期1组程序读总线1组程序地址总线2组数据读总线1组数据写总线3组数据地址总线1个40位的算术逻辑单元(ALU)一个40位的筒形移位寄存器(barrelshifter)2个独立的40位累加器1个乘加器(MAC)单元1个用于Viterbi计算的比较、选择、存储(CSSU)单元1个指数编码器2个地址发生器单元64K字的程序存储空间,某些芯片有扩展的程序存储空间64K字的数据存储空间64K字的I/O接口空间软件可编程等待状态发生器可编程分区转换逻辑电路带有内部振荡器或外部时钟源的片内锁相环(PLL)发生器全双工操作的串行口带4位预定标器的16位可编程定时器主机并行接口(HPI)外部总线控制等25ns、12.5ns、10ns,对应的速度分别达到40MIPS、80MIPS、100MIPS2.TMS320C55x概况为C5000系列的最新一代产品,与C54x的源代码兼容与C54x相比处理速度明显提高、功耗明显降低在结构上复杂的多,采用近似“双CPU结构”如300MHz的C55x与120MHz的C54x相比,C55x的处理速度比C54x提高了5倍,功耗降到只有C54x的1/6。表1-1C55x与C54x的比较C54xC55xMAC12累加器24读总线23写总线12程序提取11地址总线46程序字长16位8/16/24/32/40/48位数据字长16位16位辅助寄存器ALU2(每个16位)3(每个24位)ALU1(40位)1(40位),1(16位)辅助寄存器88数据寄存器04存储器空间分块的程序/数据统一的空间