参考书(1)TMS320LF240xDSP硬件开发教程,江思敏,机械工业出版社。(2)TMS320LF240xDSP应用程序设计教程,清源科技,机械工业出版社。(3)TMS320LF240xDSP结构、原理及应用,刘和平,北京航空航天大学出版社.(4)TMS320LF/LC24系列DSP的CPU与外设,徐科军等编译,清华大学出版社。学时:32理论+17实验考核:考试(70%)+平时成绩(10%)+实验成绩(20%)要求:出勤、请假、作业、课堂纪律、实验报告第1章数字信号处理器(DSP)综述1.1什么是DSPDSP-DigitalSignalProcessor(数字信号处理器)特别适合于实现各种数字信号处理运算的微处理器。数字信号处理技术过去受集成电路技术和数字化器件发展水平限制,只限于理论概念的讲授和仿真。早期-在计算机上仿真,算法实现。现在-在DSP上实时处理DSP也可是DigitalSignalProcessnig(数字信号处理)的缩写,国内常用DSP代表数字信号处理器。由于DSP具有:(1)丰富的硬件资源、(2)改进的并行结构、(3)高速的数据处理能力和功能强大的指令系统,已成为世界半导体产业中紧随微处理器与微控制器(单片机)之后的又一个热点在通信、航空、航天、机器人、工业自动化、自动控制、网络及家电广泛的应用。1.2DSP技术的发展及现状1965年,快速傅立叶算法(FFT),使傅立叶分析的速度提高了数百倍,为数字信号处理的应用奠定基础。但由于当时的计算机技术和数字电路技术发展水平的限制,FFT应用受到限制。20世纪70年代,由于集成电路技术的发展,使用硬件实现FFT和数字滤波的算法成为可能。1978年,AMI公司宣布第一个DSP问世,但人们一般认为,20世纪70年代后期推出的Intel2920才是第一片具有独立结构的DSP。1981年,美国德州仪器(TI)公司研制出了著名的TMS320系列的首片低成本、高性能的DSP-TMS320C10。使DSP技术向前跨出了意义重大的一步。DSP主要厂商:美国TI、ADI、Motorola、Zilog等公司。TI公司位居榜首,占全球DSP市场约60%左右。尽管当前的DSP技术已达到较高的水平,但在一些实时性要求很高的场合,单片DSP的处理能力还是不能满足要求。因此,多总线、多流水线和多处理器并行就成为提高系统性能的重要途径之一。许多公司在提高单片性能的同时,在结构上为多处理器的并行应用提供方便。随着DSP的处理速度越来越快,功耗也随越大,特别是在电池供电的便携式及嵌入式小型或微型设备中的大量使用,都迫切要求DSP在提高工作性能的同时,降低工作电压,减少功耗。为此,各DSP厂家积极研制并陆续推出多种低电压、低功耗芯片。例如,TI公司的TMS320VC5416,内核工作电压只有1.5V,有的DSP设置了多种节能等待状态。低电压和低功耗已成为DSP的重要技术指标之一。在DSP芯片向着高性能、高速、低功耗方向发展的同时,数字信号处理理论也在不断地发展。(1)自适应滤波、卡尔曼滤波、同态滤波等理论逐步成熟和应用,以及各种快速算法。(2)声音与图像的压缩编码、识别与鉴别。(3)加密解密,调制解调,信道辨别与均衡,智能天线,频谱分析等算法。1.3DSP的应用诞生以来,已被广泛地应用在各个领域。当今的DSP应用市场上,通信设备和网络、多媒体技术等是最大的用户。从DSP的一个最典型的应用-手机,就可见DSP的应用市场之大。主要应用:(1)数字信号处理运算:快速傅立叶变换(FFT),卷积,数字滤波,自适应滤波,相关,模式匹配,加密等。(2)通信:调制解调器,自适应均衡,数据加密,数据压缩,扩频通信,纠错编码,传真,可视电话等。(3)网络控制及传输设备:网络功能和性能的不断提高,如视频信箱、交互式电视等,要求更宽、更灵活的传输带宽,实时传输和处理数据的网络控制器、网络服务器和网关都需要DSP的支持。(4)语音处理:语音编码,语音合成,语音识别,语音邮件,语音存储等。(5)电机和机器人控制:在单片内集成多个DSP处理器,可采用先进的神经网络和模糊逻辑控制等人工智能算法。机器人智能的视觉、听觉和四肢的灵活运动必须有DSP技术支持。(6)激光打印机、扫描仪和复印机:DSP不仅仅是控制,还有繁重的数字信号处理任务,如字符识别、图像增强、色彩调整等。(7)自动测试诊断设备及智能仪器仪表、虚拟仪器:现代电子系统设备中,有近60%的设备及资金是用于测试设备,自动测试设备集高速数据采集、传输、存储、实时处理于一体,是DSP又一广阔应用领域。(8)图像处理:二维、三维图形处理,图像压缩、传输与增强,动画,机器人视觉,模式识别等。(9)军事:保密通信,雷达处理,导航,导弹制导。如机载空-空导弹,内装有红外探测仪和相应的DSP处理部分,完成目标的自动锁定与跟踪,战斗机上的目视瞄准器和步兵头盔式微光仪,需要DSP完成图像滤波与增强,智能化目标的搜索、捕获。(10)自动控制:机器人控制,磁盘控制,自动驾驶,声控,发动机控制等。(11)医疗仪器:助听,诊断工具,超声仪,CT,核磁共振。(12)家用电器:数字电话,数字电视,音乐合成,音调控制,玩具与游戏,高保真音响,数字收音机、数字电视等。(13)汽车:防滑刹车,引擎控制,伺服控制,振动分析,安全气囊的控制器,视像地图等。一辆现代的高级轿车上,有30多处电子控制设备上用到了DSP技术。(14)多媒体个人数字化产品:数码相机,MP3,掌上电脑,电子辞典,数码录音笔,数码复读机等。1.4DSP与单片机、嵌入式微处理器的区别DSP、单片机以及嵌入式微处理器都是嵌入式家族的一员。最大区别是DSP能够高速、实时地进行数字信号处理运算。数字信号处理运算的特点是乘/加及反复相乘求和(乘积累加)。为了能快速地进行数字信号处理的运算,(1)DSP设置了硬件乘法/累加器,(2)能在单个指令周期内完成乘/加运算。(3)为满足FFT、卷积等数字信号处理的特殊要求,目前DSP大多在指令系统中设置了“循环寻址”及“位倒序”寻址指令和其他特殊指令,使得寻址、排序的速度大大提高。DSP完成1024复点FFT的运算,所需时间仅为微秒量级。高速数据的传输能力是DSP高速实时处理的关键之一。新型的DSP设置了单独的DMA总线及其控制器,在不影响或基本不影响DSP处理速度的情况下,作并行的数据传送,传送速率可达每秒百兆字节。DSP内部有流水线,它在指令并行、功能单元并行、多总线、时钟频率提高等方面不断创新和改进。因此,DSP与单片机、嵌入式微处理器相比,在内部功能单元并行、多DSP核并行、速度快、功耗小、完成各种DSP算法方面尤为突出。单片机也称微控制器或嵌入式控制器,它是为中、低成本控制领域而设计和开发的。单片机的位控能力强,I/O接口种类繁多,片内外设和控制功能丰富、价格低、使用方便,但与DSP相比,处理速度较慢。DSP具有的高速并行结构及指令、多总线,单片机却没有。DSP处理的算法的复杂度和大的数据处理流量更是单片机不可企及的。嵌入式微处理器的基础是通用计算机中的CPU(微处理器),是嵌入式系统的核心。为满足嵌入式应用的特殊要求,嵌入式微处理器虽然在功能上和标准微处理器基本是一样的,但在工作温度、抗电磁干扰、可靠性等方面一般都做了各种增强。与工业控制计算机相比,嵌入式微处理器具有体积小、质量轻、成本低、可靠性高的优点,但是在电路板上必须包括ROM、RAM、总线接口、各种外设等器件,从而降低了系统的可靠性,技术保密性也较差。DSP、单片机以及嵌入式微处理器三者各有所长,技术的发展使得DSP、单片机、嵌入式微处理器相互借鉴对方的优点,互相取长补短。1.5DSP的基本结构及主要特征DSP是一种具有特殊结构的微处理器,为了达到快速进行数字信号处理的目的,DSP的总线结构大都采用了程序和数据分开的形式,并具有流水线操作的功能,单周期完成乘法的硬件乘法器以及一套适合数字信号处理运算的指令集。DSP的基本结构及主要特征如下。1.程序和数据分开的哈佛结构就是将程序和数据存储在两个不同的存储空间中。程序存储器空间和数据存储器空间分别独立编址。传统的冯.诺依曼结构是程序存储器和数据存储器共用一个公共的存储空间和单一的地址和数据总线,程序和数据都从同一数据线输出,依靠指令计数器中提供的地址来区分是指令、数据还是地址。取指令和取数据都访问同一存储器空间、使用同一数据线,所以读程序和取指令不能同时进行,数据的吞吐率低。在哈佛结构中,由于程序存储器和数据存储器分开,即每个存储器空间独立编址、独立访问,并具有独立的程序总线和数据总线,取指令执行指令能完全重叠进行。现在的DSP普遍采用改进的哈佛结构,其结构、特点如下:(1)允许数据存放在程序存储器中,并被算术指令运算指令直接使用,增强了灵活性。(2)指令存储在高速缓冲器(Cache)中,当执行本指令时,不需要再从存储器中读取指令,节省一个机器周期的时间。2.流水线操作由于DSP芯片采用多组总线结构,允许CPU同时进行指令和数据的访问。因此,可执行流水线操作。执行一条指令,要经过取指、译码、取数、执行运算,需要若干个指令周期才能完成。流水线技术是将各个步骤重叠起来进行。即第一条指令取指、译码时,第二条指令取指;第一条指令取数时,第二条指令译码,第三条指令取指,依次类推。例如,LF240x就可以实现4级流水线操作(图1.1)。3.专门的硬件乘法器和乘加指令MAC在数字信号处理的算法中,大量的运算是乘法和累加,乘法和累加要占用绝大部分的处理时间。例如,数字滤波、卷积、相关、向量和矩阵运算中,有大量的乘法和累加运算。个人计算机:计算乘法需要多个周期用软件实现,DSP:设置了硬件乘法器以及乘加指令MAC,在单周期内取两个操作数一次完成乘加运算。4.特殊的指令指令系统中,专为实现数字信号处理的算法设置了专门的特殊指令。例如:DMOV指令,把指令的数据复制到该地址加1的地址中,原单元的内容不变,即数据移位,相当于数字信号处理中的延迟,例如x(n)的延迟为x(n-1)。5.丰富的片内存储器件和灵活的寻址方式片内集成Flash和双口RAM,通过片内总线访问这些存储空间,因此不存在总线竞争和速度匹配问题,从而大大提高了数据的读/写速度。6.独立的直接存储器访问(DMA)总线及其控制器DSP为DMA单独设置了完全独立的总线和控制器7.高速的指令运行周期采用上述措施,DSP指令周期可为几十ns至几ns,甚至1ns以下。1.6DSP的分类及主要技术指标1.6.1DSP的分类DSP一般按以下三种方式分类。1.按数据格式分可分为定点芯片和浮点芯片两种。定点DSP芯片按照定点的数据格式进行工作,其数据长度通常为16位、24位、32位。定点DSP的特点:体积小、成本低、功耗小、对存储器的要求不高;但数值表示范围较窄,必须使用定点定标的方法,并要防止结果的溢出。浮点DSP芯片按照浮点的数据格式进行工作,其数据长度通常为32位、40位。由于浮点数的数据表示动态范围宽,运算中不必顾及小数点的位置,因此开发较容易。但它的硬件结构相对复杂、功耗较大,且比定点DSP芯片的价格高。2.按照用途分类DSP按照用途分类可分为:通用型和专用型。通用型:适用于普通的数字信号处理应用。专用型:适用于不同的数字信号处理运算或特定的应用场合。例如,数字卷积、数字滤波、FFT等。1.6.2DSP的主要技术指标种类繁多,结构差别大,不同厂商的产品指标甚至不具备可比性,因此,下述技术指标只是从不同角度描述了DSP的处理能力或技术性能,仅作为系统设计时的一种参考。1.时钟频率要考虑两个方面:一是DSP内部工作主频,真正的工作频率。一般是内部主频越高,DSP的数据处理速度越快。另一个是DSP的外部时钟频率,这是DSP片外所加的实际时钟频率,这个时钟频率一般要经过DSP内部的锁相环倍频至DSP的内部工作主频。外部时钟频率低有利于减少外部电路间的干扰,使PCB布线容易。所以一般是外部时钟频率低(减少干扰),内部时钟频率高(提高处理速度)。2.机器周期执行