高速实时信号处理.主讲人:苏涛博士,教授研究方向:快速算法研究高速实时信号处理系统研究研究内容:并行实时信号处理机设计信号处理软件包和算法库数字信号处理器:DSP大规模可编程器件:FPGA/EPLD雷达信号处理重点实验室目录第一章实时信号处理概述信号处理的发展信号处理分类高速信号处理的实际需要信号处理的现状实时信号处理分类实时信号处理举例第二章实时信号处理的设计流程算法仿真DSP软件设计方法的变革Matlab仿真DSP软件设计Matlab下的DSP集成设计环境第三章基本原理和算法基本结构采样定理正交插值-数字正交采样数据格式谱分析和FFT数字滤波器设计卷积和相关的快速算法自适应信号处理矩阵运算图像和语音处理通信信号处理的常用算法雷达信号处理的常用算法第四章数字前端和后端设计射频收发子系统中频设计模拟数字转换数字模拟转换模拟、数字频率预处理第五章处理单元的实现方法多种数字信号处理器的比较并行处理器DSP处理系统设计过程FPGA/CPLD设计滤波器、FFT???Matlab与DSP开发的结合?????第六章多处理器系统设计系统拓扑结构选择性能指标开发难度第七章数据存储和通信运算和IO的平衡运算和IO的并行—DMA各种类型的存储器数据通信方式PCI/CPCI总线VME总线点对点通信LVDS技术第八章硬件设计高速电路设计的特殊性传输线效应电磁兼容和信号完整性同步和异步电路高速存储器负载匹配电源设计和电平转换模数混合电路第九章软件工程系统实现的软件化开发手段的演变DSP的程序设计和优化操作系统测试开发层次分化软硬件协同设计第十章实时信号处理系统的优化设计折衷设计效率、成本和兼容性功耗和散热抗干扰设计可靠性设计冗余设计加密优化改进进度估计第十二章系统设计的考虑第十三章系统设计实例滤波器设计电力信号监测设备图像处理通用信号处理机设计空时二维雷达自适应信号处理讲述这门课的目的:实时信号处理中的:系统设计、关键技术参考书:高性能DSP与高速实时信号处理:7、8章:算法应用、并行处理系统设计DSP接口电路设计与编程:2、3、4、5、6章:硬件选型、电路设计、系统设计第一章实时信号处理概述1.1信号处理的发展信号处理:信息的变换和提取,是将信息从各种噪声、干扰的环境中提取出来,并变换为一种便于为人或机器所使用的形式。从某种意义上说,信号处理类似于“沙里淘金”的过程:它并不能增加信息量(即不能增加金子的含量),但是可以把信息(即金子)从各种噪声、干扰的环境中(即散落在沙子中)提取出来,变换成可以利用的形式(如金条等等)。信号以多种形式存在于自然界中,信号处理可按多种形式进行。光信号经过透镜、偏振器可以得到处理。但通常所说的信号处理,几乎无例外地以电信号的形式进行。其他形式的信号可以通过传感器转化为电信号。电信号通常可以分为两大类:一类是时间和幅度都连续取值的模拟信号;另一类是时间和幅度只能取某些离散值的数字信号。所以,信号处理也分为模拟信号处理和数字信号处理两大类。由模拟信号处理发展到数字信号处理–二十世纪70年代以来,数字技术快速发展并普及数字技术的显著优点是:(1)高稳定性与高精度:与模拟系统相比,其特性不易受使用条件影响,稳定性、可靠性高,计算精度高以加法器为例,模拟电路采用了运放、电阻、电容。电源电压,阻、容误差,负载阻抗匹配,温度漂移都使加法结果不精确或不稳定。同样的电路,其电气特性无法一致。如存在1%的误差,调整校正很难--温度变化后,重新调整。数字电路:若采用16位定点,精度即可达到1/65536=1.5*10-5,若采用32位浮点,精度即可达到1.7*10-38(2)高度的灵活性:即可以通过在线重构(CPLD)或软件编程(DSP/PC)在相同的硬件上完成不同的处理功能。(3)便于大规模集成:随着微电子技术的发展,数字电路的集成度越来越高,使数字系统体积小,重量轻,可靠性高,且便于批量生产。(4)可以完成模拟系统无法具备的各种复杂处理功能。复杂的信号处理方法如自适应算法、小波。(5)便于存储和精确回放-验证;模拟信号用磁带存储,数字信号用磁盘存储,注意:存储同样质量的电视信号,磁带体积小于磁盘(目前),为降低容量,目前数字化后的电视信号质量不如原模拟信号。(6)便于系统联网,信息共享。广义的DSP概念:数字信号处理的简称。包括各种数字信号处理的算法,Matlab中的术语:诸如DFT及FFT变换,FIR数字滤波等;还指数字信号处理得以实现的硬件设备,即各种数字信号处理系统。狭义的DSP概念:专门指DSP处理器芯片。如TI公司的TMS系列芯片,ADI公司的SHARC系列芯片等。本课程中的DSP概念指DSP处理器芯片,它与CPU、FPGA并列作为数字信号处理的关键硬件核心。1.2信号处理分类理论分析和仿真计算:预先研究,模拟分析,系统设计前的仿真,事后分析计算机/工作站:PC,巨型机,单台/多机/网络Fortran,C,Matlab都是数字信号处理。侧重于分析、验证、测试、模拟实时信号处理:在限定的时间内,现场处理-特定的时间、地点小迟延,专用型,体积/功耗小,成本低大多数是嵌入式系统,脱离PC/:DSP/单片机/FPGA,A/D,D/A移动便携式少数是计算机EDA,DSP开发工具,FPGA开发环境,调试仪器都是数字信号处理•许多信号处理的应用都需要两步:第一步:从理论分析和仿真计算开始,前期预研第二步:发展到实时信号处理。从侧重于算法的搜索、优化、验证,到在实际环境中实现它。•两步在方法上的区别:–第一步,分析性能,–第二步,可行性如何,可靠性/成本/体积1.3高速信号处理的实际需要理论分析和仿真:科学计算、地质分析、气象预测、仿真模拟、图像处理,需要每秒几十亿到几千亿次运算;要模拟的系统越来越大,越来越细致/逼真模拟核武器实验:每秒千亿次运算,一个月。模拟实况超级巨型计算机,IBM的每秒万亿次运算的ASCIIWhite,体积两个篮球场,功耗相当于一个中等城镇前身:深蓝计算机,国际象棋比赛。运算能力(智力)与硬件和软件都有关新理论和新方法:性能好,复杂度和运算量很大-不断提高的PC:3GHz实时信号处理领域实时性强,迟延小,体积小,功耗小,成本低通信和语音信号:每秒几千万到几亿次运算,手机视频信号和图象:每秒几亿到几十亿次运算,网络图像传输工程应用:导航,探测,识别尖端技术:航空、航天、武器控制雷达、声纳信号:每秒几十至几百亿次运算。新方法,扩大的应用领域,军用转民用1.4信号处理的现状•客观基础条件:–大规模集成电路(VLSI)设计手段和制作工艺提高:工艺:0.1um集成度:1000万门速度:3GHz单机处理能力以10年100倍的速度增长;出现每秒运算80亿次的运算单元单片设计利用了并行的两种手段:流水线、片内多部件并发工作单机性能受限于:VLSI器件开关速度、片芯内部连线迟延、理论特征尺寸1978年Intel公司推出8086—现在的PentiumIV处理器(这并不是当前最快的处理器,而是最普及的高速处理器),20多年的时间里,CPU的速度是以超线性加速度提高的。在提高的这27000倍里,540倍来自于时钟频率的提高,另外50倍来自于处理器结构的改进和变革。8086执行一条指令需要15个时钟周期,而Pentium一个时钟周期可执行3条指令。•计算机体系结构的更新:多机处理,分布式并行处理•软件技术的扩展:底层次到高层次独立开发到协同开发、系统集成通用并行计算机:几百~几千个处理单元每秒几千亿次运算(峰值速度)商用化CM-5E:2600亿次运算/秒ParagonXR/S:1500亿次运算/秒SP2:1360亿次运算/秒美国“高性能计算与通信计划”;ASCIIWHITE:万亿次/秒计算机欧洲“万亿次计算机计划”日本3800亿次/秒计算机实时信号处理:语音处理芯片:单片每秒亿次运算图象处理专用芯片:单片每秒几十亿次运算无线通信基站及软件无线电:每秒几十亿次运算空时二维信号处理(STAP):大规模并行处理(MPP)STAP系统的EHPSCS:每秒几十亿次浮点运算脉动阵/波前阵:ASIC技术,几十~千个处理单元,每个0.1~1亿次运算/每秒1.5实时信号处理分类(1)按处理形式流水处理:逐点处理,FIR,IIR,DFT,DBF简单,迟延小批处理(块处理):分批处理,数据到齐才开始,结果也同时输出。FFT,相干积累迟延大,运算量小,要求存储器大,系统复杂选择处理形式是由:处理要求/特点决定的:吞吐率,迟延其次也受性价比影响:当两种形式都能满足要求时,选择低性价比。举例:谱检测,FFT:Nlog(N)DFT:N2全检测)(检测8点)N=643844096512N=10241000010000008192对慢变信号、大量频率点检测时,批处理方式的FFT算法成本低。对快变信号、少量频率点检测时,流水DFT处理方式性能好,成本低。电话拨号中的DTMF检测(12/16键,8音:4高+4低构成16种键);对DFT算法改进DFT递推算法,更新速度更快,及时监测出信号频率的变化FFT的流水算法,运算量太大,滑动/部分重叠算法A/D模模模模采样DSP逐点输入逐点输出A/D模模模模采样DSP逐点输入逐点输出模模模模模模模模第1批第3批第2批第1批第3批第2批小波短时FT当采样率一定时,对快变信号的检测容易/及时,而对慢变信号反而较难-积累时间很长。对周期信号,采样整数倍周期时间电力信号中50Hz,100Hz,150Hz,200Hz......,1000Hz采样率为8KHz,检测50Hz,需要采够20ms的整数倍,存储160点以上采样率为8KHz,检测1000Hz,需要采够1ms的整数倍,存储8点以上频率分辨率*时间分辨率恒定df*dT=pi/4(2)按实现方法硬件:FPGA,ASIC,固定、简单,吞吐率高软件:PC、DSP、单片机,灵活,吞吐率低(3)按实现途径完全开发:从底层到系统集成:购买现成的板卡,操作系统、库,软件开发,集成不进行底层设计开发周期短、难度低、体积大、成本高。与PC等大量生产的设备的区别:外购成品的成本高于自行设计(3)按规模分类单片/单板:简单多片/多板:同构,异构;流水、并发(4)按应用分类消费产品:最关心成本,体积小;批量大,采用专门设计尖端国防:性能第一1.5实时信号处理举例数码相机-视频压缩,再存储VCD/DVD-视频解压,每秒25-30Frame/s通信:语音编解码-压缩/解压、传输数字化监控:视频压缩卡,传送或存储,用计算机解压回放可视门铃:综合上述技术,实时性要求比上述都强。A/DYUV模模CodecSPMIC摄像头SAA7113串口视频压缩音频压缩音频解压网络接口门口端实时处理设备原始码流10FRAME/s*320*240*8bit=768KB/s原始码流16KB/s*2D/ARGB模模CodecSPMIC串口视频解压音频压缩音频解压网络接口家庭端实时处理设备输出码流10FRAME/s*320*240*8bit=768KB/s原始码流16KB/s*2LCD网络容量10Mb/s=1.25MB/s模模模模模模模模模模模模探测:便携式仪器进行实地操作,道路地基,堤坝漏洞缝隙防撞雷达:汽车,毫米波导航GPS:接收卫星信号导弹制导:收发信号、目标跟踪、识别、自毁。。。。。。上述例子都不便于用PC机作为处理平台。实时信号处理系统完整的设计流程如下,可删减1提出处理要求2建立模型,分析仿真,搜索算法,采用MATLAB工具:算法性价比折衷:性能好,可实现性强-运算量不大确定A/D位数,采样速率,算法,硬件选型,然后进行尽可能细致的仿真验证。反复进行比较,避免后期修正这一步,25%时间,在增加3硬件设计:15%时间,在减少选型A/D转换数字信号处理:以DSP/FPGA为核心,DSP+FPGA+存储器D/A变换输入/输出接口和控制高速电路设计第二章实时信号处理的设计流程4软件设计:15%时间采用可编程器件,DSP的高级语言和汇编语言设计5软硬件联合调试:25%时间调试工具:PC、仪器6系统测试、改进:20%时间可靠性分析;简化,