DSP并行处理系统的设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

DSP并行处理系统的设计我从中国知网上找了篇论文——《多DSP并行处理系统的设计与开发》。在简单阅读后,我结合并行处理与分布式系统这一课程,谈谈自己的一些理解和收获。虽然DSP技术得到了飞速的发展,出现了高速DSP芯片,但是在图像、视频以及大数据处理场合地方,使用单个DSP芯片还往往还是显得捉襟见肘,不能满足系统的需求,这就迫切需要把多个DSP组成互联系统,以增强整体数据处理能力减少任务的执行时间。各DSP厂家为适应这种需求,先后推出了并行DSP。并行DSP在传统DSP基础上提供了如下两大功能:与外部设备交换数据的外部总线、串口、中断、握手等信号线;专门的并行控制口线,能够方便地构成多DSP并行处理系统。多DSP并行处理系统的基本性能取决于组成系统的几个要素:处理单元、并行处理系统网络结构、并行算法、任务分配方法,他们之间紧密联系、互相依赖。多DSP并行处理系统设计的核心是实现多DSP之间的通信控制及数据交换。并行处理系统网络包括处理单元通信口、矩阵开关组成的网络硬件,以及控制路由选择、消息转发、虚通道等操作的网络软件。其功能主要是为各处理单元提供数据交换的通道,并负责子任务传送和控制调度信号的传递。处理单元之间的网络结构大致可分为两类:一种是共享总线或共享存储器系统,称之为紧耦合式并行系统;另一种是各处理单元有各自独立的数据存储器而通过通信口相连的分布式并行系统,称为松耦合式系统。文章中列举了现今世界上两家顶级DSP芯片制造商(ADI公司和TI公司)的两款性能优异的并行DSP芯片——ADSP21060/4TMS320C40/60。在对两种通用并行DSP性能参数比较之后,得出结论:ADSP21060/40在速度上更快一些,特别是做FFT运算,而且它的片内RAM很大。TMS320C40/60通信口的使用则更加灵活,可以收发全双工工作,并且可分裂成12个单向通信口,而DSP21060/40的通信口是半双工工作的。所以在做系统设计时,我们可以根据实际问题的特点,选择一款合适的芯片——不要最好,而要最合适。针对ADSP21060/40这款芯片,多DSP并行处理系统可有以五种结构形式:共享总线式多DSP并行处理系统、基于Link口的多DSP并行处理系统、基于SPORT的多DSP并行处理系统、基于HPI/IDMA的多DSP并行处理系统、基于数据交换的多DSP并行处理系统。具体选择那一种方式,应视具体情况而定。文章中详细介绍了五种结构形式,下面对共享总线的结构简单描述下。共享总线就是系统中所有DSP的外部总线(地址、数据和访问控制总线)都直接连接在一起,各DSP片内存储器和IOPort寄存器(也映射成存储器地址)以及挂接在总线上的外部存储器、外设都作为共享资源被各个DSP访问。每个DSP有唯一的IDx,使用总线请求信号/BRx中的一个作为它使用外部总线的请求,并根据固定优先或循环优先机制来获取总线控制权而成为主处理器,其它均为从处理器,处理器寻址空间被统一映射。主处理器对从处理器的访问是通过读写(/RD、/WR)和确认(ACK)等控制信号握手完成的,并可在主从处理器间建立DMA(DirectMemoryAccess)传输。另外,主处理器还可以向所有从处理器作广播式数据传送:在存储映射空间中有一块存储区定义为广播式数据区,向它写入数据等价于向所有处理器同时写入此数据,而确认信号ACK则由所有从处理器“相与”合成。共享总线系统对总线访问是直接的,具有速度快、迟延小的优点,在实现数据共享的过程中常常省去了数据传输步骤,从而也节省了宝贵的片内存储器资源。ADI公司的SHARC系列高性能浮点ADSP2106X提供了共享总线所必要的控制握手信号线/BR1-6、ACK、/SW以及片内总线仲裁功能,使最多6片ADSP2106X无需外部控制电路直接相连就可以组成一个存储空间统一、DSP相互之间既紧密耦合又相对独立、数据传送效率极高的共享总线式并行处理系统,如图1所示。系统外部接口等ADSP2106X(ID3)并行总线接口ADSP2106X(ID1)并行总线接口ADSP2106X(ID2)并行总线接口监控引导EEPROM共享存储器及外设地址/数据总线控制信号线图一基于ADSP2106X的共享总线式并行处理系统ADSP2106X适于组成共享总线系统的独到之处是它有大容量的片内存储器,使ADSP2106X大多数时间下的取指令、存取数据都是在各自片内完成的,与外部总线无关。这样各片ADSP2106X可以较高的效率独立工作,外部总线的压力也大大减轻。但其缺点主要在于对总线的特别依赖,当处理器数目增加、处理器间数据交换频繁时,总线瓶颈的限制将突显出来。因此共享总线系统适于处理器数目较少的场合。在对实时性要求很高的场合,可将众多ADSP2106X分组为若干共享总线子系统,子系统之间可用其它通信链路口连接,这样组成的混合式多处理器系统可以达到比单纯的分布式存储系统更高的工作效率。此外,我也查找了些资料,对比了解下不同连接的拓扑结构的优缺点。共享总线系统使多个处理单元共同使用一套数据总线,存储器所占用的地址段在各DSP中通常是相同的,这种结构的优点是简单,当DSP数目较少(少于6个)时,可以达到较高的加速比;但当处理单元个数较多时,共享总线将造成频繁的总线冲突和等待,引起各处理单元等待总线令牌的时间大大增加。除此之外,处理单元的连接方式很多,例如树形、星形、网孔、超立方体结构等。树形和星形网络的优点是网络管理容易,数据通信时寻径简单,缺点是处理单元数目很多时,“根”节点或中央节点处理单元的输入/输出吞吐量太大,易造成通信瓶颈。网孔结构将处理单元的互连从一维扩展到二维空间,大大增强了网络的运算能力和通信能力,使并行处理系统的加速能力提高。网孔结构和超立体结构充分利用了任务的并行度,具有较高加速比的潜力。相对而言,二维网孔结构的通信容量基本上能满足要求,而复杂度适中,将它改进成二维网环可以具备超立方体的某些优点,因此采用这种结构来完成多种的实时信号处理比较理想。超立体结构以多维形式进一步增强了网络的通信能力,它的优点是网络全对称,在节点连接特性、通信路径长度、算法的嵌入特性、与其它连接形式的兼容性之间提供了很好的平衡性,但随着处理单元个数的增多,对网络硬件的要求也相应增加。文章中主要描述了DSP并行处理系统的硬件连接拓扑结构。实际上,要得到一个高性能的DSP并行处理系统,并行算法、任务分配方法也是很重要的。任务分配和并行算法的好坏直接影响并行处理系统的性能。

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功