基于NiosII的JPEG图像显示系统研究时间:2007-10-24来源:作者:郭晓河点击:1093字体大小:【大中小】随着多媒体通信技术的发展,人们不再满足单一文字或声音的传递,从普通电话到视频电话,从SMS(shortmessagingservice)到EMS(enhancedmessageservice)再到MMS(multimediamessagingservice),多媒体技术逐渐进入千家万户。因此,研究如何高效地处理多媒体信源,让其更方便有效地存储和传输是非常必要的。JPEG标准作为图像压缩编码的一项重要技术,不仅适用于静止图像的编码,其分支M-JPEG也适用于低成本场合的运动图像编码。现在的图像显示卡已发展到高速处理3D图像的水平,但是,对静止图像JPEG压缩的评测仍是一项基本指标。目前的嵌入式处理器种类繁多。Altera公司的NiosII处理器是用于可编程逻辑器件的可配置的软核处理器,与Ahera的低成本的CycloneFPGA组合,具有很高的性价比。本系统采用NiosII和CycloneEP1C6嵌入式系统开发板,以及VGA显示器,实现了一个嵌入式JPEG图像显示系统。1总体设计及系统架构JPEG图像显示系统有三大功能:JPEG图像的存储、解码和显示。基本原理如图1所示。利用串口通信、USB接口或以太网数据传输获取JPEG图像压缩数据并将数据存入高速存储器(Flash或SRAM);图像的解码主要包括预处理、Huffman解码、反量化、IDCT变换;图像显示是将解码后的图像数据转换为适合VGA工业标准的RGB信号,再利用D/A转换,最后显示原始图像。该系统在结构上分为3层:系统硬件平台、操作系统和基于IDCT解码算法。最底层是系统硬件平台,是系统的物理基础,提供软件的运行平台和通信接口。系统的硬件平台在Altera的NiosIICyclone嵌入式系统开发板上实现,显示器采用VGA标准的显示器,可输出大小为640×480像素、分辨率为500dpi的24位真彩色图像。第2层是操作系统,采用uCOSII。uCOSII是一个基于抢占式的实时多任务内核,可固化、可剪裁、具有高稳定性和可靠性。这一层提供任务调度以及接口驱动,同时,通过硬件中断来实现系统对外界的通信请求的实时响应,如对以太网数据流传输的控制、对串口通信的控制等。这种方式可以提高系统的运行效率。最上层是JPEG图像解码核心算法的实现。该算法高效地对压缩图像数据进行解码处理和空间域的转换。采用C语言在NiosII的集成开发环境(IDE)中实现。2系统硬件的设计与实现2.1NiosⅡ嵌入式软核处理器简介NiosII嵌入式处理器是Altera公司于2004年6月推出的第2代用于可编程逻辑器件的可配置的软核处理器,性能超过200DMIPS。基于哈佛结构的RISC通用嵌入式处理器软核,NiosII能与用户逻辑相结合,编程至Altera的FPGA中。处理器具有32位指令集,32位数据通道和可配置的指令以及数据缓冲。它特别为可编程逻辑进行了优化设计,也为可编程单芯片系统(SoPC)设计了一套综合解决方案。NiosII处理器系列包括3种内核:一种是高性能的内核(NiosII/f);一种是低成本内核(NiosII/e);一种是性能/成本折中的标准内核(NiosII/s),是前两种的平衡。本系统采用标准内核。NiosII处理器支持256个具有固定或可变时钟周期操作的定制指令;允许NiosII设计人员利用扩展CPU指令集,通过提升那些对时间敏感的应用软件的运行速度,来提高系统性能。2.2硬件平台结构系统的硬件平台结构如图2所示。本系统采用USB至UART桥接器CP2102实现与上机位的通信。由SiliconLaboratories推出的CP2102,使RS232升级到USB接口更加简单,原先采用RS232串口通信方案的设备在软件上无需作改动即可直接升级到USB。CP2102内建EEPR0M、稳压器、USB收发器和整合式内部振荡器。这套组件还包含完整的USB2.0全速(ful1.speed)装置控制器、桥接控制逻辑以及传送/接受缓冲器和调制解调器商议讯号(handshakesigna1),这些功能全都整合至5mm×5mm的小型封装内。图像数据传输的流程是:首先初始化串口UART的各个寄存器,主要是接受寄存器(rxdata)、发送寄存器(tx.data)、状态寄存器(status)、控制寄存器(contro1)、波特率分频器(divisor)等;然后传输等待,图像数据以115200bps的速率进人数据寄存器,再通过DMA存入Flash。本系统硬件平台主要是在NiosIICyclone嵌入式开发板上实现。系统的主要组件,包括NiosII的标准内核、片内存储器、UART、DMA控制器、并行I/O接口、Avalon总线、定时器等都集成在一块Ahera的cycloneFPGA芯片上,使用SoPCBuilder来配置生成片上系统。SoPCBuilder是功能强大的基于图形界面的片上系统定义和定制工具。SoPCBuilder库中包括处理器和大量的IP核及外设。根据应用的需要,系统选用NiosIIProcessor、OnChipMemo~、FlashMemo~(CommonFlashInterface)、SDRAMController、UART、DMA、Intervaltimer、SevenSegmentPIO、AvalonTriStateBridge、EthernetInterface等模块。对这些模块配置完成后,使用SoPCBuilder进行系统生成。SOPCBuilder自动产生每个模块的HDL文件,同时自动产生一些必要的仲裁逻辑来协调系统中各部件的工作。2.3使用NiosII的定制指令提高系统性能使用NiosII的定制指令,可以将一个复杂的标准指令序列简化为一个用硬件实现的单一指令,从而简化系统软件设计并加快系统运行速度。NiosII的定制指令是与CPU的数据通路中的ALu相连的用户逻辑块。其基本操作是,接收从dataa和/或datab端口输入的数据,经过定制指令逻辑的处理,将结果输出到result端口。JPEG图像解码的核心算法是离散余弦反变换IDCT,二维DCT/IDCT变换需要经过两次矩阵乘法,8*8的图像子块的DCT/IDCT需要进行8192次乘法和3584次加法。基于NiosII的JPEG图像显示系统采用wLi循环斜卷积算法,在保证不增加加法器个数的同时,大大减少了乘法器数目,改进了传统的DCT/IDCT硬件实现方法,采用流水线结构,实行并行优化算法,提高了IDCT模块的运算速度,减小了延迟。定制指令逻辑和NiosII的连接在SoPCBuilder中完成。NiosIICPU配置向导提供了一个可添加256条定制指令的图形用户界面,在该界面中导入设计文件,设置定制指令名,并分配定制指令所需的CPU时钟周期数目。系统生成时,NiosIIIDE为每条用户指令产生一个在系统头文件中定义的宏,可以在C或C++应用程序代码中直接调用这个宏。3系统软件的设计与实现本系统的JPEG图像处理和解码算法采用c++语言在NiosIIIDE中实现。JPEG图像解码算法的流程如图3所示。预处理算法需要识别不同的标记码,并提取标记码中的有用信息。JPEG图像文件可分为2个部分:压缩数据和标记码。压缩数据是以MCU(最小编码单元)形式存储的经过压缩编码后的数据。标记码给出了诸如图像长度、宽度、量化表、Hufman表等重要信息,而这些信息都包含在不同类型的标记码中。对一个MCU进行Hufman解码,需在完成亮度解码后才能进行色度解码。解码后得到6个具有64位元素的一维数组,分别是:4个Y亮度数组、1个cb色度数组、1个cr色度数组(4:1:1模式)。对一个数组来说,Huffman解码包括直流解码和交流解码。对数组第一个元素的解码称为直流解码(简记为DC解码),对剩下的63个元素的解码称为交流解码(简记为AC解码)。JPEG文件中一般包含4个Hufman表,即亮度DG表、AC表,色度DC表、AC表。一个Huffman码包括码头和码值2部分,码头用来惟一的标识该Hufman码,并与Hufman表一一对应,码值是该码的实际大小。量化运算需要量化表的配合。从JPEG文件中读取的量化表一般有2个,分别用2个64位元素的一维数组来存储,用于对亮度和色度进行反量化。反量化运算就是将上面经Huffman解码得到的数组中的元素与量化表中对应位置元素相乘。为了进行后面的IDCT,还需要将完成反量化运算的数组进行z字型变换,将一维数组变换成8×8的二维数组。IDCT变换直接利用自定制指令快速完成8×8的二维数组的离散余弦反变换。后续处理的任务之一就是完成颜色空间的转换,即将JPEG图像数据的Y、cb、cr颜色空间转换为RGB颜色空间。但是,为了使计算出的R、G、B的值都是正数,需要对Y、cb、cr分别加128进行修正,同时乘法运算出现了浮点数,故需要对浮点数进行定标处理.4结束语本文提出了一种基于NiosII嵌入式处理器软核的JPEG图像显示系统的实现方法。使用Altera的CycloneFPGA实现,具有开发周期短、成本低等特点;同时,采用NiosII的定制指令来提高系统性能,利用硬件实现算法速度快的优点,使以NiosII处理器为核心的系统能够快速地完成大量图像数据处理。