基于DSP实验平台的FFT算法实现组员:丁涛,2014204066贾冰,2014204080葛云峰,2014204075程自奇,2014204065日期:2015.01.15一、实验目的1.加深对DFT算法原理和基本性质的理解;2.熟悉FFT的算法原理和FFT子程序的算法流程和应用;3.学习用FFT对连续信号和时域信号进行频谱分析的方法;4.学习DSP中FFT的设计和编程思想;5.学习使用CCS的波形观察器观察波形和频谱情况;二、实验内容用DSP汇编语言及C语言进行编程,实现FFT运算、对输入信号进行频谱分析。三、实验原理快速傅里叶变换FFT旋转因子WN有如下的特性。对称性:WNk+N/2=-WNk(2)周期性:WNn(N-k)=WNk(N-n)=WN-nk(3)利用这些特性,既可以使DFT中有些项合并,减少了乘法积项,又可以将长序列的DFT分解成几个短序列的DFT。FFT就是利用了旋转因子的对称性和周期性来减少运算量的。FFT的算法是将长序列的DFT分解成短序列的DFT。例如:N为偶数时,先将N点的DFT分解为两个N/2点的DFT,使复数乘法减少一半:再将每个N/2点的DFT分解成N/4点的DFT,使复数乘又减少一半,继续进行分解可以大大减少计算量。最小变换的点数称为基数,对于基数为2的FFT算法,它的最小变换是2点DFT。一般而言,FFT算法分为按时间抽取的FFT(DITFFT)和按频率抽取的FFT(DIFFFT)两大类。DIFFFT算法是在时域内将每一级输入序列依次按奇/偶分成2个短序列进行计算。而DIFFFT算法是在频域内将每一级输入序列依次奇/偶分成2个短序列进行计算。两者的区别是旋转因子出现的位置不同,得算法是一样的。在DIFFFT算法中,旋转因子WN出现在输入端,而在DIFFFT算法中它出现在输入端。假定序列x(n)的点数N是2的幂,按照DIFFFT算法可将其分为偶序列和奇序列。偶序列:x(2r)=x1(r)奇序列:x(2r+1)=x2(r)其中:r=0,1,2,…,N/2-1,则x(n)的DFT表示为式中,X1(k)和X2(k)分别为X1(r)和X2(r)的N/2的DFT。由于对称性,WNk+N/2=-WNk。因此,N点DFT可分为两部分:前半部分:x(k)=x1(k)+WkNx2(k)(4)后半部分:x(N/2+k)=x1(k)-WkNx2(k)k=0,1,…,N/2-1(5)从式(4)和式(5)可以看出,只要求出0~N/2-1区间x1(k)和x2(k)的值,就可求出0~N-1区间x(k)的N点值。以同样的方式进行抽取,可以求得N/4点的DFT,重复抽取过程,就可以使N点的DFT用上组2点的DFT来计算,这样就可以大减少运算量。基2DIFFFT的蝶形运算如图3.1所示。设蝶形输入为x1(k)和x2(k),输出为x(k)和x(N/2+K),则有111000NNNnknknkNNNnnnXkxnWxnWxnWn为偶数n为奇数/21/2121200221NNrkrkNNrrxrWxrW/21/21221200NNrkrkkNNNrrxrWWxrW/21/211/22/200NNrkkrkNNNrrxrWWxrW12kNXkWXk,0,1,.../21rkNx(k)=x1(k)+WkNx2(k)(6)x(N/2+k)=x1(k)-WkNx2(k)(7)在基数为2的FFT中,设N=2M,共有M级运算,每级有N/2个2点FFT蝶形运算,因此,N点FFT总共有MN/2个蝶形运算。图3.1基2DIFFFT的蝶形运算例如:基数为2的FFT,当N=8时,共需要3级,12个基2DITFFT的蝶形运算。其信号流程如图3.2所示。x(0)x(0)WN0x(4)x(1)-1WN0x(2)x(2)-1WN0WN2x(6)x(3)-1-1WN0x(1)x(4)-1WN0WN1x(5)x(5)-1-1WN0WN2x(3)x(6)-1-1WN0WN2WN3x(7)x(7)-1-1-1图3.28点基2DIFFFT蝶形运算从图(b)可以看出,输入是经过比特反转的倒位序列,称为位码倒置,其排列顺序为x(0),x(4),x(2),x(6),x(1),x(5),x(3),x(7),输出是按自然顺序排列,其顺序为CABA+BCA-BCx(0),x(1),x(2),x(3),x(4),x(5),x(6),x(7).程序设计顺序串口设置AD设置设置信号源类型、频率幅值、和采样点数串口接收,AD采样位码倒置FFT运算功率谱计算串口发送转换结果观看转换结果,保存数据DSP初始化四、FFT算法的DSP实现过程:DSP芯片的出现使FFT的实现方法变得更为方便。由于大多数DSP芯片都具有在单指令周期内完成乘法—累加操作,并且提供了专门的FFT指令,使得FFT算法在DSP芯片实现的速度更快。FFT算法可以分为按时间抽取FFT和按频率抽取FFT两大类,输入也有实数和复数之分,一般情况下,都假定输入序列为复数。(一)FFT运算序列的存储分配FFT运算时间是衡量DSP芯片性能的一个重要指标,因此提高FFT的运算速度是非常重要的。在用DSP芯片实现FFT算法时,应允许利用DSP芯片所提供的各种软、硬件资源。如何利用DSP芯片的有限资源,合理地安排好所使用的存储空间是十分重要的。(二)FFT运算的实现用TMS320C54x的汇编程序实现FFT算法主要分为四步:1.实现输入数据的比特反转输入数据的比特反转实际上就是将输入数据进行码位倒置,以便在整个运算后的输出序列是一个自然序列。在用汇编指令进行码位倒置时,使用码位倒置可以大大提高程序执行速度和使用存储器的效率。在这种寻址方式下,AR0存放的整数N是FFT点的一半,一个辅助寄存器指向一个数据存放的单元。当使用位码倒置寻址将AR0加到辅助寄存器时,地址将以位码倒置的方式产生。2.实现N点复数FFTN点复数FFT算法的实现可分为三个功能块,即第一级蝶形运算、第二级蝶形运算、第三级至级蝶形运算。对于任何一个2的整数幂,总可以通过M次分解最后成为2点的DFT计算。通过这样的M次分解,可构成M(即)级迭代计算,每级由N/2个蝶形运算组成。3.功率谱的计算用FFT计算想x(n)的频谱,即计算X(k)=X(k)一般是由实部(k)和虚部(k)组成的复数,即X(k)=(k)+j(k)因此,计算功率谱时只需将FFT变换好的数据,按照实部实部(k)和虚部(k)求它们的平方和,然后对平方和进行开平方运算。但是考虑到编程的难度,对于求FFT变换后数据的最大值,不开平方也可以找到最大值,并对功率谱的结果没有影响,所以在实际的DSP编程中省去了开方运算。4.输出FFT结果(三)汇编语言程序程序主体由rfft-task、bit-rev、fft和power四个子程序组成。rfft-task:主调用子程序,用来调用其他子程序,实现统一的接口。bit-rev:位码倒置子程序,用来实现输入数据的比特反转。fft:FFT算法子程序,用来完成N点FFT运算。在运算过程中,为避免运算结果的溢出,对每个蝶形的运算结果右移一位。fft子程序分为三个功能块:第一级蝶形运算、第二级蝶形运算、第三级至至级蝶形运算。(四)正弦系数表和余弦系数表:正弦系数表和余弦系数表可以由数据文件coeff.inc给出,主程序通过.copy汇编命令将正弦和余弦系数表与程序代码汇编在一起。在本例中,数据文件coeff.inc给出1024复数点FFT的正弦、余弦系数各512个。利用此系数表可完成8~1024点FFT的运算。(五)FFT算法的模拟信号输入:FFT算法的模拟信号输入可以采用C语言编程来生成一个文本文件sindata,然后在rfft-task汇编程序中,通过.copy汇编命令将生成的数据文件复制到数据存储器中,作为FFT算法的输入数据参与FFT运算。这种方法的优点是程序的可读性强,缺点是当输入数据修改后,必须重新编译、汇编和链接。五、设计步骤:1.启动CCS,在CCS中建立一个C源文件和一个命令文件,并将这两个文件添加到工程,再编译并装载程序:阅读Dsp原理及应用中fft用dsp实现的有关程序。2.双击,启动CCS的仿真平台的配着选项。选择C5502Simulator。3.启动ccs2后建立工程文件FFT.pjt4.建立源文件FFT.c与链接文件FFT.cmd5.将这两个文件加到FFT.pjt这个工程中。6.创建out文件7.加载out文件六、实验过程1.编译并下载程序。2.打开观察窗口:*选择菜单View-Graph-Time/Frequency…进行如下图所示设置。图1图2图33.清除显示:在以上打开的窗口中单击鼠标右键,选择弹出式菜单中“ClearDisplay”功能。4.设置断点:在程序FFT.c中有注释“breakpoint”的语句上设置软件断点。图45.运行并观察结果。⑴选择“Debug”菜单的“Animate”项,或按Alt+F5键运行程序。⑵观察“TestWave”窗口中时域图形;图5⑶在“TestWave”窗口中点击右键,选择属性,更改图形显示为FFT。观察频域图形。图6⑷观察“FFT”窗口中的由CCS计算出的正弦波的FFT。图7七、实验结果通过观察频域和时域图,程序计算出了测试波形的功率谱,与CCS计算的FFT结果相近。八、心得体会本来打算想自己弄的,但一方面时间有限,另一方面确实能力有限,对硬件不太懂,所以只能做到这种程度了。附录Cmd源文件代码:-f0-w-stack500-sysstack500-1rts55.libMEMORY{DARAN:o=0x100,1=0x7f00VECT:o=0x8000,1=0x100DARAM2:o=0x8100,1=0x7f00SARAM:o=0x10000,1=0x30000SDRAM:o=0x40000,1=0x3e0000}SECTIONS{.text:{}DARAM.vectors:{}VECT.trcinit:{}DARAM.gblinit:{}DARAM.frt:{}DARAM.cinit:{}DARAM.pinit:{}DARAM.sysinit:{}DARAM2.far:{}DARAM2.const:{}DARAM2.switch:{}DARAM2.sysmem:{}DARAM2.cio:{}DARAM2.MEM$obj:{}DARAM2.sysheap:{}DARAM2.sysstack:{}DARAM2.stack:{}DARAM2.input:{}DARAM2.fftcode:{}DARAM2}C文件源码:#includemath.h#definesample_1256#definesignal_1_f60#definesignal_2_f200#definesignal_sample_f512#definepi3.1415926intinput[sample_1];floatfwaver[sample_1],fwavei[sample_1],w[sample_1];floatsin_tab[sample_1];floatcos_tab[sample_1];voidinit_fft_tab();voidfft(floatdatar[sample_1],floatdatai[sample_1]);voidmain(){inti;init_fft_tab();input_data();for(i=0;isample_1;i++){fwaver[i]=input[i];fwavei[i]=0.0f;w[i]=0.0f;}fft(fwaver,fwavei);while(1);}voidinit_fft_tab(){floatwt1;floatwt2;inti;for(i=0;isample_1;i++){wt1=2*pi*