音乐合成实验目录音乐合成实验........................................................1摘要:..........................................................1第一部分简单的合成音乐.......................................21.1合成《东方红》.........................................21.2除噪音,加包络........................................31.3改变程序,实现1.2中的音乐升高和降低一个八度...........81.4在1.2的音乐中加入谐波................................81.5自选音乐合成——《两只老虎》..........................9第二部分用傅里叶变换分析音乐................................102.1载入fmt.wav并播放...................................102.2载入文件Guitar.mat,处理原始数据realwave...........112.3分析wave2proc的基波和谐波...........................142.4自动分析fmt.wav的音调和节拍.........................17第三部分基于傅里叶级数的音乐合成.............................203.1用2.3分析出来的结果重新加谐波.........................203.2通过2.4提取的吉他音调信息弹奏《东方红》.............21实验收获.......................................................22摘要:本文共有三大部分:第一部分,简单的音乐合成;第二部分,用傅里叶变换分析音乐;第三部分,基于傅里叶级数的音乐合成。由潜入深,一步一步分析了用MATLAB进行音乐合成的过程。通过本实验达到了加深对傅里叶级数和傅里叶分析的理解,熟悉对MATLAB基本使用的目标。第一部分简单的合成音乐1.1合成《东方红》根据《东方红》第一小节的简谱和十二平均律计算出该小节每个乐音的频率,在MATLAB中生成幅度为1,抽样频率为8kHz的正弦信号表示这些乐音,用sound播放合成的音乐由图可知《东方红》的曲调定为F,即1=F,对应的频率为349.23Hz,据此可以计算出其他乐音的频率,例如5对应的频率为7/125349.232523.25f,一次类推计算出第一小节各乐音对应的频率为:乐音55621162频率523.25523.25587.33392349.23349.23293.66392在确定了各乐音的频率之后需要确定每个乐音的持续时间。每小节有两拍,一拍的时间是0.5s,因此各乐音的持续时间为:乐音55621162时间0.50.250.2510.50.250.251而在MATLAB中表示乐音所用的抽样频率为fs=8000Hz,也就是所1s钟内有8000个点,抽样点数的多少就可表示出每个乐音的持续时间的长短。用一个行向量来存储这段音乐对应的抽样点,在用sound函数播放即可。根据以上分析在MATLAB中编写如下程序:sound_1_1.m在MATLAB中运行sound_1_1.m,播放出了《东方红》的第一段,但是可以听出效果很不好,只能听出具有《东方红》的调子而已。1.2除噪音,加包络在1.1中听到有“啪”的杂声,下面通过加包络来消噪音。最简单的包络为指数衰减。最简单的指数衰减是对每个音乘以te因子,在实验中首先加的是1.5te的衰减,这种衰减方法使用的是相同速度的衰减,但是发现噪音并没有完全消除,播放的音乐效果不是很好,感觉音乐起伏性不强。于是采用不同速度的衰减,根据乐音持续时间的长短来确定衰减的快慢,乐音持续时间越长,衰减的越慢,持续时间越短,衰减的越快。在1.1程序的基础上加上包络,编写如下程序:sound_1_21.mclear;clc;fs=8000;%抽样频率f=[523.25523.25587.33392349.23349.23293.66392];%各个乐音对应的频率time=fs*[1/2,1/4,1/4,1,1/2,1/4,1/4,1];%各个乐音的抽样点数N=length(time);%这段音乐的总抽样点数east=zeros(1,N);%用east向量来储存抽样点n=1;fornum=1:N%利用循环产生抽样数据,num表示乐音编号t=1/fs:1/fs:time(num)/fs;%产生第num个乐音的抽样点east(n:n+time(num)-1)=sin(2*pi*f(num)*t);%抽样点对应的幅值n=n+time(num);endsound(east,8000);%播放音乐播放后可以听出噪音已经消除,同时因为不同时长的乐音衰减的快慢不一样,音乐听起来更有起伏感,下图是加包络后的east图像。更科学的包络如下图所示,每个乐音都经过冲激、衰减、持续、消失四个阶00.511.522.533.5x104-3-2-10123clear;clc;fs=8000;%抽样频率f=[523.25523.25587.33392349.23349.23293.66392];%各个乐音对应的频率time=fs*[1/2,1/4,1/4,1,1/2,1/4,1/4,1];%各个乐音的抽样点数N=length(time);%这段音乐的总抽样点数east=zeros(1,N);%用east向量来储存抽样点n=1;fornum=1:N%利用循环产生抽样数据,num表示乐音编号t=1/fs:1/fs:time(num)/fs;%产生第num个乐音的抽样点G=zeros(1,time(num));%G为存储包络数据的向量G(1:time(num))=exp(1:(-1/time(num)):1/8000);%产生包络点east(n:n+time(num)-1)=sin(2*pi*f(num)*t).*G(1:time(num));%给第num个乐音加上包络n=n+time(num);endsound(east,8000);%播放plot(east);段。由上图可以看出这个包络是四段直线段构成的,因此只要确定了每段线段的端点,即可用端点数据写出直线方程,因为直线方程可以用通式写出(我用的是斜截式),因此这段包络可以用简单的循环来完成。例如认为包络线上的数据如下图所示:据此在MATLAB中编写如下程序:sound_1_22.m运行得到的图像为:clear;clc;fs=8000;%抽样频率f=[523.25523.25587.33392349.23349.23293.66392];%各个乐音对应的频率time=fs*[1/2,1/4,1/4,1,1/2,1/4,1/4,1];%各个乐音的抽样点数N=length(time);%这段音乐的总抽样点数east=zeros(1,N);%用east向量来储存抽样点n=1;fornum=1:N%利用循环产生抽样数据,num表示乐音编号t=1/fs:1/fs:(time(num))/fs;%产生第num个乐音的抽样点P=zeros(1,time(num));%P为存储包络数据的向量L=(time(num))*[01/5333/1000333/5001];%包络线端点对应的横坐标T=[01.5110];%包络线端点对应的纵坐标s=1;b=1:1:time(num);%产生包络线抽样点fork=1:4P(s:L(k+1)-1)=(T(k+1)-T(k))/(L(k+1)-L(k))*(b(s:L(k+1)-1)-L(k+1)*ones(1,L(k+1)-s))+T(k+1)*ones(1,L(k+1)-s);%包络线直线方程通式s=L(k+1);endeast(n:n+time(num)-1)=sin(2*pi*f(num)*t).*P(1:time(num));%给第num个乐音加上包络n=n+time(num);endsound(east,8000);plot(east);下图是两个乐音交接处的局部放大图,可以看到前一个乐音一直衰减到0,后一个乐音从0开始增加,因此消除了噪音。00.511.522.533.5x104-2-1.5-1-0.500.511.52若不需要每个音都衰减到0,例如只需衰减到持续阶段幅值的20%,对程序做简单的修改即可,将T=[01.5110]改为T=[0.21.5110.2]运行得到的结果为:由图可见,每个乐音都是衰减到一较小值而不是0,也能消除噪音,同时音乐听起来更加连续。1.3改变程序,实现1.2中的音乐升高和降低一个八度升高一个八度即每个乐音的频率都提高一倍,变为原来的2被;降低一个八度即每个乐音的频率都减小一倍,变为原来的1/2。因此最简单的办法是将存储乐音频率的向量每个元素改变为2或1/2倍。即将程序中的f=[523.25523.25587.33392349.23349.23293.66392];改为f=[523.25523.25587.33392349.23349.23293.66392]*2;或f=[523.25523.25587.33392349.23349.23293.66392]/2;将上述音乐上高半个音阶,即将频率变为原来的1/122(1.06)倍,可以利用resamlpe函数对原来的数据点进行重采样来实现east=resample(east,100,106);因为resample进行重新采样后会使每个乐音的持续时间改变,但是因为升高半个音阶,频率改变不大,所以每个音的持续时间是基本不变的。00.511.522.533.5x104-2-1.5-1-0.500.511.521.4在1.2的音乐中加入谐波在1.2的音乐中加上二、三、四次谐波,基波幅度为1,高次谐波幅度分别为0.2、0.3、0.1。只需将1.2程序改为sound_1_4.m即可,加颜色部分为修改的部分,加上谐波后音乐效果变得更好了。clear;clc;fs=8000;%抽样频率f=[523.25523.25587.33392349.23349.23293.66392];%各个乐音对应的频率time=fs*[1/2,1/4,1/4,1,1/2,1/4,1/4,1];%各个乐音的抽样点数N=length(time);%这段音乐的总抽样点数east=zeros(1,N);%用east向量来储存抽样点n=1;fornum=1:N%利用循环产生抽样数据,num表示乐音编号t=1/fs:1/fs:(time(num))/fs;%产生第num个乐音的抽样点P=zeros(1,time(num));%P为存储包络数据的向量L=(time(num))*[01/5333/1000333/5001];%包络线端点对应的横坐标T=[01.5110];%包络线端点对应的纵坐标s=1;b=1:1:time(num);%产生包络线抽样点fork=1:4P(s:L(k+1)-1)=(T(k+1)-T(k))/(L(k+1)-L(k))*(b(s:L(k+1)-1)-L(k+1)*ones(1,L(k+1)-s))+T(k+1)*ones(1,L(k+1)-s);%包络线直线方程通式s=L(k+1);endm=[10.30.2];%波形幅值矩阵ss=zeros(1,length(t));fori=1:length(m)ss=ss+m(i)*sin(2*i*pi*f(num)*t);%加谐波endeast(n:n+time(num)-1)=ss.*P(1:time(num));%给第num个乐音加上包络n=n+time(num);endsoun