第六届“认证杯”数学中国1129

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

参赛队号#1129第六届“认证杯”数学中国数学建模网络挑战赛承诺书我们仔细阅读了第六届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们允许数学中国网站()公布论文,以供网友之间学习交流,数学中国网站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队号为:1129参赛队员(签名):队员1:队员2:队员3:参赛队教练员(签名):参赛队伍组别:组参赛队号#1129第六届“认证杯”数学中国数学建模网络挑战赛编号专用页参赛队伍的参赛队号(请各个参赛队提前填写好):#1129竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):参赛队号#1129参赛队号#11292013年第六届“认证杯”数学中国数学建模网络挑战赛题目流行音乐发展简史关键词神经网络;分类器;反文档频率;LSA;LDA摘要:音乐风格划分是音乐推荐、欣赏的基础。本模型考虑各个音乐流派的声学、标签和主旋律特征。用Audition等软件处理音乐获取数据,在利用神经网络等方法进行数据处理,最终对音乐进行风格划分。第一针对声学特征,先利用软件处理音乐,然后运用神经网络结构给出误差反传训练算法的分类器,最后对分类器进行训练和音乐风格划分。第二针对标签特征,从音乐网站上利用Audioscrobbler抽取音乐标签,通过反文档频率和LSA方法对音乐——标签向量进行降维预处理,最后使用LDA模型处理降维的向量,将标签属于每个流派的概率转换为对应的音乐属于每个流派的概率。第三针对旋律特征,以MIDI乐曲为数据源提取出乐曲的旋律,然后对旋律数字化,通过经验公式对两首音乐进行旋律重合匹配,得出不同风格音乐的旋律。最后利用分类器进行音乐风格划分。最终将基于三种特点所求得的分类结果进行加权结合,得到音乐流派分类的最优解。参赛队号:#1129所选题目:B题参赛密码____________(由组委会填写)参赛队号#1129一、问题重述随着互联网的发展,流行音乐的主要传播媒介从传统的电台和唱片逐渐过渡到网络下载和网络电台等。网络电台需要根据收听者的已知喜好,自动推荐并播放其它音乐。由于每个人喜好的音乐可能横跨若干种风格,区别甚大,需要分别对待。这就需要探讨如何区分音乐风格的问题。在流行音乐中,传统的风格概念包括Pop(流行)、Country(乡村)、Jazz(爵士)、Rock(摇滚)、R&B(节奏布鲁斯)、NewAge(新世纪)等若干大类,它们分别可以细分成许多小类,有些小类甚至可以做更进一步的细分。而每首歌曲只能靠人工赋予风格标签。这样的做法有许多不足:有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。所以需要建立合理的数学模型,对流行音乐的风格给出一个自然、合理的分类方法,以便给网络电台的推荐功能和其它可能的用途提供支持。首先对上述问题需要解决不同风格音乐特点的分析,然后建立模型给出一个自然理的分类方法。二、问题分析随着互联网的发展,网络电台需要根据收听者的喜好,自动推荐并播放其它音乐。而每首歌曲只能靠人工赋予风格标签。这样的做易造成混乱、过度粗略或精细、音乐归属则存在争议或者难以划归。因此,音乐流派的准确分类对于现代音乐信息检索系统来说是至关重要的。人工标注的速度显然已经不能满足网络中音乐资源飞速增长的需求。为此,人们开始自动音乐流派分类的研究,之前的研究使得流派分类的准确率有了提高,但仅仅使用底层声学特征对音乐进行流派分类不能满足实际音乐信息检索系统[1]的需要。为此,需要找到新的研究方法来提高音乐流派分类的准确率。所建模型需要考虑各个音乐流派的声学、标签和主旋律特征,用软件处理音乐获取数据,在利用神经网络等方法进行数据处理,最终对音乐进行风格划分。针对声学特征,先利用软件处理音乐,然后运用神经网络结构给出误差反传训练算法的分类器,最后对分类器进行训练和音乐风格划分。针对标签特征,从音乐网站上抽取音乐标签,通过反文档频率和LSA方法对音乐——标签向量进行降维预处理,最后使用LDA模型处理维后的向量,将标签属于每参赛队号#1129个流派的概率转换为对应的音乐属于每个流派的概率。每首乐曲中,都会有几段相同的乐段,它是整个音乐的主旋律,也是一首曲子的灵魂,所以它也是一首音乐的特征之处,也就促成了音乐的分类,对旋律特征,以MIDI乐曲为数据源提取出乐曲的旋律,然后对旋律数字化,通过经验公式对两首音乐进行旋律重合匹配,得出不同风格音乐的旋律。最后利用分类器进行音乐风格划分。所建数学模型需要给出对流行音乐的风格给出一个自然、合理的分类方法,以便给网络电台的推荐功能和其它可能的用途提供支持。三、模型假设1.假设我们研究音乐的特征时,除音高与音符的长短,其它对所研究的问题不产生干扰2.假设从cn.last.fm网站得到的标签信息完全正确3.假设我们在音乐库中得到的音乐具有代表性。4.假设音波其中的音乐信息,没有进行一定的损坏5.假设音符的长短对旋律的数值分析影响不大四、变量与符号说明变量符号符号说明rH相对高音rL相对节拍minH最低音minL最短音M径向离散量N旋转角kiXK层上i节点的输入kiYK层上i节点的输出kiljWK层上i节点和L层上j节点间的连接权重kiK层上i节点的阀值LNL层上的节点数参赛队号#1129tjY第j层节点的输出期望tiY第i层节点输出的真实值pN输出层节点数pE训练中各图形的积累误差ix对应的每首歌ixT()标签集合(,)jiFreqtx标签jt被用来标注音乐ix的次数t音乐ix包含的标签数目ts标签在矩阵中的权重tsf歌曲s中标签t出现的次数fsd标签t的歌曲数目N歌曲的总数目k对角矩阵kU矩阵中行向量对应原矩阵A的标签向量kV矩阵中列向量对应原矩阵A的歌曲向量K降维后的维数D语料库M语料库中文档的总数为一个矩阵(里面的元素代表某条件下生成某个单词的概率)(|)kjprct每个标签属于某个流派的概率if风格的趋向值m测试集的曲目数量n测试集中被正确识别的曲目数量参赛队号#1129(|)Akipcx特征i的流派j数值ijx占所有流派总数值ic的概率五、模型建立与求解首先考虑各个音乐流派的声学特征、标签特征和主旋律特征。用Audition等软件处理音乐获取数据,接下来利用神经网络结构给出误差反传训练算法的分类器对音乐风格划分。从音乐网站上抽取音乐标签,通过反文[2]档频率和][3]LSA方法对音——标签向量进行降维预处理,最后使用[4]LDA模型处理降维后的向量,将标签属于每个流派的概率转换为对应的音乐属于每个流派的概率。对旋律特征以MIDI[5]5MIDI乐曲为数据源提取出乐曲的旋律,然后对旋律数字化,通过经验公式对两首音乐进行旋律重合匹配,得出不同风格音乐的旋律。最后利用分类器进行音乐风格划分。5.1声学特征歌曲的声学特征包括节拍和音高,每一类歌曲的节拍和音高是相似的,所以节拍和音高可以用来划分音乐风格。但相同的歌曲以不同速度或不同人的演唱会影响其风格分类,绝对指标会在很多场合下容易产生很大的误差,因此,本模型选取相对音高rH和相对节拍rL两个不变量为歌曲的声学特征:minrLHHHminrLLL其中minH为最低音,minL为最短音节。5.1.1数据的获取本模型选取整首音乐作为处理对象,数据集共包括6个音乐流派即pop(流行)、country(乡村)、Jazz(爵士)、Rock(摇滚)、R&B(节奏布鲁斯)、NewAge(新世纪),其中每个流派由100首音乐组成。这些音乐是根据网站mp3.com列出的每个流派的经典专辑和经典曲目列表在Last.fm上免费下载获得的。然后利用软件Audition处理音乐获取音高的H值。图1中白点行为其中一首歌的H值。运用MATLAB对每首音乐的波进行数字化处理后会得到相应波长的两列矩阵,从而获得节拍L的值。参赛队号#1129图1H值5.1.2数据的处理将mp3格式的音乐利用软件Audition转换成wav格式,同时用MATLAB将音图字化,可以获得每一种音乐风格的音节数据,可以感性的观察相关差别,以下为各类音乐的节拍波形图像:(blue)(classical)参赛队号#1129(country)(jazz)(NewAge)(rock)观察数字化图像后,由于图形本身的随意性和不确定性,需要先利用其自相关函数值作为神经网络[6]的输入值,以获取不同风格音乐的特征值。利用上文获取的音高数据,在Audition软件上形成不同风格音乐唯一的二维特征图,下图2为其中一种风格音乐的特征参赛队号#1129图:图(2)音高二维特征图对于一种风格音乐的二维特征值图有:1,(,)(,)0,(,)xyIfxzxyI(,)(,)(,)guvfxyfxuyvdxdy其中g(u,v)是f的自相关函数。几何意义上讲,g(u,v)表示而为特征图的中谍区域,得标准自相关函数:0(,)(,)(,)(,)(,)fxyfxuyvdxdyguvGuvAfxydxdy0(,)Guv同时满足评议不变量和比例不变量的特点,但不具备旋转不变量的特征,为此改用极坐标(,)r系统,并加以离散化:cos,sinuaAuaA令:0000(,)(cos,sin)(,)(cos,sin)(,)(,)(,)aGaAaAfxyfxaAyaAdxdyfxydxdyGaGa得到:G参赛队号#1129其中0(,)Gr是以为周期的周期函数,可取[0,)。,1,2,...,(1),1,2,...,aaiMjjNN令M为径向离散量,N为旋转角。可以得到可以被看做是音乐而为特征图的离散的0(,)Gr,音乐二维特征图的特征向量为:11122[(,),(,),...,(,)]TcMNFGaGaGa基于上式,根据音乐的二维特征图样本建立一个特征向量,将全部样本按照4︰1的比例随机地划分为训练集和测试集,分别用于网络训练和效果测试的工作。5.1.3分类器我们找了有关资料,发现了一种分类器。其是基于音乐特征聚类分析的优势且在普通BP网的基础上发展的一种新型、有两个隐含层和非毗邻层连接的前馈神经网络结构。新设计的非毗邻层连接神经网络的拓扑结构。通常的带有毗邻层连接的BP网络可以等价为一个串联连接的生物回路模型,新设计的非毗邻层连接神经网络则可以等价为一个串联或并联连接的生物回路[7]模型,可见下图3:图(3)生物回路模型由于这一新型网络的结构变化,求和函数和BP算法的矫正参数将发生变化。设kiX代表K层上i节点的输入,kiY为K层上i节点的输出,ijKLW代表K层上i节点和L层j节点间的连接权重,ki为K层上i节点的阈值,LN为L层上的节点数,则有:111(),iNkkiKLijLjKiLjYfWYfor1K参赛队号#1129()1()1xfxe误差反转计算和连接权重计算如下:11()2pNptjtijEyY其中tjY为第j层节点的输出的期望,tiY为输出的真实值,pN为输出层节点数,pE为训练中各图形的积累误差。令:111LNkkjKLijLiLinetYWY上式为K层节点的输入和函数,对于K层i节点,误差为:11()LppKjpKjKjKjKjKjK

1 / 22
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功