自校准麦克风阵列语音信号的采集

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

自校准麦克风阵列语音信号的采集:一种系统的方法摘要:麦克风阵列和波束形成技术的语音采集中的应用比单一麦克风的操作系统更有前景。自适应波束形成器提供了一个潜在的优越性,就是固定波束形成器。特别针对时变声场特征或相干噪声比如相干的扬声器或扬声器信号等,优越性更加明显。然而在实际应用中自适应波束形成器存在严重的信号衰减的风险。由麦克风不匹配、转动方向不精确、多径传播引起频率混叠等造成的干扰可能导致自适应波束形成器形成畸变的期望信号。麦克风不匹配一般主要是由生产工艺和器件老化引起的。这篇文献提出了一种自适应的自校准方法。这些方法在系统的正常操作中就可以自校准,因此,不需要额外的自校准程序。这种基于一个系统的方法,需要一些新的结构以及其他一些众所周知的结构。在不同结构下自校准结构的性能检测可以在汽车环境中进行。1简介麦克风阵列语音应用已经研究了二十多年。但仍只有极少数的产品使用麦克风阵列。为了用少量麦克风得到较高的性能,必须使用超方向性波束形成方法。鉴于这种方法是基于延迟和求和来形成波束的,超方向性波束形成器对假定的信号模型中的误差很敏感。所以比起固定波束形成器,自适应波束形成器往往对这些误差更敏感。还有一个主要问题是制造工艺引起的麦克风失配。为了达到良好的性能必须对这些不匹配进行补偿。经典的麦克风校准中传递函数是通过前一次测量控制波束形成。然而,由于老化效应麦克风传输函数就可能不再适用就需要重新校准。为了克服这些问题,开发了自校准方法,它可以自适应的对信号模型中的误差进行补偿。这些误差也可能是由非理想的声学特性或者多径传播导致的频谱混叠或波束形成器的方向不精确引起。这篇文章的组织结构如下:第2节描述了用于波束形成的经典方法并指出了自适应波束形成器的严重弊端。第3节回顾了防止信号消除的最先进的技术。第4节提出了系统法的自校正,给出由此衍生的其他方法。第5节讲述了对这些方法的评价。第6节是文章的结尾给出了结论。这篇文章,是用分析法和合成滤波器组在频域部分带宽上上做信号处理。2.波束成形波束成形系统的目标是估算期望信号确切的来波方向或形成一个本地的空间体积。来自其它方向或其他空间点的声波会被波束形成所抑制。因此,波束形成器实现了空间选择性。固定波束形成器是预先计算好的滤波器,而自适应波束形成器的参数是在运行过程中进行优化的,从而可以跟踪不同特性的声场。2.1自适应波束形成器在实际应用中,自适应波束形成器大多采用MVDR(“最小方差无失真响应”)标准。在此约束下输出信号的功率是最小的,对于期望入射方向而言,无失真响应就会被保留。这个希望的方向也被称为为波束形成器的转向方向。更一般的情况,会存在多个方向的约束,该波束形成器被称为LCMV(“线性约束最小方差”)波束形成器。在篇文章中,我们考虑一个自适应的MVDR波束形成器,信号处理在频率子带上进行。对于M各阵元的阵列麦克风设其全频带麦克风信号1,2,,mnmM,各个信号通过滤波器组分解到频率为P的频域子带上,分解后的信号为,0,1,,1mxkP。该波束形成器输出的子带信号yk是系统滤波器组和全频带的时域信号的组合。子带信号具有严格限制的带宽,因此可以彼此独立地进行处理。此外,还可以通过自带上的二次抽样因子R来降低采样速率。因此,可以降低信号处理的计算量同时使自适应滤波器更快地收敛。子采样信号的时间指数由k表示,全频带信号的时间指数由n表示。图1自适应波束形成的GSC结构。在上部路径的固定波束形成器增强了信号,在下部路径的自适应滤波器装置消除了相关噪声一个MVDR波束形成器可以直接或间接地作为一个“广义旁瓣相消”(GSC),如图1所示。在直接形式中的麦克风(子带)信号通过FIR滤波器,mwl来滤波,滤波器的长度为L和滤波过程如下:1*,,10MLmmmlykwlxkl(1)星号表示共轭复数。一种直接形式的MVDR波束形成器的实现方法由Frost的文章给出。滤波器系数调整时要考虑定向约束,同时要保证滤波器稳定性。GSC的结构是信号处理路径的一个分支如图1所示。上部路径包括一个权重系数为,ma的固定波束形成器(FBF),(如延迟求和波束形成器:我是,1/maM):,,,1MFBFmmumykaxk(2)在下部路径上用所谓的分块矩阵(BM)拒绝从期望方向来的信号。在最简单的情况下,相邻信道是相减的关系:,1,,mmmbkxkxk(3)其它分块矩阵虽然文献5中提到但是很少使用。信号,mbk作为多通道干扰消除(MIC)的参考噪声:11*,,,,10,MLGSCFBFmmmlykykwlkbkl(4),,mwlk的长度为L,表示多通道干扰消除的自适应滤波器。自适应滤波器是在最小均方意义下进行调节的,从而使得输出信号的功率最小。通过由阻塞矩阵实现的约束来保持期望方向的信号不失真。使用归一化最小均方(NLMS)算法可以使滤波器适配。2.2信号衰减MVDR约束强制波束形成器的转向方向上形成固定的频率响应。波束形成器的输出信号的功率是依靠这种定向约束达到最小的。这种方法是基于这样的信号模型:麦克风拥有理想、一致的传输特性,室内声场符合自由场条件,自由场是指期望信号仅仅影响阵列的转向方向而不会产生反射信号。这样MVDR约束就可以在理想条件下实现,但实际应用中这些理想的假设条件总是会有偏差。由于理想信号模型与实际的偏差事先是未知的,所以定向约束往往不符合实际情况。定向约束的有效性也会被削弱,因为期望信号的其他分量也被功率最小化。尤其是对自适应波束形成器,当在语音活动过程中进行自适应滤波器的自适应调整时,会有严重的信号失真问题。在这种情况下,与期望信号相关的信号会从不是转向方向的其他方向过来。使期望信号被这些非目标信号抵消。这种效应被称为''信号消除''。但即使只在噪声其进行调整,话筒不匹配仍然是一个问题,尽管不存在期望信号:通过波束形成滤波器的自适应对于假设的理想麦克风方向约束是完美的,但是对于真正的(不匹配)话筒,指向方向就会出现失真。因为自适应波束形成是使输出信号的功率最小化,这种失真主要表现为指向方向的衰减,即使讲话期间停止自适应,这种失真仍然存在。因此,麦克风适配削弱了定向约束的有效性。传声器失配已经在文献2中通过测量一系列的麦克风在极性模式下的大小和相位进行了研究。传声器失配的影响,也通过理论分析和对实测数据的仿真进行了研究。人们发现,固定波束形成和自适应波束形成一个相反的行为。当固定波束形成器趋向于放大信号时,自适应波束形成器就会显示出强劲的衰减特性。经过平均后,麦克风失配对于自适应波束形成器的影响是比固定波束形成器更严重,尤其对于低频范围。3已知的解决方案有几个众所周知的改善自适应波束形成器的稳健性的方法。这些方法可分为两类:一类是波束形成器适度的运行,不管存在的误差如何(针对症状)。其他类的目的是减少偏差本身(针对原因),也就是说,它们在做均衡或校准。3.1针对症状信号的衰减通常伴随着滤波器系数幅度的增长。因此可以用范数约束方法通过限制的波束形成器滤波器的最大增益为K来防止滤波器系数幅度过度增加:12,10,MLmumlwlkK(5)另一种防止滤波器系数幅度增长过大的方法是使用泄漏因子。针对每个时间步长k,滤波器系数大小由一个比1稍小的因子按比例缩小(例如,λ=0.99)。特别是对于语音应用来说自适应控制是防止信号衰减的有效方法。波束形成滤波器仅在讲话停止时做自适应。但在语音活动期间滤波器不能跟踪最优解。3.2针对原因对抗信号衰减另一种方法是减弱其产生原因,即麦克风不匹配,以及房间的声学模型与假设模型的不匹配。一个简单但代价较大的方法是预先选定最佳匹配的麦克风。另外,也可以利用一些特殊的测量预先确定校准滤波器并随后使用它们。这些解决方案都需要测量数据。此外,麦克风的特性由于老化作用或环境影响通常是随时间改变的。出于这个原因,需要可以跟踪这些变化的自适应匹配。有许多方法解决室内声学的不匹配问题。这些方法试图纠正指向方向不精确性或跟踪移动的讲话者。VanCompernolle在文献8中提出了一种解决方案:在自适应波束形成器前面增加一个额外的自适应单元。此单元用于补偿扬声器在一定背景下运行时讲话者和麦克风阵列传递函数之间的差异。一个麦克风被选为参考元而阵列的所有其它麦克风自适应地与这个参考麦克风匹配。自适应控制允许匹配单元或波束形成器适应它的滤波器。Hoshuyama等人在文献9提出了一种基于自适应阻塞矩阵的GSC波束形成器:固定波束形成器输出信号经过一个系数受限的自适应过滤器滤波后,要从每个麦克风信号中减去这个信号。所得到的差信号被用作多干扰消除器的噪声参考信号。系数约束的自适应滤波器是为了补偿指向方向的小误差。文献10中深入地研究了这种方法。文献11提出了频率子带框架,文献12则在全频域上进行了研究。另一种方法,是GSC波束形成器的一个扩展,由Gannot等人在文献13中提出:这种方法把从讲话者到麦克风阵列的信号路径建模为传递函数,而不仅仅是简单的延时。对比Hoshuyama等人的方法。此方法用一个单一麦克风信号代替固定波束形成器的输出信号作为基准信号,同样差值信号用作GSC的噪声参考信号。虽然这三种方法是以补偿声学不匹配为初衷来设计的,但它们实际上也适合校正麦克风的不匹配。4系统的方法如在第2.2节中讨论的,关键是要使麦克风传输特性的不匹配以及声学传递函数的不匹配尽可能小。在本节中将会引入一个简单的基本单元,该单元可以补偿这些不匹配。对于多通道的情况要建立一个自校准系统需要可能不止一个基本单元。此外,也有不同的方式来组合基本单元。4.1基本单元在这篇文献中所提出的方法是基于一个简单的基本单元。这个基本单元涉及了两个输入信号和两个输出信号,如图2所示。参考信号,ICxk通过有N个系数,,0ICvlklN 的自适应FIR滤波器滤波后,其结果是校准后的输出信号,CICxk,可由下式算得:1*,,,0,NCICICIClxkvlkxkl(6)图2自校准的基本单元参考信号,ICxk通过自适应滤波后与期望信号,ICdk匹配,基本单元的输出信号是校准信号,CICxk和误差信号,ICek。另一个输入信号,kdIC,是期望信号。用于调节自适应滤波器klvIC,,的误差信号keIC,;其计算公式为目标信号和校准信号的差:,,,=ICICICekdkDxk(7)为了模拟非因果部分,必须引入目标信号的延迟采样。调整滤波器的系数klvIC,,,使得均方误差最小化,这可以利用自适应的NLMS算法实现。,,12,0*,,,1,ICICNICpICICkvlkvlkxkpekxkl       (8)通过调整步长参数可以控制k。图2中的结构通常被称为干扰消除器,它最初的目的是为了抵消目标信号kdIC,中的相关信号(期望)的,而且我们感兴趣的是它的误差信号,然而,此文章中这个基本单元是为了实现与输入信号的匹配,所以校准后的输出信号,CICxk也是很重要的。4.2阵列处理的结构在有两个以上的基本单元麦克风的多通道情况下,需要几个基本单元来建立一个自校准系统。选择这些单元的输入信号有多种选择。四种不同的结构可以由图3中的描述来区分,这些结构分别由字母A,B,C和D来分别描述,假设输入信号是关于期望信号时间对其的。在大范围的阵列组态中,这种对其可以通过使用补偿相对时间延迟的分数延迟滤波器来实现。4.2.1结构A从目标信号的阵列中任意选择的一个麦克风信号作为输出信号,其它M—1个麦克风的信号作为M—1个基本单元的参考信号。这些信号经过滤波器滤波,从而校正了与目标信号相关的部分。这些经过校正输出的信号可作为随后的波束形成器的输入信号。目标麦克风的信

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功