河北工业大学博士学位论文基于机器人听觉系统的声源目标定位研究姓名:陈涛申请学位级别:博士专业:机械制造及其自动化指导教师:张明路2010-12河北工业大学博士学位论文I基于机器人听觉系统的声源目标定位研究摘要随着各国对国家安全、社会治安等公共事业的高度重视,研究在危险环境中利用多感官、高智能的危险作业机器人系统代替人类工作具有重要的理论意义和应用价值。机器人对于可疑目标的精确定位是各种作业的基础。声源目标是众多目标中最常见的一类作业对象,快速、精确的进行空间声源目标的方位识别是拟人机器人作业的基本要求,也是声源目标的分离和语音识别的基础。对于危险环境中的拟人机器人而言,作业的实时性和定位的准确性是非常基础和重要的指标,因此复杂的系统装置和定位算法在加大成本的同时,也将影响机器人作业的效率,不利于危险环境的运行要求。本论文来源于国家863计划项目“极限环境下面向危险品检测的多感官机器人系统”(项目编号:2006AA04Z221)的支持,旨在追求高精度的声源目标定位要求。课题的总体思路是利用自主研发的多感官、多自由度拟人机器人头部系统中的双耳听觉定位系统,通过“双耳效应”、“耳廓效应”、“头相关传输函数”等定位原理及其相应的定位线索,从声源的水平方位角、垂直方位角、目标距离等多个方位因素对空间声源目标进行全方位的综合定位,同时结合拟人机器人头部的自身特点,对定位精度误差较大的高方位角进行进一步的优化。总的来说,本文的创新性工作主要包括:1、根据拟人机器人听觉定位系统的特点,提出了利用双缓冲及多线程技术对两耳麦克风传感器之间的信号进行实时同步采集。在信号采集过程中,利用归一化的方法将采集的数据转化成Matlab能直接分析的信号格式;同时,利用分帧、加窗、端点检测等信号预处理技术,从采集的冗长信号段中提取有效的信号片段,从而大大减小了冗于信号的无效传递与分析,便于提高定位的效率。2、对于信号消噪,论文采用了基于小波变换的阈值消噪方法。阈值的选择是决定消噪效果的关键,在阈值的选择中,课题采用了基于块阈值的消噪方法,通过合适的定义块(block)的大小,可以获得比传统软阈值消噪方法更好的消噪效果。同时在阈值消噪过程中,利用了平移不变的小波原理来有效地抑制伪吉布斯现象,减少原始信号和评估信号的均方根误差,以获取更高的信噪比。3、课题采用机器人头部转动时引起的双耳麦克风接收的信号声压变化差异判断声源相对于机器人的前后方位,以此来解决“镜像模糊”。对于声源水平方位角的评估,则基于声波到达时间差(TDOA)的定位原理,采用“双耳效应”中的双耳时间差(ITD)、双耳声压差(ILD)、双耳相位差(IPD)等多种定位因素,对不同信号频率的声源目标水平基于机器人听觉系统的声源目标定位研究II方位进行定位。垂直方位角的判断则利用“耳廓效应”原理,依据耳廓对信号的反射作用所引起的谷点频率(notchfrequency)中含有的方位信息,据此信息为基础构建垂直方位角评估函数,从而对方位信息进行评估。同时,论文还提出了最佳的耳廓装置选择方案,给其他应用提供了参考依据。4、多自由度是课题中拟人机器人的主要特点之一,利用多种自由度,可以优化一些模糊方位的评估误差。当声源偏向机器人头部的某一侧,即水平方位角和垂直方位角较大,此时利用传统定位方法评估的方位误差较大,课题则利用机器人头部的左右转动自由度和前后摆动自由度,对水平方位及垂直方位评估算法进行改进、补偿,并通过实验仿真检验了算法的可行性。关键词:同步信号采集、块阈值消噪、头相关传输函数、水平方位评估、垂直方位评估、耳廓、自由度扩展定位河北工业大学博士学位论文IIIRESEARCHONSOUNDSOURCELOCALIZATIONBASEDONROBOTAUDITORYSYSTEMABSTRACTAsgreaterandgreaterimportanceisattachedtothepublicutilitiessuchasnationalsecurityandpublicorder,theresearchonthesystemoftherobotwithmulti-sensorandhighlyintelligentthatcanreplacehumanbeingsinthehazardousenvironmentstoperformmissionssoastofreethemfromworkingindangerisofgreattheoreticalandpracticalsignificance.Becausesoundsourceisthemostcommontargethandledbyrobotindangerousenvironment,rapidandaccuratesoundlocalizationisnotonlythebasicneedforhumoidrobot,butalsothebasisofsoundtargetseparationandspeechrecognition.Forhazardousenvironment,realtimeandlocalizationaccuracyarethebasicandmostimportanttargets;therefore,complexsensorydevicesandlocationalgorithmswillaffecttheefficiencyofrobotoperationswhichcannotmeetthespecialenvironmentofhumanoidrobot.Thispaper,aimingatachieveingthehighaccuracyofsoundsourcedirection,issupportedbytheHi-techResearchandDevelopmentProgramofChina--theMulti-SensoryRobotSystemofDetectingDangerousGoodsinExtremeEnvironments(No.2006AA04Z221).Theoverallideaofpaperistousethebinauralmicrophonelocalizationsystemofthehumanoidrobotwithmulti-sensoryandmulti-DOF(degreeoffreedom)designedbyourselves,andestimatesoundsourcedirectionfromazimuthdegree,elevationdegreeandsounddistancewithbinauraleffect,pinnaeeffectandhead-relatedtransferfunction.Also,inordertooptimizetheerrorinhighdegreedirectionofsoundinazimuthandelevation,theDOFwillbeinvolvedinsoundlocalization.Overall,thispaperincludesthefollowingoriginalpoints:1.Accordingtothecharacteristicsofrobotauditorylocalizationsystem,paperproposesthemethodofsignalacquisitionsynchronizationwithusingdoublebufferingandmulti-threadtechnologiesbetweenmulti-microphonesensors.Inthesignalacquisitionprocess,alsousenormalizedmethodtoconvertethecollecteddataintotheformatforMatlabanalysisingdirectly,whileusesignalpre-processingtechnologies,enframe,windowedanddualdiscriminantsignalsendpointdetectionmethod,toextracteffectivesignalfragments.Therebywiththesepre-processingmeasures,greatlyreducetheredundantandinvalidsignaldataintransmissionandanalysis,whichwillimprovethespeedofsoundsourceloacalization.基于机器人听觉系统的声源目标定位研究IV2.Forsignaldenoising,paperusesthresholddenoisingmethodbasedonwavelettransform,andhowtochoocethethresholdisthemostkeyfactorindenoising.Paperadoptstheblockthresholdingwaywhichcanbeobtainedmoreeffectiveresultthantraditionalsoft-thresholddenoisingmethodbydefiningtheappropriatesizeoftheblock.AlsotheSNR(signal-noise-rate)canbeimprovedwithshiftinvarianttheoryofwaveletwhichcansuppressPersudo-GibbsPhenomenonandminishroot-mean-squareerrorbetweentheoriginalsignalsandestimatedone.3.Withthesoundpressurechangescausedbypinnaedevicesandheadshadowinrotation,papergivestherulestodeterminefront-and-backfuzzylocalization.AndtheTDOAtheoryisusedtoestimatetheazimuthofdifferentfrequenciessoundsourceinhorizontalplanewithbinauraleffectincludingITD,ILDandIPDfactors.Alsonotchfrequenciesofpinnaeprinciple,signalelevationdegreecanweestimatedwithelevation-frequencyevaluationfunctionsestablishedinexperiments.Meanwhile,thepaperalsoputforwardthebestpinnadeviceoptionsbasedonelevationlocalizationwhichcanbereferredbyotherapplicationswithpinnae.4.Weknowthatthelocalizationerrorislargerthanotherdirectionswhensoundisclosetoonesideofrobothead.Therefore,paperprovidesthattherotatingandswingDOFsofrobothead,mainfeatureofprojectrobot,canbeusedtooptimizethesedirectionerrors.Also,weclarifythealgorithmfeasibilitythatpaperproposedthroughsystemsimulationexperiments.KEYWO