华中科技大学硕士学位论文图像特征提取方法研究及应用姓名:常昌申请学位级别:硕士专业:系统工程指导教师:石晓龙20090524华中科技大学硕士学位论文摘要随着科技发展和图像信息的大量产生和交流,目标图像的自动识别和分类应用越来越广泛,同时实际应用问题对目标识别技术的要求也越来越高,计算机自动识别技术远没有满足实际应用需求。图像识别分类技术一般包括几个阶段:图像预处理、图像特征分割、特征提取和自动分类器设计等,其中特征提取的内容和方法尤为重要。特征提取为分类器提供所有依据,它的表征性能直接决定了识别分类的效率和精度。在实际问题中,特征提取可能受到背景、视角、光照、大小等噪声干扰,如何提取具有良好表征性能且受到噪声干扰较小的特征参数,是应用研究的重要问题。本文针对钢铸坯图像的分类和评测的实际应用问题,研究以铸坯图像为识别目标的特征提取技术。针对钢铸坯的主要缺陷—中心偏析,提出实际特征提取的内容和方法,分析处理特征参数数据。在图像分割的基础上,研究分析中心偏析的特性,提出特征参数提取的主要内容,主要依据图像像素点灰度和区域分布特性进行特征提取。针对图像分割的两种结果,提出全局阈值和动态阈值两组特征的提取。根据中心偏析区域特点,提出使用拟合直线方法确立偏析线方向,提出拟合方法并研究应用效果。利用拟合的直线,对图像像素点灰度值进行行投影,为特征提取提供依据。提出13种特征参数的提取内容和方法,将13种特征参数分为三类研究论述。依据特征提取基本原则对特征参数进行选择优化,选择10种重要参数组成特征向量,并针对识别分类具体问题提出分类特征向量。本文以针对具体问题构造新的特征提取内容和方法为主要研究方向,并结合样本图像进行数据分析和研究。对后期特征优化和分类器设计的研究不足,将在以后的研究工作中予以关注。关键词:特征提取中心偏析行投影灰度特征特征向量I华中科技大学硕士学位论文AbstractWiththedevelopmentofscienceandthegenerationandexchangeofalargenumberofimageinformation,theautomaticidentificationandclassificationofimagehasbeenwidelyapplied.Meanwhile,therequirementsoftechnologyoftargetrecognitionhasbeenincreasedbecauseofactualapplication.Thetechnologyofautomaticidentificationwithcomputerisfartomeettheactualapplicationrequirements.Generally,thetechniquesofimagerecognitionandclassificationincludeseveralstages:imagepreprocessing,imagefeaturesegmentation,featureextractionandautomaticclassifierdesign,thecontentandmethodoffeatureextractionisparticularlyimportant.Featureextractionprovidesallthebasisforclassifier,anditscharacterizationdeterminestheefficiencyandaccuracyofrecognitionandclassificationdirectly.Inpracticalapplications,thefeatureextractionmaybeinterferedbybackground,perspective,illumination,size,etc.Howtoextractgoodfeatureparametersthathasgoodcharacterizationandhighnoiseimmunity,isimportantissuesofresearchofpracticalapplications.Inthispaper,weresearchthetechniquesoffeatureextractionwhichtheimagesofsteelslabasrecognitiontarget,fortheapplicationoftheclassificationandevaluationofsteelslab.Forthemaindefectofsteelslab—centersegregation,webringforwardthecontentandmethodsofactualfeatureextraction,andanalyzethedataoffeatureparameters.Basedonimagesegmentation,weanalyzethecharacteristicsofcentersegregation,andbringforwardthecontentoffeatureextractionthatmainlybasesongrayfeatureanddistributionofimagepixels.Andextracttwogroupsfeatureswhichareoverallthresholdfeaturesanddynamicthresholdfeatures,thatbasedonthetworesultsofimagesegmentation.Accordingtotheregionalcharacteristicsofcentersegregation,webringforwardthemethodoffittingstraightlinetoestablishthedirectionofcentersegregation,determinethemethodoffittingstraightlineandresearchtheresults.Weusethestraightlinetorowprojectthegrayvaluesofimagepixel,toprovidebasisforfeatureextraction.Bringforwardthecontentsandmethodsofextractionof13kindsoffeatureparameters,andII华中科技大学硕士学位论文dividedtheminto3categoriesforresearch.Basedonthebasicprinciplesoffeatureextraction,weselect10kindsimportantparameterstocomposethefeaturevectors.Andclassifydifferentvectorsforspecificissuesofidentification.Inthispaper,themainresearchisconstructnewcontentsandmethodsoffeatureextractionforspecificissues,analyzeandresearchthedataofsampleimages.Thelaterfeaturesoptimizationandclassifierdesignisnotenough,futureresearchwillbeconcernedtothat.Keywords:featureextractioncentersegregationrowprojectgrayfeaturefeaturevectorsIII独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在_____年解密后适用本授权书。本论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文1绪论1.1问题的提出及研究意义在信息飞速产生与交流的今天,图像是获取信息的主要途径之一。图像是直观性很强的重要信息表达形式,也是昀难获取、处理与实现的信息,并且图像的信息作用很难用其他信息形式代替。图像技术在科学研究、工业生产、国防科技、航空航天、医疗卫生、交通管理等各个领域中都有广泛应用。然而直接获取的图像往往不能满足特定需求,因此需要对图像进行处理和分类标识,这就是图像处理。通常所说的图像处理主要是指数字图像处理,也就是利用计算机技术对数字图像进行处理[1][2][3]。随着计算机和电子技术的快速发展,图像的获取和使用越来越方便,海量图像信息的分析和处理也显得愈加重要,对图像进行标识和分类具有重要的研究价值和意义。对特定图像进行标识分类昀主要的方法是图像的特征提取,图像的识别过程中,需要研究图像固有的、本质的重要特征或属性进行量测并将结果数值化[4]。图像的特征是指图像中可用作标志的属性,包括自然特征(亮度、色彩、纹理等)和人为特征(频谱、直方图等)。特征提取是对图像所包含的信息进行处理和分析,将不易受随机因素干扰的信息作为该图像的特征提取出来[5][6]。特征提取是去除冗余信息的过程,具有提高识别精度、减少运算量、提高运算速度等作用。一般情况下,良好的特征应具有四个特点[1]:区别性:不同模式类别的特征之间差别越大越好,对于不同类别对象的特征值应具有明显的差异性。例如,对于乒乓球和足球的区分其直径就是一个很好的特征,因为它们的直径有明显的差别。可靠性:同一模式类别的特征应具有类似的值。例如,对于成熟程度不同的苹果来说颜色是一个不好的特征,因为青苹果和红苹果都属于苹果一类,但是它们的颜色差别很大。独立性:特征之间应该彼此互不相关,若两个特征反应的基本上是相同的属性,则不适合同时使用两种特征。例如,水果的直径和重量属于比较相关的两个特征,因为重量大致和直径的三次方呈正比,它们基本上都反映了水果的大小。有时相关性很强的特征可以结合起来使用以增强适应性,但它们一般不应该作为单独的一个1华中科技大学硕士学位论文特征来使用。数目小:图像识别系统的复杂度会随特征个数的增加而快速增加,用来训练分类器和测试结果的样本数量会随着特征的数量呈指数关系增长。若增加适应性不强的特征或者与已有特征有较强相关性的特征,反而会使分类器的分类能力下降,降低系统识别分类的能力。在实际应用中提取特征时,往往是先试验测试一些直觉和视觉上合理的特征,然后选择并优化这些特征以产生数目合适的昀佳特征集。通常符合上述四个特点的理想特征是很少甚至是没有的。同时在实际钢铁生产过程中,需要对生产出的钢铸坯进行内部质量信息进行跟踪监测,而检测方法是对经过冷酸蚀后的钢铸坯图像表面缺陷进行观测,也即依据于铸坯图像评定缺陷的等级[7]。目前铸坯缺陷检验评级方法仍然采取人工评级模式,即将钢铸坯图片与YB/T4003-1997《连铸钢板坯低倍组织缺陷评级图》进行人工目测对比后给出评级报告,因此这种评级方法不可避免的存在误差大、评级滞后、缺乏数据库支持等缺陷。因此本文提出对钢铸坯图像结合计算机进行自动化处理,对图像进行特征提取和自动识别分类,评定缺陷等级,以增强缺陷评定的准确和