重庆大学硕士学位论文数据挖掘及神经网络在土木工程中的应用姓名:潘华申请学位级别:硕士专业:计算机技术指导教师:杨小帆;李本强20051001重庆大学硕士学位论文中文摘要I摘要数据挖掘就是从大量不完全的、有噪声的、模糊的、随机的实际数据中发现隐含的、事先未知的潜在有用的并且最终可理解的信息和知识的过程。而神经网络是数据挖掘常用的工具。本文旨在研究如何将数据挖掘技术及神经网络应用于土木工程。神经网络训练误差值的选取是一个具有挑战性的问题。目前多数处理这个问题的方法,是通过简单的试算法。结合土木工程应用,考虑训练样本的随机特性,本文提出了一个新的选取训练误差初始值的方法。该方法由实测值求出相应的真值置信区间,若训练误差的取值使得网络预测值落在真值置信区间内就可以认为此时的训练学习反映了网络输出变量的真值情况,学习就可以结束。此时允许训练误差大小为真值置信区间长度的二分之一。试验结果表明该方法能减少神经网络的训练时间。过去,对神经网络预测结果的评价广泛采用相对误差方法。对于有随机因素影响的样本数据,该方法已经不再适用。于是,本文对此进行了深入研究,以数理统计理论为基础,提出了适合随机问题的评价方法。该方法定义了模型预测的正确率这一概念,进一步由正确率导出模型预测结果正确的概率,以此来评价模型预测结果的可靠性。土木工程实际应用结果表明,该方法是可行的,评价结论更贴近工程实际。最后,针对在高性能混凝土配制方面的应用,利用可视化编程语言Delphi编制了应用软件,软件具有数据管理、网络训练、网络检验、性能预测和成本计算等功能。实际测试表明,软件达到了实用要求,具有工程实用价值。从而提高了高性能混凝土的生产效率。总之,本文从数据挖掘基本思想出发,在考虑有随机因素影响的条件下,对挖掘模型的训练及预测结果的评价方法进行了研究,提出了相应的分析计算方法。并成功地应用于土木工程。关键词:数据挖掘,神经网络,统计学,训练误差,性能评价重庆大学硕士学位论文英文摘要IIABSTRACTDatamining(DM)aimsatdrawingimpliedandusefulinformation/knowledgefrommassiveincomplete,noisy,blurry,andstochasticrealdata;whileneuralnetworkisafrequentlyusedtoolforDM.ThisthesisaddresseshowtoapplytheDMtechniqueandneuralnetworktocivilengineering.Thechoiceofthevalueofthetrainingerrorofaneuralnetworkisachallengingproblem.Toourknowledge,themajorityofexistingmethodsforthisproblemarebasedonthesimpletrialprocess.Withapplicationtocivilengineering,thisthesisadvisesanewmethodfordeterminingthetrainingerrorofaneuralnetworkbytakingintoaccountthestochasticcharacteristicofthetrainingsamples.Inthismethod,theconfidentintervaloftruevaluecorrespondingwithactualmeasuredvalueiscalculated.Asforacertainvalueofthetrainingerror,ifthepredictedvalueofaneuralnetworkmodelliesintruevalueconfidentinterval,itisbelievedthatthetruevalueofaneuralnetworkoutputvariablebeobtained,andthetrainingprocessofaneuralnetworkisover.Thus,aninitialvalueofthetrainingerrorcanbedetermined,anditishalftheconfidentintervaloftruevalue.Experimentalresultsshowthattheproposedmethodcandecreasethetimeoverheadrequiredbythetrainingofaneuralnetwork.Inthepast,thepredictedresultsproducedbyneuralnetworkmodelswereoftenevaluatedbyusingtherelativeerrorhasbeenwidelyappliedtothisproblem.Butitisnolongerfittedforrandomtrainingsamples.Therefore,basedonmathematicsstatisticstheory,thisthesispresentsanewevaluationmethodforevaluatingthesepredictedresultsbyintroducingthenotionofthecorrectionrateofprediction.Then,theconfidentintervalofcorrectionrateofthepredictionsisdeduced.Indeed,itcangiveanindicationastothelikelyfutureofaneuralnetworkmodel.Whenappliedtocivilengineering,experimentalresultsjustifythatthisevaluationmethodisuseful,anditsconclusionisclosetoengineeringactualities.AsetofsoftwareforhighperformanceconcretefabricationisalsodevelopedwithDelphi.enhancetheproductionefficiencyofhighperformanceconcretefabrication.Thesoftwaresuppliessomeimportantfuctionblocks,suchasdatamanagement,neuralnetworktraining,neuralnetworkchocking,performancepredictingandcostscalculating.Apracticaltestshowthatthesoftwareisactuallyuseful,andhasengineeringvalue,anditcanenhancetheproductionefficiencyofhighperformance重庆大学硕士学位论文英文摘要IIIconcretefabrication.Inconclusion,withthebasicthoughtofdatamining,consideringthestochasticcharacteristicoftrainingsamples,newmethodsforthetrainingofdataminingmodelsandtheevaluationofthepredictionsbyneuralnetworkshavebeenproposedandhavebeensuccessfullyappliedtocivilengineering.Keywords:DataMining,NeuralNetwork,Statistics,TrainingError,PerformanceEvaluation重庆大学硕士学位论文1绪论11绪论1.1选题意义土木工程中,混凝土以其在性能、施工、经济等方面的显著优点成为最广泛应用的人工材料,其结构也由此成为重要的建筑结构形式。有专家预计,在21世纪土木工程中,混凝土仍然是主要材料,即混凝土还将长期服务于世界。混凝土是土木工程中的重要建筑材料,其强度、耐久性等性能直接影响着建筑物的安全性和使用性能。随着人口爆炸、生产发展,资源枯竭、环境破坏尤为严重,地球承受的负担剧增,人类的生存受到严重的威胁。20世纪90年代起,新的混凝土原材料出现(作为混凝土主要原材料的水泥和外加剂的品种和产量增长非常快),促使了混凝土新品种、新技术的科研与应用的蓬勃发展,混凝土正向着高强度、大流动性、高耐久性即高性能混凝土的方向发展。“高性能混凝土是一种新型高技术混凝土,是在大幅度提高普通混凝土性能的基础上,采用现代混凝土技术,选用优质原材料,在严格的质量管理条件下制成的;除了水泥、水、集料以外,必须掺加足够数量的细掺料与高效外加剂;高性能混凝土应重点保证下列诸性能:耐久性、工作性、各种力学性能、适用性、体积稳定性以及经济合理性”[1]。高性能混凝土相对于普通混凝土的优点主要体现在以下几个方面:(1)工作性好,新拌混凝土的工作性是指拌和物在搅拌、运输、浇筑等过程中能保持均匀、密实而不分层离析的性能;(2)抗压强度高,高强是高性能混凝土的重要特征之一。混凝土强度的提高,可以使相同截面尺寸的构件的承载力大幅增加,而在相同的荷载下则可使构件的截面减少,对于结构物来说,减小截面尺寸意味着降低结构自重,从而减轻地基基础的负荷。同时,减小截面尺寸对房屋建筑来说还可以增加使用面积和有效空间,如深圳鸿昌广场[2],原设计用C40混凝土,改用C60混凝土后,增加使用面积达1060平方米,经济效益十分明显,并可使建筑物的感观大大改善。对桥梁建筑来说可以增加桥下净空或降低两岸路堤标高,对地下建筑来说可以减小岩土开挖量,等等。(3)耐久性优异,高性能混凝土具有优良的抗渗性、抗冻性、抗磨性以及对盐类和化学物质的抗侵蚀能力;(4)方便施工,在工程中同时使用不同强度的混凝土,可以尽量统一构件尺寸,为划一施工模板提供了条件。高性能混凝土不仅在性能上对传统混凝土有很大突破,而且在节约能源、资源、改善劳动条件,尤其是环境方面有着十分重要的意义,是一种可持续发展的绿色材料。由于高性能混凝土在土木工程中独特的优越性,如在工程安全使用、经济合理性、环境条件的适应性等方面的明显效益,而被各国学者所接受,被认重庆大学硕士学位论文1绪论2为是今后混凝土技术的发展方向。总之,高性能混凝土因其优异的综合性能必将逐步取代过去的普通混凝土,可以预想,21世纪将成为高性能混凝土的时代。但迄今为止,由于组成高性能混凝土的原材料多而复杂,影响因素众多,且高性能混凝土各种组份对混凝土质量影响呈非线性的特点,使得高性能混凝土配合比的模式特征不明确,目前尚无成熟的理论和经济有效的工程实用方法。在实际工程中配制高性能混凝土时,往往要事先进行大量的试验工作,造成大量人力、物力和财力的浪费。数据挖掘是近年来随着人工智能、数据库技术和统计学等学科的发展而出现的一门新兴的信息技术,是应用需求推动下多种学科融合的结果[3],由于它在信息处理和知识获取过程中具有显著功能而使其逐渐获取极大的关注。数据挖掘的实质是从数据中发现隐藏的、内在的和有用的知识或信息的过程。这对于那些有一定的实际经验却又难于建立有效数学力学模型的工程领域具有重要的现实意义。因此,对于高性能混凝土的配制问题,可以借助数据挖掘方法,在一定数量的实验数据的基础上,建立原材料各组份与测试指标之间关系的数据挖掘模型。同时开发出相应的计算软件,使得高性能混凝土的配合比设计向着计算机智能自动化的方向发展,有助于高性能混凝土配合比设计和质量控制水平的提高。1.2数据挖掘及其应用研究现状综述1.2.1数据挖掘的产生随着现代信息技