神经网络方法在钢筋混凝土工程估价中的应用摘要:在发展中国家,神经网络方法可以为混凝土工程的造价分析提供一种指导性的工具,以克服各种变化因素已经主观因素的影响。本文中,提出3中神经网络方法来评价一个发展中建筑市场里模板工程、钢筋工程以及混凝土工程的生产率。18名专家被分在6个项目中手机数据,92项数据被收集用于分析。应用了商业软件进行神经网络的计算。处理过的数据被用于建立、训练、检验神经网络。神经网络产生的框架显示出足够的收敛性已经相对较强的普遍适用性。当对输入数据进行敏感性分析时,本框架也能对变化趋势的做出很好的表示。关键词:神经网络;混凝土;生产率;计算机辅助;发展中国家;项目管理前言投资估算对于顺利完成建设工程项目是很必要的内容。对建筑工程的估算可以分为对直接费用、间接费用、不确定费以及利润等。直接费用包括材料费、人工费和机械费。直接费是指构成工程实体的各项费用,它由各项定量指标和定性指标构成。定量因素包括单位材料价格、单位人工工资、单位设备租赁费用和折旧。定性因素更难确定,包括各种生产率以及建设风险等。有经验的估价师依靠他们的经验对定性因素做出判断。而相对缺少经验的估算师则可以通过工具来组合各种不确定因素。神经网络方法是通过模仿人脑的功能,像人脑一样,通过对以往的学习,对数据做出归纳和总结。数据网络在建设工程方面得到很多的应用。Portas和Abourizk(1997)设计了一套神经网络系统对梁、板、墙工程中模板的生产率进行分析。Sonmez和Rowings(1998)发展了对模板组装、混凝土浇捣、凝固过程的估算。Arditi和Tokdemir(1999)试图用神经网络预测建筑工程诉讼的结果。Alsugair和Al-Qudrah(1998)则用神经网络决定公路的翻新与否。Hegazy和Ayed(1998)则用神经网络对高速公路进行估价。Lietal(1999)则对建筑项目的投标确定进行顺利网络分析。在发展中国家,整个建筑工程环境由于许多不确定因素的影响而显得更加具有风险性,因此对直接工程费的影响也就更大。这些国家的工程师需要有效的工具来帮助他们更好地完成工程的估价。本文把目光投向埃及,一个有着新兴经济体制,拥有7000万人口和广泛基础设施及工业工程项目需求的中东国家。在埃及,混凝土结构占了建筑工程的大多数。我们尝试说明神经网络在对混凝土相关工程中工人生产率进行估算的过程。这以研究是通过实际工程项目中由专家掌握的数据来实现的。方法论这项研究的目标是在考虑定量因素和定性因素的情况下建立能够预测模板组装、钢筋搭接、混凝土浇捣过程中的生产率的神经网络模型。为实现这个目标,系统方法论是可行而且必要的。调查表格最初的调查表格是以文献查阅的方式获得的,它包含了影响混凝土工程生产率的各因素(ChaoandSkibniewski1994;Halliganetal。1994;Ersoz1999;Thomasetal.1999)。最初的表格经过5名经验丰富的工程管理专家的的讨论和修改,目的是将文献中的各项因素于当地市场的实际情况想结合。具体表格见图1混凝土工程生产率调查表本调查的目的是在考虑定性和定量因素情况下各因素对混凝土工程生产率的影响。参与者资料填表人地点公司填表日期项目信息项目名称业主项目位置项目顾问项目类型承包商总体情况结构类型混凝土用量工期(模板、钢筋以及钢筋)温度条件冷适中热施工环境良好适中恶劣模板组装信息工种人数工期模板类型脚手架类型监理力度小充分严格工人熟练度不熟练适中熟练工人加班时数多少工艺复杂程度典型复杂材料可达性高适中低返工率无中等高钢筋工程信息工种人数工期钢筋重量监理力度小充分严格工人熟练度不熟练适中熟练工人加班时数多少工艺复杂程度典型复杂材料可达性高适中低返工率无中等高混凝土浇捣信息工种人数工期浇捣方式预制现浇混合监理力度小充分严格工人熟练度不熟练适中熟练工人加班时数多少工艺复杂程度典型复杂材料可达性高适中低返工率无中等高总体评价图1混凝土工程生产率调查表数据收集数据收集包括对定性数据和定量数据的收集。定量数据对神经网络不会对造成太多的干扰,因为它是在同一环境和时间段内记录的数据,而定性数据有一定的主观性,主要靠专家的判断和经验。为了最大程度地减少这种影响,笔者倾向于对以往调查问卷中的数据进行训练。这种训练从调查者手中的数据得到更好更持续的反馈。18名专家分别在6个不同项目中收集了92份调查表格。被调查者都是当地拥有5~10年混凝土工程施工经验的工程师。每个被调查者都是具有相对独立性(在不同的公司或者项目等)。本研究选择项目主要从3个方面考虑。首先,被选择的项目必须有较多的混凝土施工资料。第二,在调查期的1~2年之间,这些项目中的混凝土施工方法基本相同。第三,调查中的混凝土构件和材料应当是在当地具有普遍性的构件和材料。如上,我们选择了平板混凝土基础、独立基础、斜面上的筏板、楼面板、梁、柱和剪力墙。较新的模板工艺如滑模、上升模板、提升楼板。这些工程中普遍采用40MPa以下的混凝土标号,并且包含了商业、工业、住宅等各类建筑。数据处理数据处理包含3项步骤。第一步为将调查表格中的数据输入到一张主要表格中。主表格分为5部分,第一部分处理总体数据,而对于模板工程、钢筋工程、和混凝土浇捣,数据的输入部分是一样的,分别为:项目名称、项目地点、参与者的关系、结构构件类型、混凝土用量、温度条件已经施工环境。而第二、第三、第四部分为三个独立部分,分别包括影响混凝土工程中的3大要素的各因素,每一部分被用于发展出独立的数据网络。表1中列出发展各自数据网络的因素。而第五部分则是三大主要部分的每日预期生产率。表1.影响相应神经网络(NN)的因素因素模板工程NN钢筋工程NN混凝土浇捣及凝固NN结构构件···混凝土用量·――·钢筋用量――·――工种人数···脚手架类型·――――模板类型·――――浇捣类型――――·监督···工人技术···加班···工艺复杂程度···材料可达性···返工率···温度条件···第二步就是把数据转化为可用于数据网络计算的数值和计算公式。如果表中的数据为数值,则可直接转化,每个数值数据都与矩阵中特定的位置想对应并且直接填入,这种数据包括:混凝土用量、钢筋重量、和工种人数。如果数据是以文字形式出行,必须将它转化为数值形式以便计算。表2列出文字选项以及其在神经网络中对应的数值。表中数据越小,表示对生产力的影响越大,然后专家的描述和文字记录确定其相应的数值和在神经网络中的位置。表2.文字数据的数值转化因素选择结构构件类型PC基础FC基础筏基水平构件垂直构件12345脚手架木脚手架钢脚手架――――――10――――――模板木模胶合板钢模――――210――――浇捣类型传统浇捣商品砼配料车间――――210――――监理力度少充分严格――――210――――工人技术少中等高――――210――――加班情况无有――――――10――――――工艺复杂程度典型复杂――――――10――――――材料可达性容易适中困难――――210――――返工率无适中高――――210――――温度条件冷适中炎热――――210――――工作环境良好适中恶劣――――210――――-神经网络的输出层表示预期能实现的生产率。可以计算人均指标(PortasandAbourizk1997)。每一个分矩阵和主表格之前都有计算式联系以计算生产率。计算式如下:模板工程生产率(工日/m3)=模板工种人数*模板工程时间(天)/混凝土用量(m3)钢筋工程生产率(工日/ts)=钢筋工种人数*钢筋工程时间(天)/钢筋重量(ts)混凝土工程生产率(工日/m3)=混凝土工种人数*混凝土浇捣时间(天)/混凝土用量(m3)以上等式包含了工日的概念,而其它概念如(m3/天)则未包含人均的因素。数据处理的第三步是对数据进行随机化和标准化。这以部分运用到商业软件(NeuroSolutions42001)。因为数据主表格的数据是从人工记录得来,为了防止数据单调性,随机化数据是必要的。数据随机化使神经网络的的有和好的普适性和更平滑的收敛性。而标准化是软件的另一用处,这以过程把矩阵中的数据转变为0~1中的数值,这一转变能够让神经网络的运算更迅速,执行力更高。网络结构网络体系包括神经网络基本单元的构成,它们的组织,以及影响它们的参数。NeuroSolution42001被用于生成、训练及测试神经网络。为了选择合适的神经网络,众多的网络结构被生成、训练以及比较,以下为选择网络结构的依据:1、神经元的数量应该合适,即要满足集聚又不能过多导致神经网络记忆过多。2、隐层的数量应该尽量少以减少过长的训练时间。神经网络的选择依据是通过均方差(MSE)。详细的论述入下。网络结构的参数用神经网络解决问题时需要确定的关键问题是训练法则。有很多法则可供选择,后传播的运算法则属于有指导的学习规则,这种法则理论性强在非线性模型中运用较好,编码简单。本文中在3个神经网络中运用的转换函数为双曲线正切函数(tanh)。软件提供的S形曲线函数、线性函数以及其它函数也被测试,得出的结果都不够理想。连机训练指每次训练或者样本输入之后对积累的误差进行处理。批处理训练指总数据进行训练之后对积累的总误差进行处理。这两种处理方式的结果表明,在本例中,批处理方式能产生更好的收敛性。选定的训练组中所有案例的训练叫做一批(epoch),批中所含有训练的数量叫做批的规模。批的规模在1000~50000之间,我们选择25000作为批的规模。因为批规模低于25000时收敛性不满足要求,而大于25000时,训练时间会明显增加。因此在此规模下平均训练时间在10~40分钟之间,这于神经元的数量也有关系。选择合适的隐层数量和相应的神经元数量。在模板工程NN、钢筋工程NN和混凝土工程NN上实验过的神经网络分别有22个、15个和51个。这些神经网络的不同就在于神经元和隐层数量的不同。最后确定神经网络的依据达到3项允许值均方差,分别为训练均方差,训练输入/输出均方差,检验输入/输出均方差。训练均方差是神经网络中每个神经元的预期值和需要值之间的差的平方和。均方差的表达式为:MSE=NPydPjNiijij112)(MSE:均方差P:输出子项数N:样本数dij:样本i中j子项的预期输出值Yij:样本i中j子项的模型输出值表33个神经网络的隐层数量和相应的神经元数量。参数另外一项重要步骤是训练样本和测试样本数据的分配。训练样本为神经网络的学习提供数据,而测试样本对神经网络的计算不起作用,它只用来测试神经网络的概括性和兼容性。对于训练样本和测试样本的比例分配并没有明确的规则和指标,但是保证足够的训练样本以使神经网络收敛是很重要的。训练和测试的过程是动态和连续的,也就以为着有更多数据的情况下,可以进行进一步的训练和测试。为了决定两者之间合适的比例,本文采用两种分组,即90%训练数据和10%测试数据,以及50%训练数据和50%测试数据。在初步测试后发现第一种组合的准确性更高。因此本研究采用了90%-10%的比例。表4列出3个神经中数据的分配情况。综上所述,本文使用的神经网络的训练数据和测试数据的比例分配为90%对10%,都采用后传播的运算法则,并在批的规模为25000下使用双曲线正切函数为激发函数。神经模型合理性验证在选定批规模下训练完成后,神经网络会使用它达到的内部各神经元的权重。此后的计算都会采用这些权数。因此,需要验证神经网络的概括性和学习范围。对模型输出生产率和预期生产率之前进行比较可以得出神经网络的正确性。我们用模型输出值达到预期输出一定范围内的比例来衡量神经网络的正确性。笔者选择了70%、80%、90%三个等级表征神经网络的可靠性,需要说明的是,这种可靠性是建立在有限数据进行训练和测试的基础上。训练样本和测试样本的预测表5~7列出模板工程、钢筋工程以及混凝土工程的训练样本的正确性。数据表明本研究的神经网络已经具备足够的收敛性。在正确率为70%的水平时,模板工程NN、钢筋工程NN和混凝土工程NN的生产率分别为95%、99%、88%。在正确率为90%的水平时,模板工程NN、