Abaqus软件关于并行计算的测试报告现代CAE分析的发展对计算能力提出了越来越高的需求,Abaqus作为功能最为强大的CAE分析软件之一,在生产和研究中为各国的工程师和研究人员所广泛采用。Abaqus提供了强大的并行功能,它采用Threads和MPI两种并行模式,可应用于SMP或者Cluster。本文不仅对Abaqus的并行计算的功能进行了简单介绍,而且在各种不同的操作平台上对不同分析算例进行了测试,提出了一套完整的解决方案,对于用户在Abaqus软件和硬件的选取都具有一定的参考作用。一、CAE分析对高性能计算的需求CAE就是用计算机辅助求解工程和产品的强度、刚度、屈曲稳定性、动力响应、热传导、弹塑性等力学性能以及性能的优化设计等问题的方法。从20世纪60年代初开始,CAE技术逐渐被应用于解决复杂的工程分析计算问题。CAE的广泛应用使得工程和产品的设计水平发生了质的飞跃。经历了40多年的发展历史,CAE理论和算法都经历了从蓬勃发展到日趋成熟的过程,现已成为工程和产品结构分析中(如航空、航天、机械、汽车、土木结构等领域)必不可少的数值计算工具,同时也是分析连续力学各类问题的一种重要手段。随着现代科学技术的发展,人们正在不断建造更为快速的交通工具、更大规模的建筑物、更大跨度的桥梁、更大功率的发电机组和更为精密的机械设备,因此,要进行CAE分析设计必须获得更高的计算能力,主要表现在:要处理更多的工程数据:现代勘探和测量技术的发展,使得在设计、生产或施工前后都能获得大量的数据,数据的及时有效处理能为后继的、生产或施工提供有力的指导;要处理更大规模的问题:为了提高分析的精度,必须采用更精密的网格划分、模拟更加精细的结构,使得问题规模不断扩大;要完成更加困难的分析:在分析中要考虑更多的影响因素,不仅要处理线性弹性问题,还要处理非线性、塑性、流变、损伤以及多物理场的耦合等,分析起来更加困难;要进行更深层次的优化:为了降低成本,提高经济效益,对设计要反复进行优化,而且优化的规模也日渐增加。因此,如何的提高求解效率就成为比较重要的问题。Abaqus拥有高性能并行计算能力,将使CAE工程师能更快、更好地解决更大、更难的实际工程和产品设计问题,从而创造更多的价值。二、Abaqus及其并行计算功能简介Abaqus是一款功能强大的有限元分析软件,它有两个主求解器模块——Abaqus/Standard和Abaqus/Explicit,可以分析复杂的固体力学、结构力学系统,特别是能够驾驭非常庞大复杂的问题和模拟高度非线性问题。Abaqus不但可以做单一零件的力学和多物理场的分析,同时还可以做系统级的分析和研究,Abaqus在大量的高科技产品研究中都发挥着巨大的作用。随着并行有限元分析的发展,Abaqus的并行计算日益成熟。Abaqus支持Threads和MPI两种模式的并行,Threads模式只能在SMP系统上运行,而MPI模式则在SMP或者集群系统上都可以运行。Abaqus/Standard的并行求解器包括:具有动态负载均衡功能的并行直接稀疏矩阵求解器、基于区域分解的并行迭代求解器、并行Lanczos特征值求解器和并行AMS特征值求解器;Abaqus/Explicit的并行求解器也是基于区域分解的。目前国内应用Abaqus的单位很多,当处理实际问题时,计算规模的增加非常快,1000万以上自由度的问题也并不鲜见,而20万左右自由度的问题在单机上进行计算时,要在合理的时间内得到一个分析结果已经非常困难,更不用说反复进行优化。这样单CPU的计算能力已经越来越难以满足实际计算的需求,因此我们需要采用多CPU并行计算来提高求解效率。三、Abaqus的测试实例对于整个的并行计算的测试,问题包含Abaqus/Standard的线性和非线性的问题测试以及Abaqus/Explicit的问题测试。1、Abaqus/Standard的测试题目下面描述的问题提供了在不同性能的计算机上运行Abaqus/Standard时期望的性能估计。问题对于Abaqus/Standard的应用是很具有代表性的,包含线性静态,非线性静态和自然频率提取分析等。S1:平板在重力作用下的变形图1这是一个重力载荷作用下的线性静力分析问题。平板是采用二阶的壳单元,单元类型为S8R5,并且采用的是一个线弹性的材料模型,平板的一边是固定的,模型中没有接触。S1增量步数目:1迭代数目:1自由度数目:1,085,406浮点操作数目:1.89E+011要求最小内存:587MB要求硬盘空间:2GBS2:受离心荷载的飞轮图2这是一个在离心力载荷作用下有轻微非线性的静力分析的问题。飞轮采用的是一阶六面体网格,单元类型为C3D8R,采用的是各向同性的Mises塑性硬化材料模型,问题中没有接触,由于在螺栓孔附近处的局部的屈服会导致问题的非线性的增加。提供关于问题的两个版本的测试,两个版本的模型是一样的,只是求解器不同,一个采用的是直接稀疏矩阵求解器,另一个采用的是迭代求解器。S2a:直接稀疏矩阵求解器版本增量步数目:6迭代数目:12自由度数目:474,744浮点操作数目:1.86E+012要求最小内存:733MB要求硬盘空间:4.55GBS2b:迭代求解器版本增量步数目:6迭代数目:11自由度数目:474,744浮点操作数目:8.34E+010要求最小内存:2.8GB要求硬盘空间:387MBS3:涡轮推进器的频率提取图3这是一个提取涡轮推进器自然频率和模态的问题。涡轮推进器是采用的二阶四面体网格,单元类型为C3D10,并且采用的是线弹性的材料,要求的频率范围是从100Hz到20,000Hz。提供关于问题的三个版本的测试:一个是360,000个自由度的版本,采用的是Lanczos特征值求解器,一个是1,100,000个自由度的版本,采用的是Lanczos特征值求解器,一个是1,100,000个自由度的版本,采用的是AMS特征值求解器。S3a:360,000DOF,Lanczos特征值求解器版本自由度数目:362,178浮点操作数目:3.42E+11要求最小内存:384MB要求硬盘空间:4.0GBS3b:1,100,000DOF,Lanczos特征值求解器版本自由度数目:1,112,703浮点操作数目:3.03E+12要求最小内存:1.33GB要求硬盘空间:23.36GBS3c:1,100,000DOF,AMS特征值求解器版本自由度数目:1,112,703浮点操作数目:3.03E+12要求最小内存:1.33GB要求硬盘空间:19.3GBS4:螺栓紧固的汽缸盖模型图4这是一个模拟螺栓连接汽缸盖到发动机体上并带有轻微非线性的静力分析的问题。汽缸盖和发动机体是采用的四面体网格,单元类型为C3D4或C3D10M,螺栓是采用的六面体网格,单元类型为C3D8I。汽缸盖、发动机体和螺栓采用的是线弹性材料,但是垫片模拟采用的是由压力——闭合曲线定义的塑性材料,在螺栓和汽缸盖之间、垫片和汽缸盖之间、垫片和发动机体之间有定义接触,当接触条件发生变化或者由于螺栓拧紧导致的垫片材料的屈服都会使得问题的非线性增加。提供关于问题的三个版本的测试:一个是700,000个自由度、5个interation的版本,一个是5,000,000个自由度、5个interation的版本,一个是700,000个自由度、27个interation的版本。S4a:700,000DOF5iterationversion增量步数目:1迭代数目:5自由度数目:720,059浮点操作数目:5.77E+11要求最小内存:895MB要求硬盘空间:3GBS4b:5,000,000DOF5iterationversion增量步数目:1迭代数目:5自由度数目:5,236,958浮点操作数目:1.14E+13要求最小内存:4GB要求硬盘空间:23GBS4d:700,00027iterationversion增量步数目:20迭代数目:27自由度数目:720,059浮点操作数目:5.77E+11要求最小内存:895MB要求硬盘空间:3.3GBS5:支架张开图5这是一个模拟医疗支架设备张开并且带有强烈非线性的静力分析的问题。支架采用的是六面体网格,单元类型为C3D8,并且采用的是线弹性的材料模型,张开工具模拟采用的是面单元,单元类型为SFM3DR,在支架和张开工具之间有定义接触,张开工具上定义径向位移来轮流使得支架张开,并且由于大位移和接触滑动会导致问题的非线性增加。S5增量步数目:21迭代数目:91自由度数目:181,692浮点操作数目:1.80E+009要求最小内存:NA要求硬盘空间:NAS6:轮胎模拟图6这是一个模拟决定汽车轮胎印记并且带有强烈非线性的静力分析的问题。轮胎采用的是六面体网格,单元类型分别为C3D8、C3D6H和C3D8H。采用了线弹性材料和超弹性材料模拟,轮胎内部带子的模拟采用了rebar层和嵌入单元,边框和底面采用的是刚体,在轮胎和轮毂、轮胎和地面之间有定义接触。整个分析包含三个分析步,在第一个分析步中是模拟轮胎安装到轮毂上,第二个分析步中是轮胎的充气过程,第三个分析步中在轮毂上施加一个垂直载荷。由于大变形、滑动接触和超弹性材料行为导致模型中的非线性增加。S6增量步数目:41迭代数目:177自由度数目:729,264浮点操作数目:NA要求最小内存:397MB要求硬盘空间:NA2、Abaqus/Explicit的测试题目下面描述的问题提供了在不同性能的计算机上运行Abaqus/Explicit时期望的性能估计。问题对于Abaqus/Explicit的应用是很具有代表性的,包含高速的动力学冲击问题和有复杂接触条件的准静态问题。下面表格中列出的增量步的数目是一种估计值,它可能会因为硬件平台和并行区域的不同有略微的差异。E1:汽车碰撞图7这是一个模拟客车撞向一个刚性墙的问题。汽车主要采用的是壳网格,单元类型为S3RS和S4RS,并采用的是各向同性的Mises塑性硬化材料模型,客车不同部件之间的连接采用的是多点约束和连接器单元,许多的悬挂机构和动力传动部件是作为刚体模拟,客车、路面和墙之间采用的是一个通用接触域并且客车的初速度为25mph。E1增量步数目:62,934单元数目:274,632初始稳态时间增量步:9.535E-07最后的动能:2.100E+06要求内存:1200MBE2:手机跌落图8这是一个模拟手机撞击固定刚性墙简化模型的问题。手机部件是采用了多种的单元类型,包括C3D8R、C3D10M和S4R,材料行为模拟包括线弹性、各向同性Mises塑性硬化和超弹性材料,部件的装配采用了基于表面网格的tie连接,并将整个模型包括地面都定义在一个通用接触域中,手机的初始速度和方向被定义来产生一个类似的斜碰冲击。E2增量步数目:87,369单元数目:45,785初始稳态时间增量步:3.431E-08最后的动能:6.043E+02要求内存:300MBE3:板金成型图9这是一个金属板部件通过深冲压方法成型的问题。可变形的金属板板坯是采用的壳单元,单元类型为S4R,并且采用的是各向同性的Mises塑性硬化的材料模型,工具采用的是面网格,单元类型为SFM3D4R,并且将其定义为了刚体,在板坯和工具之间定义了通用接触。分析包含两个分析步,在第一个分析步中,板坯在夹子和模具之间被夹紧,在第二个分析步中,冲头移动来形成部件。因为进程本来是一个准静态分析,因此计算执行会花费很长的一段时间,并且惯性影响是可以忽略的。这个分析主要是用来测试三维模型的通用接触算法的计算效率。E3增量步数目:31,177单元数目:34,540(仅变形体)初始稳态时间增量步:7.151E-07最后的动能:1.391E+03要求内存:550MBE4:子弹穿透图10这是一个发射子弹以一个斜角来穿透钢板的问题。子弹和钢板都采用的是六面体网格,单元类型是C3D8R,采用包含失效的率相关各向同性Mises塑性硬化材料模型,发射的子弹和钢板都定义在一个包含表面侵蚀的通用接触域中,平板的边是固定的,子弹的初始速度被指定足以保