嫦娥三号软着陆轨道设计与控制策略一、问题重述嫦娥三号于2013年末成功发射,4日后抵达月球轨道。质量为2.4t的嫦娥三号,其下部安装的主减速发动机可产生1500N到7500N的可调节推力,用来调整速度。四周还安装有姿态调整发动机,可自动通过多个发动机的脉冲组合实现各姿态的调整控制。嫦娥三号在高速飞行的同时,要保证准确的在预定的着陆点区域内实现软着陆,需要着陆轨道和控制策略的设计。着陆轨道为从近月点(15km)至着陆点,其软着陆过程共分为6个阶段,需要满足每个阶段在关键点所处的状态,并且尽量减少软着陆过程的燃料消耗。根据以上的基本要求,可通过建立数学模型解决一下问题:(1)确定着陆准备轨道近月点和远月点的位置,以及嫦娥三号相应速度的大小与方向。(2)确定嫦娥三号的着陆轨道和在6个阶段的最优控制策略。(3)根据设计的着陆轨道和控制策略做相应的误差分析和敏感性分析。问题分析二、问题分析探测器经过环月轨道的着陆方式因其具有较长的软着陆准备时间、对着陆位置的限制比较小以及减少着陆舱部分的燃料消耗等优点故而被广泛采用。该方式的关键环节就是从距离月面15km的近月点至月面的动力下降过程。1.问题一的分析:目前诸多学者已经对该方式软着陆问题做出了较多研究工作,并且取得了较好的成果,不过上述文献都是忽略月球自转,没有考虑侧向运动,假设登月器在一个固定的铅垂面内运动来进行研究,而事实上由于月球自传等因素的存在,登月器难以保持在一个固定的铅垂面内运动,因此研究三维空间的精确定点软着陆则更据有工程意义。国内这方面的研究相对较少,仅有文献[8]在考虑月球自转并且假定制动火箭推力为恒值的情况下研究了三维空间内月球探测器软着陆的精确建模,依据庞特里亚金极大值原理运用传统的打靶法设计了最优轨道,不过这种方法需要猜测不具有物理意义的协状态的初值,并且协状态方程对初始猜测值很敏感,给出较为准确的初始值相当困难。本文同样考虑了月球自转,针对三维空间内精确定点软着陆问题利用参数化控制解决了变推力软着陆最优控制问题,此外还针对仅知制动初始点到月心距离而具体位置未知的情况,对初始点(近月点)的选取进行了研究。该方法无需估计不具备物理意义的变量初值,并且收敛速度快。2.问题二的分析:问题2是建立在问题1的基础上,通过对问题1的研究引入强化技术来求解优化这一问题;问题2实际上是问题1的一种特殊情形,需要对问2三中建立的模型细化,确定对应的参数。3.问题二的分析:问题3在月球软着陆主之东段,影响制导精度的误差源主要有偏离标准飞行轨迹的初始条件误差和导航与控制传感器误差。初始条件误差由主制动段以前的任务决定,传感器误差则由导航系统和传感器本身决定。此外,影响制导精度的因素还包括月球不规则摄动等误差,对它们的研究可单独进行,这里暂不做介绍。三、模型假设(1)不完全性假设:假设只考虑月球引力及月球自转对软着陆轨道设计与控制的影响(2)合理性假设:进入环月轨道可忽略地球的影想因数四符号说明五模型建立1动力学模型建立与控制律设计探月飞行器首先进行霍曼变轨,从圆形环月轨道进入一条近月点高度为15km的椭圆轨道;当到达近月点时,制动发动机点火,探测器进人动力下降段,最终以很小的相对速度(小于6m/s)阳1降落到月面指定位置。(1)一般情况下软着陆飞行动力学建模文献[5]给出了低轨月球探测器10种摄动源的摄动量级和不同需求下的摄动模型选择,其中对于一般的轨道分析,只需考虑月球的非球形引力摄动以及地球和太阳的引力摄动即可.于是,一般情况下月球软着陆动力学模型的矢量式可写为333331111meeessseessrFrFrrrrr①①式中,右边第1项F为推进系统的主动制动力,第2项为月球的中心引力,第3项为月球的非球形引力摄动,第4项和第5项分别为地球和太阳的引力摄动.m,e,s分别为月心、地心和日心引力常数;,eessrrrr而er和sr是月心到地心和月心到日心的矢径.这里需要注意的是,对于环月低轨探测器,可利用目前最为精确的LP165引力模型来分析月球的非球形引力摄动对环月轨道的影响.但是对于月球软着陆,由于其距离月面很近且着陆区域范围较小,因此,月球表面的质量集中问题就显得更为突出,考察摄动影响时应重点考虑着陆区域附近的质量集中问题.为方便软着陆过程各阶段的制导律设计以及下降轨迹各参数的分析,需要根据每个阶段的不同情况将模型建立在合适的参考坐标系下.(2)简化情况下软着陆飞行动力学建模(只考虑月球重力及其自转影响)如图1所示,定义惯性坐标系xyzO,原点在月心,参考平面是月球赤道面,xO,轴指向月球赤道相对于白道的升交点,yO轴指向月球自转角速度方向,zO轴按右手坐标系确定。再定义月固坐标系LLLxyzO,以月球赤道面为参考平面,LxO轴指向赤道面与起始子午面的交线方向,LyO指向月球自转角速度方向,以LzO轴按右手坐标系确定。111xyzA为原点在探测器质心的轨道坐标系,1yA指向从月心到着陆器的延伸线方向,11xA垂直Ay。指向运动方向,1zA按右手坐标系确定。制动发动机推力P的方向与探测器纵轴重合,为P与1yA轴正向所成夹角,为P在11zxA。平面上的投影与1xA轴负向所成夹角。为1yA与yO所成夹角,为1xA在xOz平面上的投影与Ox轴正向所成夹角。),为月球自转而产生的月固坐标系相对惯性坐标系的转角,不妨假设初始时刻月固坐标系与惯性坐标系重合。略图1显然有轨道坐标系到惯性坐标系转换矩阵1coscossinsincoscossincossinsinsin0cosT惯性坐标系到月固坐标系的转换矩阵为2cos0sin010sin0cosT根据牛顿第二定律,结合科氏定律整理可以得到探测器在月固坐标系中的运动方程为略其中xLV,xLV和zLV为探测器速度矢量在月固坐标系各轴上的投影,F为发动机推力,m为探测器质量,xLg,yLg和zLg为该高度月球重力加速度在月固坐标系各轴上的投影,L为月球自转角速度。因此,在月固坐标系中探测器的运动方程可表示如下22CLxLLyLLzLxLxLLzLyLyLzLzLLxLxVyVzVVOFmgVVPFmgVQFmgVmF其中coscoscossinsinsincossincoscoscossinsinsinsincoscosOcossinsincoscoscossinsinsinsinPcoscossinsincossincossincossincoscossinsinsinsincosQ222222MLxLLLLLLLGxgxyzxyz222222MLyLLLLLLLGygxyzxyz222222MLzLLLLLLLGzgxyzxyzMG为月球引力常数,C为制动火箭的比冲,是一个常值。取TLLLxLyLzLxxyzVVVm为系统状态变量,TuF为控制变量,则式(1)可以简记为,,xfxut按照耗燃最优的要求,取性能指标为10000ffttfJmmtmdtCFdt在实际情况下,通常没必要令探测器着陆速度严格等于零,只要能保证探测器以很小的相对速度降落到月面就足可以接受的。因此,考虑到这一点,本文将软着陆的末速度要求以惩罚冈子的形式加入到指标中如下式所示,主要目的是降低最优控制问题求解的复杂度,该惩罚因子可以通过反复的数值仿真运算,按经验设定。22210ftxLfyLfzLfJkVtVtVtCFdt此外,显然有约束条件12322240,000LfLfLfLfLfLfLLLfgxtxgytyGgztzgxyzr/2//2/LxLLyLLzLxLxLLzLyLyLzLzLLxLxVyVzVVOFmgVVPFmgVQFmgVmFC其中Lfx,Lfy,Lfz为预定着陆点在月固坐标系中的坐标;222fLfLfLfrxyz为着陆点到月心距离,即月球半径。对于含有形如4ˆg这类关于状态变量在连续时间上都要满足的不等式约束最优化问题,至今还是最优化领域的一个难点。文献[10]中给出一种约束变换技术,使得该类问题得到解决。显然4g≥0等价于440min,00ftLggdt但上式显然在时不可微,因此用如下不等式去近似上式400ftGgdt其中4424444,/4,0gifgGggifgifg0,0是调节参数。u文献[10]证明了当足够小的时候,存在0,使得对任何满足0的能够令(5)对(4)达到满足要求的近似。不妨记G为用(5)式替换4g≥0后得到的新的约束函数。因此本文所讨论的软着陆耗燃最优问题转化为:问题1在系统(1)满足约束函数G的情况下求取适当的控制变量u使指标函数(2)达到最小。2参数化控制求解耗燃最优问题假定初始时刻为0,终端时刻ft为待定参数。选取满足010pppppiinfttttt构造形如111,,,,,,nppiinppiinppiipppiiiipppiiiipppFiiiittttFtt其中11,1,0ppiippiittttotherwise问题2寻找三组参数p来最小化指标函数(2),并且满足约束函数G。显然,对于每个给定的p,这都是一个有限维的参数优化问题。文献[11]中第六章已经证明了当p时,问题2的最优解收敛于问题1的最优解。不过文献[12]已经证明了在数值计算中,求解问题2的参数梯度时难度很大甚至求不出真实解,因而本文引入强化技术来解决这一问题。从0,1s到0,ftt构造如下变换1111ipppppjjjiijtss0101pppppiin/pdtsdsvs1,nppiippiidtss11,1,,0,ppiippiissotherwise不妨令ˆˆ,pputsxtsxsustsvs则得到如下增广系统,,ˆpppvsfxtsutstsdxdsvs即ˆˆ/ˆˆ/ˆˆ/ˆˆˆˆˆˆ//2ˆˆˆˆˆ//ˆˆˆˆˆˆ//2ˆˆ///pLxLpLyLpLzLpPxLxLLzLpyLyLpPzLzLLxLpPpdxdsvVdydsvVdzdsvVdVdsvOFAmgVdVdsvQFmgdVdsvOFAmgVdmdsvFCdtdsv其中ˆOˆPˆQ与ˆxLgˆyLgˆzLg分别为OPQ与xLgyLgzLg经变换后的形式ˆˆˆ,,,ˆˆˆ,,,ˆ,LLLLLLxLxLyLyLzLzLxxtsyytszztsVVtsVVtsVVtsmmts指标函数变为122210ˆˆˆˆˆ111pxLyLzLJkVVVCvFdt约束条件变为1231405ˆˆ10,ˆˆ10,ˆˆˆ10,ˆˆ0,ˆ10LLfLLfLLfpfgxxgyyGgzzgv