昆明理工大学第六届大学生数学建模竞赛承诺书我们仔细阅读了昆明理工大学大学生数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的。如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。评阅编号(由组委会评阅前进行编号):昆明理工大学第六届大学生数学建模竞赛评阅专用页评阅编号(由组委会评阅前进行编号):评阅记录(供评阅时使用):评阅人评分备注总分-1-大学教师薪金模型一、摘要:模型一:利用Matlab建立X1--X7与Z(薪金)的线性关系,得到散点图与一般的线性回归模型(模型一),模型如下:011223344556677ln*******zxxxxxxx模型二:由模型一整体效果与StepwiseTable图推断部分变量对Z(薪金)的影响并不显著,由残差分析法筛选出影响明显的变量X1、X4,将他们的平方项与交互项加入建立新的回归模型(模型二),模型如下:6.90260.004310.174640.00011*40*1^20.02284^2zxxxxxx得到R2,F,P,与模型一相比较。模型一调用原始参数较全,但回归性差,模型二只启用影响明显的变量,回归模型更为显著,可靠度更高。于是得出:教师的薪金与工作时间、学历关系明显,与性别、是否受雇于重点大学、是否接受过培训的关系较小,即女教师没有受到不公正的待遇,婚姻状况也不会影响收入。关键词:回归分析,互交作用,图形结合,残值分析法。-2-二、问题重述:某地人事部门为研究中学教师的薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,特别是考察女教师是否受到不公平的待遇,以及她们的婚姻状况是否会影响收入。要求从当地教师中随机选了3414位进行观察后,从中所保留的90个观察对象的数据进行分析。(1)进行变量,建立变量与的回归模型的关系,说明教师薪金与哪些变量的关系密切,是否存在性别和婚姻状况上的差异。(2)除了变量本身之外,尝试将它们的平方项或交叉项加到模型中,建立更好的模型。三、模型假设:1、该地区的人事部门对中学教师的薪金调查是可信的;2、各参数对薪金的影响呈线性关系;3、工作时间、性别、教育程度及培训情况之间相互独立,没有交互作用;四、符号说明:Z:月薪(元);X1:工作时间(月);X2:1男性,女性;X3:1男性或单身女性,0已婚女性;X4:学历(取值0-6,值越大表示学历越高);X5:1受雇于重点大学,0其它;X6:1受过培训的毕业生,0未受过培训的毕业生或受过培训的肄业生;X7:1已两年以上未从事教学工作,0其它。五、分析与建立模型:首先,调用所有相关变量,运用Matlab分别得到,Z与X1--X7之间的关系及散点图,由此知Z与各变化量呈线性关系,于是可以建立线性回归模型:011223344556677ln*******zxxxxxxxZ(薪金)为因变量,X1--X7分别表示对Z的值产生影响的各个变量,07表示回归系数,表示随机变量.用Matlab求解模型(见附录),得到的值与置信区间如下:参数参数估计值置信区间01.1311[1.02681.2353]-3-10.0027[0.00230.0031]2-0.0229[-0.14320.0974]30.0094[-0.10050.1193]40.1089[0.02960.1882]50.0385[-0.06700.1440]60.1817[-0.05070.4142]70[00]2R=0.7889F=51.6934P=0表一由上表中2R=0.7889可以知道薪金(z)的78.89%可由模型确定,由P=0远小于0.05,模型从整体上看是成立的,但是还可以看到一个问题,即些部分的置信区间包含0点,因此我们可以知道这些变量对因变量的影响是不显著的.在Matlab中运行stepwise命令得到下图:-200-1000100200300400X1X2X3X4X5X6X7CoefficientswithErrorBarsCoeff.t-statp-val2.747415.00740.000043.09380.87770.382518.30950.35570.7229167.7518.73180.000054.75861.07330.2861190.3481.66720.0991-44.9154-0.88440.3790123200300400500ModelHistoryRMSE由图可知,在模型中23567xxxxx、、、、对因变量的影响是不显著的.-4-于是只保留x41和x,并将它们的交互项和平方项加入,建立逐步线性回归方程如下:2^4*52^1*44*1*34*21*10)ln(xxxxxxz然后使用Matlab求解模型(程序见附录),得到值与置信区间如下:参数参数估计值置信区间06.9026[6.85576.9496]10.0043[0.00370.0049]20.1746[0.10730.2419]3-0.0001[-0.00030.0001]4-0.0000[-0.0000-0.0000]5-0.0228[-0.0371-0.0085]2R=0.9008F=152.6081P=0通过新建模型中得到的数据,可以看到2R明显提高,薪金z的90.08%可由模型确定.P远小于0.05,F远超过临界值,回归模型更为显著,可靠度增高.然后进行残差分析,在Matlab中运行命令rcoplot得到残差图如下:-5-由图可知,除个别数据外,其他数据的残差离零点均较近,且残差的置信区间都包含零点.这说明回归模型能较好地符合原始数据,而个别异常点可以忽略.六、模型的评价优点:1.该方案实用简单,可行性强,模型简单,易于理解。2.模型一首先用简单的线性规划进行分析.结构简单,计算方便,有利于对相似问题进行求解和对模型进行扩充。3.模型二的建立是从一般问题到特殊问题的发展过程.根据已知的数据,从常识和经验进行初步分析,并运用了逐步线性回归方法以及辅作散点图,决定取那几个回归变量及它们的函数形式.把对Z影响不显著的变量(Xi)予以排除,又运用残值分析法建立新的回归模型.使得精确值增高,模型更合理.缺点:1该模型在处理此问题时有假设与理想化的思想,与实际问题的求解还有所差距.比如所求模型结果只达到了模型设想的80%左右.七、参考文献【01】赵静,数学建模与数学实验,北京,高等教育出版社,2003【02】苏彦华,MATLAB7.0从入门到精通,北京,人民邮电出版社,2010-6-八、附录:1、薪金模型数据表:编号ZX1X2X3X4X5X6X7199870000002101514110000310281811010041250191100005102819010100610281900000071018270000018107230000000912903011000010120430010000111352310120101212043100010013110438000000141118411100001511274200000016125942110100171127421100001811274200010019109547000001201113520000012114625201201022118254110000231404540001002411825400000025159455112110261459660001002712376711010028123767010100291496750100003014247811010031142479010000321347911101003313429200000134131094000100351814103002110361534103000000371430103110000-7-381439111110100391946114113110402216114114110411834114114111421416117000001432052139110100442087140002111452264154002111462201158114011472992159115111481695162010000491792167110100501690173000001511827174000001522604175112110531720199010000541720209000000552159209014100561852210010000572104213110100581852220000001591852222000000602210222110000612266223010000622027223110000631852227000100641852232000001651995235000001662616245113110672324253110100681852257010001692054260000000702617284113110711948287110000721720290010001732604308112110741852309110101751942319000100762027325110000771942326110100781720329110100792048337000000802334346112111-8-8117203550000018219423571100008321173801100018427423871121118527404031121118619424061101008722664370100008824364530100008920674580100009020004641121102、1234567xxxxxxx、、、、、、与Z的关系及散点图:x1=[7141819191927303030313138414242424247525254545455666767757879919294103103103111114114114117139140154158159162167173174175199209209210213220222222223223227232235245253257260284287290308309319325326329337346355357380387403406437453458464]';|X1=[ones(90,1)x1];Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';x2=[0111000010000101100001001010010100001111101001101001000010010