统计与数理学院本科毕业论文第1页共10页科技投入与产出的相关分析——高校科技投入与产出的相关分析【内容摘要】针对高校科技投入和产出的特点与存在的问题,在分析过去10年高校科技投入和产出数据的基础上,建立了高校科技投入和产出的多个相关模型,评估了高校科技投入产出效率,分析了科技投入与产出的相关关系,提出了若干相关发展建议,对于提升高校科技投入产出效率,提供了决策支持。【关键词】相关分析;科技投入;科技产出;回归模型前言科学技术是立国之本,强国之举。近年来,随着国家“科教兴国”战略的深入实施,高等学校已经成为我国科技体系创新的一个重要组成部分,越来越受到重视。高等学校的科技投入也越来越大,高等学校的科技产出也不断增加。长期以来,我国高校都是以教学工作为主。随着我国正式加入WTO,高等学校面临着前所未有的机遇与挑战。高等学校不仅要承担培养人才的任务,而且还必须承担发展科学技术的重任。因此对我国高等学校科技投入与产出情况作相关统计分析,动态反映和考察高等学校科技工作发展的特点与趋势,正确认识和评价学校科研潜力及存在的问题,可以客观评价高校科学研究发展的水平、实力和效率等,增强对科技投入和产出的预见性,适时调整对高校的科技政策,促进高校科技活动的开展和高级科技人才的培养。一、我国高校科技发展的基本状况分析(一)我国高校科技投入现状分析2004年是我国国民经济与社会发展取得重大进展的一年。科技经费投入继续保持快速增长,国家财政科技拨款稳定增加,全社会科学研究与试验发展(R&D)经费支出达到新的历史最高水平。2004年全社会研究与试验发展(R&D)经费总支出为1966.3亿元,比上年增加427亿元,增长27.7%,与当年国内生产总值(GDP,经济普查后调整数)之比为1.23%。按科学研究与试验发展人员(全时工作量)计算的人均经费支出为17.1万元,比上年增加3万元。其中高等学校支出200.9亿元,增长23.8%。高等学校经费支出占全国总支出的比重分别为10.2%。高等学校的“科技活动经费筹集”的涨幅略高于全国水平。对于高校的“研究与试验发展经费支出”,除在1998年出现过一次负增长外,基本也保持了较高的增长趋势。其中“应用研究经费支出”在“研究与试验发展经费支出”中所占的比重最大,基本保持在50%统计与数理学院本科毕业论文第2页共10页以上,“基础研究经费支出”所占的比重逐年增加,同时“试验发展经费支出”所占的比重则逐年下降。“高校科技活动人员”变化较小,总体数量基本保持上升趋势。(二)我国高校科技产出现状分析专利战略的实施促进了我国专利数量的迅速提高。专利申请量达到35.4万件,比上年增长14.9%,授权量达到19.0万件,比上年增长4.4%,其中发明专利申请量13.0万件,比上年增长23.8%,发明专利授权量4.9万件,比上年增长32.4%。全国共发表科技论文31.0万篇,比上年增长了13.1%,其中高校发表科技论文20万篇,占全国发表科技论文的64.4%。这表明,我国科技发展,特别是基础研究的重担越来越多地落到高校身上。2004年,高校签订技术成交合同39289项,合同金额116.6亿元;全国科技成果数为31720项,其中高校科技成果数为6857项。此外,高校在知识创新的过程中产出优秀人才,在培养人才的过程中产出创新成果。教学、科研相互促进,投资省,效益高。二、我国高校科技发展面临的困难与问题高校在科技工作方面有独特的优势和特点,但也存在一些困难和问题,主要是:(一)与国外高校科技投入相比,我国高校科技经费相对不足。2004年,我国高校的R&D经费只有美国的7.6%。这必然造成我国高校科技创新基地、科研基础设施条件与国外相比差距较大,难以产生重大科研成果。同时,高校自由研究经费的筹集也较为困难。(二)与国家的要求相比,高校重大科技成果产出还有一段差距,高校科技成果的转化也较为困难。总之,我国科技资源相对有限,尤其需要合理的资源分配机制,因此加强对高校科技投入产出的研究具有重要的现实意义。目前有关科技投入对高校科技产出影响的研究在文献中还少有见到。因此,必须采用定量与定性相结合的分析方法,研究科技投入对高校科技论文、专利、成果等的影响并建立相应的关联模型,寻求高校科技投入与产出的最佳结合点。三、变量组的选取及数据的选取相关分析方法是一种研究两组变量之间是否存在相关关系的方法。在这里用来研究全国高校科技投入与科技产出两组变量的相关性。通过对这两组变量研究来分析科技活动内部机制,以及变量组间是如何相互影响的。科技投入变量组由科技活动人员,研究与发展人员,科技经费筹集额,研究与发展经费支出等相关指标组成;科技产出是科技创新能力的直接反映,其衡量因素是科技论文数、科技成果获奖数、专利申请和授权数,而科技活动对GDP的影响,主要以技术市场合同成交金额等来衡量。因此,我们选取1995—2004年全国高校的科技投入与产出指标的相关数据来研究分析。具体指标及数据见表1;表2。统计与数理学院本科毕业论文第3页共10页表1高校科技投入情况年份科技经费筹集额(亿元)R&D经费支出(亿元)其中科技活动人员(万人)R&D人员(万人年)基础研究应用研究试验发展199549.542.36.523.312.532.414.4199656.547.87.526.713.733.214.8199773.157.79.731.616.432.616.619988554.48.730.515.334.516.91999102.963.511.437.714.434.217.62000166.876.717.84018.935.215.92001200102.41956.626.836.617.12002247.7130.527.867.135.638.318.12003307.8162.332.989.739.741.118.92004391.6200.947.9108.844.243.721.2表2高校科技产出情况四、模型分析与选择仅仅了解高校科技投入和产出的数据是远远不够的,隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述及对其发展趋势的预测。因此必须借助于相应的数据挖掘工具,发现数据中隐藏的规律,以下的数据统计与挖掘均借助于SPSS11.0来实现。以“科技活动经费筹集额”、“基础研究经费支出”、“应用研究经费支出”、“试验发展经费支出”、“科技活动人员”、“研究与试验发展全时人员”为自变量;以“科技论文”为因变量,作为案例描述模型建立过程。(一)绘制散点图绘制散点图是相关分析过程中极为常用且非常直观的分析方式。它将数据以点的形式画在直角平面上。通过观察散点图能够非常直观地发现变量间的统计关系以他们的强弱程度和数据对的可能走向。下图是科技论文与科技投入变量组的散点图:年份专利申请(项)其中专利授权(项)其中科技论文(篇)重大科技成果(项)技术市场成交合同金额(亿元)发明实用新型外观设计发明实用新型外观设计1995136357477118891258623106649426.821996132060471158542286111572447724232.161997129363564991215256511776986700545.29199814457946193223472436001786921733651.771999176998874734130442584831104073684162.28200029241942965171548652868281156266508110.53200138102636113737153457994312132608615686.41200259814282165841171069797340152954564072.64200310252770423751733416173015821041819026546106.6920041299755051994736857116.62统计与数理学院本科毕业论文第4页共10页科技论文科技经费筹集额R&D研究经费支出基础研究经费支出应用研究经费支出试验发展经费支出科技活动人员R&D研究人员图1从图1可以看出科技投入的各个变量对科技论文都具有很强的相关性。(二)相关分析相关分析和回归分析都是分析客观事物之间关系的数量分析方法,两者均是研究变量之间的相互依存关系,但回归分析是通过一定的数学公式来反映变量之间相互关系的具体形式,必须明确变量的自变量和因变量地位,变量间的关系是不对等的;相关分析是确定变量之间的相关方向和密切程度,变量的地位是对等的。回归分析应建立在相关分析的基础上,而相关分析需要回归分析来进一步描述数量关系的具体形式。22222221()[()()]()()()iiiniiiibxXxXyYryYxXyY可见,2r指明总离差平方和中有多大的比例可以用回归直线来解释。2r越接近1,Q就越接近0,说明数据点越接近回归直线。因此它(0≤2r≤1)是一个反映回归方程拟合好坏的指标。2r被称为测定系数,若将2r开方,r就是通常所说的相关系数。相关系数的计算是由样本资料来进行的,样本量不同相关系数也不同,有必要对相关系数进行显著性检验。通过相关性检验,模型才具有实际意义。统计与数理学院本科毕业论文第5页共10页Correlations1.992**.970**.982**.970**..000.000.000.0001010101010.992**1.989**.987**.977**.000..000.000.0001010101010.970**.989**1.986**.966**.000.000..000.0001010101010.982**.987**.986**1.979**.000.000.000..0001010101010.970**.977**.966**.979**1.000.000.000.000.1010101010PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N科技论文科技经费筹集额基础研究经费支出应用研究经费支出试验发展经费支出科技论文科技经费筹集额基础研究经费支出应用研究经费支出试验发展经费支出Correlationissignificantatthe0.01level(2-tailed).**.图2由图2可知,科技论文与科技经费筹集额的简单相关系数为0.992,与基础研究经费支出的简单相关系数为0.970,与应用研究经费支出的简单相关系数为0.982,与试验发展经费支出的简单相关系数为0.970。它们的相关系数检验的概率P值近似为0。因此,当显著性水平α=0.05的时,都应拒绝相关系数检验的零假设,认为两总体存在显著的正相关关系。Correlations1.982**.895**..000.000101010.982**1.903**.000..000101010.895**.903**1.000.000.101010PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N科技论文科技活动人员R&D研究人员科技论文科技活动人员R&D研究人员Correlationissignificantatthe0.01level(2-tailed).**.图3由图3可知,科技论文与科技活动人员的简单相关系数为0.982,与R&D研究人员的简单相关系数为0.895。他们的相关系数检验概率P值为0。因此,当显著性水平α=0.05的时,都应拒绝相关系数检验的零假设,认为两总体存在显著的正相关关系。