北京市陈经纶中学优秀结题报告汇编(一)-1-《有关正态分布的研究》课题组成员:施雷特朱博言、董昕航、孙谭霖、施雷特、孙昊指导教师:黎宁一、任务分工:朱博言、董昕航:绘制调查问卷,收集实际数据。孙谭霖:搜集并提供学习资料。施雷特、孙昊:对收集来的数据进行编辑、整理。全体组员在数据收集完成后分析数据,总结评价,共同撰写结题报告。二、研究的背景、意义与目标:1.背景通过我们对正态分布的初步认识,得知正态分布在生活生产、科技实验中具有很强的应用价值。例如通过零件尺寸的正态分布曲线,我们可以评价工厂的生产水平;通过身高、体重的正态分布曲线,我们能得知某地区青少年身体的发育状况……生产中,电子管的使用寿命、电容器的电容量、零件的尺寸、铁水的含铅量、纤维的纤度等服从正态分布;在生物学中,同意群体的某种特征、在一定条件下生长的小麦的株高、穗长、单位面积产量等,一般也服从正态分布;在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等,水文中的水位,也都近似服从正态分布。2.意义我们希望通过进行此课题的研究,能够提升我们以数学的思想解决实际问题的能力,以及提高数学思维能力。同时我们可以以一种理性的思维分析生产、生活以及科学中的一些规律与现象,为今后的学习打下一个良好的基础。我们也希望在探究学习的过程中,学会与人合作,学会独立思考,学会自主学习,培养严谨执著的科学精神,体会数学在自然中的应用影响、数学的发展对人类生活的影响,从而感悟科学中的美,培养学习兴趣。我们知道,著名数学家高斯正是因为他细心留意生活与自然中的现象,才总结出正态分布曲线的解析式。我想,之所以能他成为一名伟大的数学家,其原因也尽在于此吧!善于思考、善于发现和解决问题,这是每一位科学家所具备的品质,也是我们希望通过研究性学习所拥有的品质。3.研究的目标:北京市陈经纶中学优秀结题报告汇编(一)-2-(1)通过自主学习与研究,了解正态分布的有关概念与意义,旨在拓展课外知识与培养自主学习的能力。(2)当制定调查表、搜集数据后,学会用Excel等软件对数据进行统计分析,体会数学理论在生活中有很强的应用性。(3)在进行研究性学习的过程中,发展同学们之间的友谊与团结协作的精神,为日后的进一步学习打下良好基础。三、研究的过程:简述课题与开题报告(2课时)组员利用课上和课余时间合作学习有关概率与正态分布的基本知识,并有所感悟与延伸。(9课时)在高一年级内及校外搜集数据。如调查学生的视力、身高、体重、生物学药品等生活实例。(3课时)对数据进行列表,画出频率分布直方图。同时利用计算器作出曲线图象。在这个过程中,我们要学会如何处理数据,并培养严谨执著的科学精神。(5课时)组员共同分析并验证正态分布曲线,体会数学规律的和谐统一性,获得对数学研究的快乐。(9课时)整理数据、撰写结题报告。(4课时)四、研究的结果;(一)、正态分布的理论分析:1、概率密度曲线若数据无限增多且组距无限缩小,那么频率分布直方图的顶边缩小乃至形成一条光滑的曲线,我们称此曲线为概率密度曲线.概率密度曲线的形状特征:“中间高,两头低,左右对称”北京市陈经纶中学优秀结题报告汇编(一)-3-2、正态分布与密度曲线上图中概率密度曲线具有“中间高,两头低”的特征,像这种类型的概率密度曲线,叫做“正态密度曲线”,它的函数表达式是式中的实数μ、σ(σ>0,μ∈R)是参数,分别表示总体的平均数与标准差.不同的μ,σ对应着不同的正态密度曲线。3、正态密度曲线的图像特征(1)曲线在x轴上方,当X=μ时,函数值为最大。(2)的值域为。(3)的图像关于X=μ对称。(4)当x∈(-∞,μ]时为增函数当x∈(μ,+∞)时为减函数(5)当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体分布越集中4、正态分布:若X是一个随机变量,对任给区间(a,b],P(a<X≤b)恰好是正态密度总体在(a,b)内取值的概率22()21(),2xPxexR()Px1(0,]2()Px()Px()Px北京市陈经纶中学优秀结题报告汇编(一)-4-曲线下方和X轴上(a,b]上方所围成的图形的面积,则称随机变量X服从参数为μ和σ2的正态分布,记作X~N(μ、σ2)5、标准正态曲线当μ=0,σ=1时,正态分布称为标准正态分布,其相应的函数表达式是,其相应的曲线称为标准正态曲线。(二)数据分析:案例一:我们小组的同学对陈经纶中学高一年级学生身体状况进行了调查,内容包括:身高、体重和视力。并相应用Excel作出频率表与频率分布直方图。1、身高分组频数累积频率频率[147,153)51.44%0.014368[153,159)279.20%0.077586[159,165)10037.93%0.287356[165,171)8963.51%0.255747221(),R2xfxex北京市陈经纶中学优秀结题报告汇编(一)-5-[171,177)5679.60%0.16092[177,183)5896.26%0.166667[183,189)1099.14%0.028736[189,195)3100.00%0.0086212、体重分组频数累积频率频率[32,40)30.86%0.008621[40,48)6318.97%0.181034[48,56)11552.01%0.33046[56,64)7372.99%0.20977[64,72)5588.79%0.158046[72,80)2595.98%0.071839[80,88)797.99%0.020115[88,96)499.14%0.011494[96,104)299.71%0.005747[104,112)1100.00%0.002874Max=110Min=39Ave=58.47Std=11.61Ave+3σ=93.29Ave-3σ=23.65SampleSize=348DefectRatio=0.0%-3σ+3σ129135141147153159165171177183189195201207身高Max=191Min=150Ave=16Std=8.Ave+3σ=193.08Ave-3σ=144.96SampleS=348DefectR=0.0%-3σ+3σ81624324048566472808896104112体重北京市陈经纶中学优秀结题报告汇编(一)-6-3、左眼视力4、右眼视力分组频数累积频率频率3.841.15%0.011494[3.8,4.2)6118.68%0.175287[4.2,4.6)14861.21%0.425287[4.6,5.0)9387.93%0.267241[5.0,5.3]42100.00%0.12069LSL=2.7Target=2.9USL=3.1Max=5.3Min=0.3Ave=4.569Std=0.416Ave+3σ=5.816Ave-3σ=3.321CpL=1.5Cp=0.16Cpk=-1.18Skewness=-3分组频数累积频率频率3.830.86%0.008621[3.8,4.2)6318.97%0.181034[4.2,4.6)15563.51%0.445402[4.6,5.0)8186.78%0.232759[5.0,5.3]4599.71%0.12931Max=5.6Min=0.3Ave=4.563Std=0.421Ave+3σ=5.826Ave-3σ=3.3SampleSize=348DefectRatio=0.0%-3σ+3σ2.633.43.84.24.655.45.86.26.6左眼视力-3σ+3σ2.633.43.84.24.655.45.86.26.6右眼视力北京市陈经纶中学优秀结题报告汇编(一)-7-据分析:在上面四幅图中,红色的曲线是由每一组样本的平均数和标准差画出的正态分布曲线。可以看到,总体而言,直方图较接近正态分布曲线,然而在这其中的有些矩形却并不接近。(例如在体重频率直方图中x∈[40,48)的这一矩形)针对这种现象,我们认为原因可能是以下两点:(1)在频率分布直方图中,样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率。当样本容量无限增大,分组的组距无限缩小时,频率分布直方图才会是或近似是正态曲线。然而在这个案例中,每组的样本容量只有348个,而且所分组组距也没有尽可能地缩小。所以才会导致这种现象。(2)因为在数据收集时需要同学们自觉填写真实信息,所以这些数据有一小部分可能是不真实的。案例二我们小组对高一年级第一学期期中考试成绩进行分析,现对历史成绩与总分成绩进行说明。分组频数累积频率频率[0,20)20.40%0.004032[20,24)41.21%0.008065[24,28)62.41%0.012097[28,32)114.63%0.022177[32,36)218.85%0.042339[36,40)3115.09%0.0625[40,44)3121.33%0.0625[44,48)4530.38%0.090726[48,52)5240.85%0.104839[52,56)5050.91%0.100806[56,60)4860.56%0.096774[60,64)5772.03%0.114919[64,68)4180.28%0.082661[68,72)3386.92%0.066532[72,76)2090.95%0.040323[76,80)2495.77%0.048387[80,84)696.98%0.012097[84,88)1199.20%0.022177[88,92)399.80%0.006048[92,96)1100.00%0.002016北京市陈经纶中学优秀结题报告汇编(一)-8-1.历史成绩2.总分成绩分组频数累积频率频率[0,410)20.40%0.004024[410,440)51.41%0.01006[440,470)83.02%0.016097[470,500)115.23%0.022133[500,530)209.26%0.040241[530,560)2113.48%0.042254[560,590)7127.77%0.142857[590,620)8344.47%0.167002[620,650)8661.77%0.173038[650,680)9580.89%0.191147[680,710)5491.75%0.108652[710,740)3097.79%0.060362[740,770)11100.00%0.022133Max=93Min=19Ave=56.18Std=14.31Ave+3σ=99.13Ave-3σ=13.24SampleSize=496DefectRatio=0.0%Max=915.4Min=465Ave=804.4Std=69.3Ave+3σ=1012.3Ave-3σ=596.5SampleSize=496DefectRatio=0.0%-3σ+3σ50053056059062065068071074077080083086089092095098010101040期中总分北京市陈经纶中学优秀结题报告汇编(一)-9-数据分析:历史成绩的频率分布直方图是在众多直方图中最能体现正态分布特征的直方图。其中μ=56.18,σ=14.31.我们可以清楚地看到,当x56.18时,曲线上升。当x56.18时,曲线下降。当曲线向左右两边无限延伸时,以x轴为渐近线,向它无限靠近。这个例子同样初步验证了正态分布曲线。五、体会与总结在这长达一个学期的研究性学习活动中,我们基本完成了最初的目标,在过程中不仅提高了收集信息、处理信息的能力,更体会到了合作学习的快乐与数学的美。虽然我们的这次研究成果还会存在一些问题,但是我们收获了过程。我们也将再接再厉,努力做得更好!尚待解决的问题:正态分布曲线解析式推导方法。