医学统计基础(均值方差等)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

总体特征数:在数学中,通常把能反映总体某种特征的量称为总体特征数如何反映总体的特征数?用样本的特征数估计总体的特征数!情境引入一:在利用单摆检验重力加速度的实验中,全班同学在相同的条件下进行测试,得到下列数据(单位:m/s²)9.629.549.789.9410.019.669.889.6810.329.769.459.999.819.569.789.729.939.949.659.799.429.689.709.849.90怎样利用这些数据对重力加速度进行估计?数均平问题转化为:实验结果测得一组数据为用作为重力加速度“最理想的”近似值,依据是什么呢?12,,naaa算术平均数11niian=12naaan=a读作:平均a处理实验数据的原则是使这个近似值与实验数据之间的离差(偏差)最小、设近似值为x,则它与n个实验值ai(i=1,2,3,…,n)的离差分别为x-a1,x-a2,…,x-an平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小。称为这n个数的平均数或者均值例1某校高一年级的甲乙两个班级(均为50人)的数学成绩如下(总分150),试确定这次考试中,哪个班的数学成绩更好一些.甲班乙班甲班均分乙班均分1128610684100105981029410787112949499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110思考某公司内部结构以及工资分布:人员经理管理人员技工工人学徒合计月工资11000125011001000500人数165101023某公司有经理1人,另有6名管理人员,5名高级技工,10名工人和10名学徒,现需要增加一名新工人。小张前来应聘,经理说:“我公司报酬不错,平均工资每月1695元。”小张工作几天后找到经理说:“你欺骗了我,我问过其他工人,每月一个人的工资超过1500元,平均月工资怎么能是1695元呢?”经理拿出如下表所示的工资表说:“你看,平均周工资就是1695元。”在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?总体月平均数不能反映工人的月工资水平,因为公司中少数人的月工资额与大多数人的月工资额差别较大,这样导致平均数与中位数的偏差较大,所以月平均数不能反映这个公司工人的月工资水平,而应该应用中位数或众数来反映工人的月工资水平在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?例2高一(1)班学生年龄统计:(班级共有43人)其中有20人18岁,13人17岁,7人16岁,,3人15岁,求该班级的平均年龄。分析在班级年龄序列中18出现了20次,17出现了13次,16出现了7次,15出现了3次解:2013181717133465x“加权平均数”17201373434318413131647815加权平均值(用频率计算平均值)一般地,若取值为,出现的次数分别为,设频率为12,,nxxx12,nfff12,,nppp则其加权平均数为1122nnxpxpxp其中12(1)nppp例3:由下表估计学生日平均睡眠时间睡眠时间人数频率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.02合计1001收入范围所占百分比10000至1500010%15000至2000015%20000至2500020%25000至3000025%30000至3500015%35000至4000010%40000至500005%例4:由某单位年收入表试估计该单位职工的平均年输入平均数的计算方法:(1)定义法:已知x1,x2,x3,…,xn为某样本的n个数据,则这n个数据的平均数为:x=x1+x2+x3+…+xnn.(2)加减常数法:数据x1,x2,…,xn都比较大或比较小,且x1,x2,…,xn在固定常数附近波动,x=x1+x2+…+xnn,a为接近x的常数,则x1±a,x2±a,…,xn±a的平均数为x±a.(3)若x1,x2,x3,…,xn的平均数为x,那么mx1﹢a,mx2﹢a,mx3﹢a,…,mxn﹢a的平均数为mx﹢a。(4)加权平均数:样本中,数据x1有m1个,x2有m2个,…,xk有mk个,则x=m1x1+m2x2+…+mkxkm1+m2+…+mk.有甲乙两种钢筋,现从中各抽取一个样本检查它们的抗拉强度,如下表:甲110120130125120125135125135125乙115100125130115125125145125145110115105120125130135140110115105120125130135140甲乙100145哪种钢筋的质量较好?11012125130情境引入二:一组数据的最大值与最小值的差称为极差;说明甲比乙稳定思考:什么样的指标可以反映一组数据变化范围的大小?极差=最大值-最小值甲110115105120125130135140110115105120125130135140乙100145极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:甲:31323537333032313029乙:53165413661613111662问:哪种玉米苗长得高?哪种玉米苗长得齐?x=32乙x=32甲怎么办呢?甲37(最大值)29(最小值)8乙66(最大值)11(最小值)55极差甲:31323537333032313029乙:53165413661613111662甲32372937321166乙如果甲乙两组数据的集中程度差异不大时,怎么办呢?我们可以考虑每一株的高度与平均高度的离差离差的平方和越小,长的越齐考察样本数据的分散程度的大小,最常用的统计量是方差和标准差。•样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;•样本方差的算术平方根叫做样本标准差。设一组样本数据,其平均数为,则12,,nxxxx称s2为这个样本的方差,11()niisxxn称为这个样本的标准差,分别称为样本方差、样本标准差2222121()()()nsxxxxxxn2211()niisxxn即它的算术平方根因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们标准差来刻画一组数据的稳定程度.方差和标准差的意义:描述一个样本和总体的波动(离散程度)大小的特征数,标准差大说明波动大.12,,,nxxxx2s12,,,nxbxbxbxb2s12,,,naxaxaxax22as12,,,naxbaxbaxbaxb22as如果数据的平均数为,方差为(1)新数据的平均数为,方差仍为.(2)新数据的平均数为,方差为.(3)新数据的平均数为,方差为.,则方差的运算性质:极差、方差与标准差的区别和联系:都是用来描述数据的离散程度,其中极差是数据最大值与最小值的差,反映了一组数据的变化的最大幅度,它对一组数据中的极端值非常敏感。方差反映一组数据围绕平均数波动的大小,标准差是以样本数据为单位表示波动幅度。例1:从高一(1)班的一次数学测验抽取一小组成绩如下(保留整数):859080808575100计算这组样本数据的极差、方差和标准差.例2.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定。品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.81、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为_________________;2、已知数据的方差为2,则求数据的方差、标准差。123,,aaa1232,2,2aaa9.5,0.016____3,,3,3,,,2121的方差为,那么的方差为若nnxxxxxx4____4,,,21后的方差为这组数据均乘以,那么的方差为若2nxxx

1 / 24
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功