第五讲直方图与回归直线

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第五讲用样本估计总体及线性相关关系一.要点精讲1.用样本的数字特征估计总体的数字特征(1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n个数据是nxxx,,.........,21,那么niixnx11叫做这n个数据平均数;如果这n个数据是nxxx,,.........,21,那么)(112niixxnS叫做这n个数据方差;同时s)(11niixxn叫做这n个数据的标准差。2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。频率分布直方图:具体做法如下:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图。注:频率分布直方图中小正方形的面积=组距×组距频率=频率。折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:bxayˆ。其中2121121)())((xnxyxnyxxxyyxxbniiniiiniiniii,xbya。我们称这个方程为y对x的回归直线方程。二.典例解析题型1:数字特征例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:2(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.题型2:数字特征的应用例3.(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8其中产量比较稳定的小麦品种是。例3.(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A)9.4,0.484(B)9.4,0.016(C)9.5,0.04(D)9.5,0.016题型3:频率分布直方图与条形图例4.(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:3根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是(A)20(B)30(C)40(D)50例5.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)分组[140,145)[145,150)[150,155)[155,160)[160,165)[165,170)[170,175)[175,180)合计人数12591363140(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率。(1)根据题意可列出频率分布表:分值频数频率[140,145][145,150][150,155][155,160][160,165][165,170][170,175][175,180]合计401.00(2)频率分布直方图如下:4题型4:茎叶图例6.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯马利斯0813465223685433997661149445061题型5:线性回归方程例7.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s)5101520深度y(m)6101013(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。题型6:创新题例8.某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数256分数段[100,110)[110,120[120,130)人数8126分数段[130,140)[140,150)人数42那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).)

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功