1统计1:简单随机抽样(1)总体和样本①在统计学中,把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样。特点是:每个样本单位被抽中的可能性相同。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。(3)简单随机抽样常用的方法:①抽签法②随机数表法(4)抽签法:①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样间距,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。(2)分层的比例问题:抽样比=样本容量各层样本容量个体容量各层个体容量4:用样本的数字特征估计总体的数字特征(1)样本均值:nxxxxn21(2)样本标准差:nxxxxxxssn222212)()()((3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。(4)中位数:在样本数据中,累计频率为1.5时所对应的样本数据值(只有一个)。2注意:①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍5:用样本的频率分布估计总体分布1:频率分布表与频率分布直方图频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。②频率分布折线图:连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精细的信息。2:茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。例:某赛季甲、乙两名篮球运动员每场比赛得分情况如下甲的得分:15,21,25,31,36,39,31,45,36,48,24,50,37;乙的得分:13,16,23,25,28,33,38,14,8,39,51.画出茎叶图,并计算出出甲的众数、中位数,平均数及标准差。6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。设已经得到具有线性相关关系的一组数据:所要求的回归直线方程为:ybxa,其中,是待定的系数。(2)回归直线过的样本中心点(,)xy练习题1.已知一组数据1、2、y的平均数为4,那么【】A.y=7B.y=8C.y=9D.y=102.甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、x分、80分,若这组数据的众数与平均数恰3好相等,则这组数据的中位数是【】A.100分B.95分C.90分D.85分3.某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为【】A.16、10、10、4B.14、10、10、6C.13、12、12、3D.15、8、8、94.为了了解广州地区初三学生升学考试数学成绩的情况,从中抽取50本密封试卷,每本30份试卷,这个问题中的样本容量是【】A.30B.50C.1500D.1505.某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为【】A.4B.5C.6D.无法确定6.在频率分布直方图中,每个小长方形的面积表示【】A.组数B.频数C.频率D.组距频率7.在某餐厅内抽取100人,其中有30人在15岁以下,35人在16至25岁,25人在26至45岁,10人在46岁以上,则数0.35是16到25岁人员占总体分布的【】A.概率B.频率C.累计频率D.频数8.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是【】A.简单的随机抽样B.系统抽样C.先从老年人中排除一人,再用分层抽样D.分层抽样9.一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为【】A.5%B.25%C.50%D.70%10.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为()A.5,10,15,20B.2,6,10,14C.2,4,6,8D.5,8,11,1411.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是()A.20人B.40人C.70人D.80人12.某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为()A.16、10、10、4B.14、10、10、6C.13、12、12、3D.15、8、8、913.某校高一、高二、高三三个年级的学生数分别为1500人、1200人和1000人.现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查三个年级共抽查了人.14.有6个数4,x,-1,y,z,6,它们的平均数为5,则x,y,z三个数的平均数为.415.有一个简单的随机样本10,12,9,14,13,则样本平均数x=,样本方差s2=.16.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=17.已知x与y之间的一组数据为x0123y135-a7+a则y与x的回归直线方程abxy必过定点______18.已知样本9,10,11,,xy的平均数是10,标准差是2,则xy19.(本大题满分14分)从一台机器生产某零件中随机抽取5个,测得长度x分别为10.02,10.06,10.00,9.94,10.08(单位:cm).该零件的标准长度为10cm.(1)求出式子x=x′+10中的x′、x、x;(2)求方差和标准差。20.(本大题满分14分)为了估计某产品寿命的分布,对产品进行追踪调查,记录如下:(1)画出频率分布直方图;(2)估计产品在200~500以内的频率.寿命100~200200~300300~400400~500500~600个数2030804030521.(本题13分)在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如右表:(1)画出频率分布表,并画出频率分布直方图;(2)估计纤度落在[1.381.50),中的概率及纤度小于1.40的概率是多少?(3)从频率分布直方图估计出纤度的众数、中位数和平均数.22(本题13分)在2007全运会上两名射击运动员甲、乙在比赛中打出如下成绩:甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8;乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1;(1)用茎叶图表示甲,乙两个成绩;并根据茎叶图分析甲、乙两人成绩;(2)分别计算两个样本的平均数x和标准差s,并根据计算结果估计哪位运动员的成绩比较稳定。分组频数[1.301.34),4[1.341.38),25[1.381.42),30[1.421.46),29[1.461.50),10[1.501.54),2合计100