Spss统计应用实务-问卷分析与应用统计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Spss统计应用实务-问卷分析与应用统计主要内容统计基本原理与常用统计方法统计基本思想及基本概念统计数据整理与显示方法统计描述统计推断-参数估计假设检验多变量关系研究-相关与回归,单(双)因素方差分析常用的统计模型:因子分析、聚类分析定量研究与统计分析量化研究的基本概念量表分析步骤数据的建立量表项目分析量表效度与信度信度与效度的概念信度与效度的检验方法统计应用实例及EXCEL、Spss统计基本原理与常用统计方法1.1统计基本思想与基本概念1.1.1什么是统计学?统计学是用以(1)收集数据、(2)分析数据、(3)由数据得出结论的一组概念、原则和方法。1.1.2统计学的基本思想随机性和规律性:关系密切的孪生子规律性中的随机性1.1.3统计学的中几个基本概念变量、值和个体定义:分类:定类变量、定序变量、定距变量、定比变量随机事件和随机变量总体、样本总体参数和样本统计量概率统计基本原理与常用统计方法1.1统计学的基本思想与基本概念1.1.4统计研究的基本过程数据收集-----数据整理-------数据分析1.1.5数据收集观测数据和实验数据变量的定义和变量的选择数据收集的方法:文献资料法、调查法、测量等选择合适的样本:简单的随机抽样、分层抽样、整群抽样收集数据时的错误和误差衡量某一调查的结果所要考查的因素:样本是否是合适的样本响应率(responserate)提问题时所用的实际措辞在调查中该问题被安排在什么地方?访问员是谁抽样误差(sampleerror)、系统误差、过失误差、随机误差未响应误差(nonresponseerror)响应误差(responseerror)15119690481216频数可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布不同品牌饮料的构成可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%露露18%统计基本原理与常用统计方法1.2不同数据类型整理与展示方法1.2.1数据的分类定类变量-分类数据定序变量-顺序数据定距变量-数值型数据时间序列数据多变量数据1.2.2分类数据的整理与展示频数与频数分布图示:条型图、饼图统计基本原理与常用统计方法1.2不同数据类型整理与展示方法1.2.3顺序数据的整理与展示累积频数累积频率甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————统计基本原理与常用统计方法1.2不同数据类型整理与展示方法243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向下累积27616830300750100200300400非常不满意不满意一般满意非常满意累积户数(户)(b)向上累积甲城市家庭对住房状况评价的累积频数分布统计基本原理与常用统计方法1.2不同数据类型整理与展示方法8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意甲乙两城市家庭对住房状况的评价统计基本原理与常用统计方法1.2不同数据类型整理与展示方法1.2.4数值型数据整理与展示方法数据的分组分组方法等距分组异距分组单变量值分组组距分组分组方法等距分组异距分组单变量值分组组距分组统计基本原理与常用统计方法1.2不同数据类型整理与展示方法统计基本原理与常用统计方法1.2不同数据类型整理与展示方法组距分组确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。2.确定组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数统计出各组的频数并整理成频数分布表实例用Excel制作频数分布表【例】某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组。直方图140150210直方图下的面积之和等于1某电脑公司销售量分布的直方图190200180160170频数(天)25201510530220230240折线图折线图与直方图下的面积相等!140150210某电脑公司销售量分布的折线图190200180160170220230240频数(天)25201510530茎叶图箱线图最小值141最大值237中位数182下四分位数170.25上四分位数197140150160170180190200210220230240某电脑公司销售量数据的箱线图不同数据分布的箱线图对称分布QL中位数QU左偏分布QL中位数QU右偏分布QL中位数QU不同分布的箱线图统计基本原理与常用统计方法1.2不同数据类型整理与展示方法1.2.5时间序列数据-线图【例】已知1991~2000年我国城乡居民家庭的人均收入数据如表。试绘制线图¥$1991~2000年城乡居民家庭人均收入年份城镇居民农村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6784.0921.61221.01577.71926.12091.12162.02210.32254.4线图城乡居民家庭人均收入020004000600080001991199219931994199519961997199819992000年份收入城镇居民农村居民统计基本原理与常用统计方法1.2不同数据类型整理与展示方法1.2.5多变量数据-雷达图¥$【例】2000年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图。今天的主食是面包2000年城乡居民家庭平均每人生活消费支出构成(%)项目城镇居民农村居民食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务39.1810.018.796.367.9012.5610.015.1749.305.754.525.245.5811.1815.473.14雷达图2000年城乡居民家庭人均消费支出构成01020304050食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务城镇居民农村居民总结条形图饼图环形图汇总表品质数据直方图折线图分组数据茎叶图箱线图原始数据线图时序数据雷达图多元数据数值型数据数据的类型统计基本原理与常用统计方法1.3描述统计1.3.1数据集中趋势测度指标众数(Mode)中位数(Median)、分位数(quartile)平均数(Mean)1.3.2数据离散趋势测度指标异众比率全距(Range)四分位距(quartiledeviation)标准差(Std.deviation)方差(Variance)变异系数(离散系数)1.3.4数据偏态与峰态测度指标偏态系数、峰态系数1.3.5相对位置测量标准分数据特征的测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰态四分位差异众比率偏态sxxzii众数、中位数、平均数与分布左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用数据类型和所适用的集中趋势测度值数据类型分类数据顺序数据间隔数据适用的测度值※众数※中位数※均值—四分位数众数—众数中位数——四分位数——————相对位置-标准分9个家庭人均月收入标准化值计算表家庭编号人均月收入(元)标准化值z123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996经验法则表明:当一组数据对称分布时•约有68%的数据在平均数加减1个标准差的范围之内•约有95%的数据在平均数加减2个标准差的范围之内•约有99%的数据在平均数加减3个标准差的范围之内应用标准分制定评价标准数据类型和所适用的离散程度测度值数据类型分类数据顺序数据数值型数据适用的测度值※异众比率※四分位差※方差或标准差—异众比率※离散系数(比较时用)——平均差——极差——四分位差——异众比率偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!EXCEL统计实例统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布1.4.2参数估计1.4.3假设检验参数估计假设检验统计方法描述统计推断统计统计推断的过程样本总体样本统计量例如:样本均值、比例、方差统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布抽样方式简单随机抽样分层抽样整群抽样系统抽样多阶段抽样概率抽样方便抽样判断抽样自愿样本滚雪球抽样配额抽样非概率抽样抽样方式统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布抽样分布1.在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布2.是一种理论分布3.随机变量是样本统计量样本均值,样本比例,样本方差等4.结果来自容量相同的所有可能样本5.提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布示意总体计算样本统计量例如:样本均值、比例、方差样本统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布样本均值的抽样分布现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布样本均值的抽样分布计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X样本均值的抽样分布1.00.1.2.3P(X)1.53.04.03.52.02.5统计基本原理与常用统计方法1.4统计推断1.4.1抽样与抽样分布样本均值的抽样分布=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X5.2X625.02X中心极限定理当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布xn中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xX统计基本原理与常用统计方法1.4统计推断1.4.2参数估计根据样本统计量的抽样分

1 / 114
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功