管理学院叶樊妮博士社会调查与数据分析内容社会调查与数据分析1数据分析的基本方法2数据分析软件介绍3互动环节4一、社会调查与数据分析选题阶段准备阶段调查阶段分析阶段总结阶段设计方案课题操作化与指标设计抽样设计问卷设计进入调查现场采用调查方法收集调查资料资料整理与录入进行统计分析开展理论研究选择课题问题明确化论证课题总结调查工作撰写调查报告评估调查结果从实施时间来看:调查在前,分析在后一个小调查问题:就你个人而言,以下的哪种情况更符合实际?A、我在做调查的时候都是资料都收集完了,才开始考虑如何对他们进行分析B、我在设计调查内容的时候就已经考虑了今后如何进行资料分析一个调查的例子西南民族大学图书馆的满意度调查满意度的测量形式:打分:1——5分满意度的调查内容:1、实体书籍的数量、质量;2、电子资源的数量和质量;3、设施和环境;4、制度和服务态度满意度的分析:1、满意度状况:平均分,分越高表示越满意2、分项目进行评价3、分专业、年级进行比较开始设计、实施社会调查与数据分析对数据分析的思考开始于调查的准备阶段根据调查结果进行数据分析方法的调整准备阶段调查阶段分析阶段数据分析分类汇总描述统计对比分析法其他高级分析方法二、数据分析基本方法1、分类汇总分类汇总是最基本和常用的数据分析方法性别(钢铁学院)30360.660.660.619739.439.4100.0500100.0100.0男女TotalValidFrequencyPercentValidPercentCumulativePercent分析步骤:1、分类2、统计每一类型的数量3、计算每一类型所占的比重案例一案例一的分析招聘专业人数(人)比率(%)应用化学、分析化学28.33统计学312.50计算机相关833.33会计520.83文物与博物馆14.17交通工程520.83合计24100.00例1招聘专业分组统计表分类汇总分析法的适用情况问卷调查的选择题请问你最喜欢的颜色是:1、红色2、白色3、蓝色4、黑色5、其他颜色人数(人)比重(%)红色5025白色2513蓝色10050最喜欢的颜色分组表问卷调查的开放题请问你对学校食堂进一步发展有何其他建议?1、希望以后菜品种类更多2、希望分量更足,每次提供的菜种类多一些3、希望食堂服务态度更好4、希望食堂师傅打菜的时候态度好一点建议人数(人)比重(%)菜品种类方面5025菜品分量方面2513服务态度方面10050食堂建议统计表类1:种类类2:分量类1:种类类3:服务类3:服务访谈记录关于学生参与创新活动遇到的困难采访,共计采访10人困难人数(人)比重(%)困难一5025困难二2513困难三10050具体分析:在参与访谈的学生中,共提到了三类困难,分别是困难一、困难二和困难三。对于困难一,某同学在访谈中提到:“访谈笔录”。。。。。。。观察法收集的资料4月13日4月14日4月15日看病种类人数(人)看病种类人数(人)看病种类人数(人)检测视力1化验肝肾1皮肤病3复诊5腹泻1胃病2感冒5感冒3女性病2扭伤4输液1感冒4皮肤病1皮肤病3扭伤2腹泻2处理伤口1复诊2口腔3口腔1口腔1伤口处理2胃病3化验3输液3总计291416二手统计资料到管理学院收集到学生参与创新项目的立项情况年级分布人数(人)比重(%)2011级50252012级25132013级100502、描述统计针对的是定量资料:数字表现的资料分析工具是:平均数、标准差、最大值、最小值、极差案例二哈德森汽车修理公司想了解顾客过去三个月在机油上的支出情况,对50户顾客进行调查,得到如下资料。917893577552998097627169728966757975727610474626897105776580109859788688368716967746282981017910579696273举例:哈德森汽车修理公司分类汇总支出($)人数(人)比重(%)50-592460-69132670-79163280-8971490-99714100-109510Total50100用图形概括(Histogram)PartsCost($)24681012141618Frequency5060708090100110描述统计平均值(averageormean)等平均值为$79,这个数字反映了顾客过去三个月在机油上的支出平均为79美元。最大值为109,最大值为52,两者之间差距为57,标准差为89,说明顾客在机油上的支出存在明显的个体差异。描述统计的适用情况问卷调查中的填空题请问你最近一个月在图书馆借了()本书问卷调查中的打分题请对图书馆人员的服务态度打分,1分代表最不满意,5分代表最满意。问卷调查中的选择题请问你最近一个月在图书馆借了多少本书?A、0本;B、1-3本;C、4-6本;D、7-10本;E、10本以上75.640/10*11.510*8.510*510*2)(平均借阅本数3、对比分析法现实生活中,数据之间大都存在着联系人们的行为、态度受到很多因素的影响受教育的水平工作后的收入预防疾病支出疾病的发病率对比分析法就是对调查得到的资料按照不同类别进行比较。步骤:1、选择比较的标准2、分类3、进行对比分析对比分析法的运用交叉表与卡方检验:适用于定性数据分析问题:对生育二胎的看法:A、赞成B、反对比较标准:年龄您的年龄属于:A、青年B、中年C、老年态度年龄合计青年中年老年赞成14415430328反对5312690272合计200280120600交叉表与卡方检验要一起使用方差分析方差分析能一次性地检验不同类别的总体均值是否存在显著差异,如果有差异则表示该类别是重要的影响因素适用的数据类型:一个是定性的分类数据,一个是定量的数字资料案例三某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表,试分析饮料的颜色是否对销售量产生影响该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8探讨的问题:颜色是否会对销量产生影响?Xf(X)1234Xf(X)3124该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8无色粉色绿色橘黄色类别平均数总平均数27.3229.5626.4431.2628.695组内差异组间差异方差分析的基本步骤(一)提出假设(二)构造检验统计量(三)统计决策一般提法H0:1=2=…=r(因素有r个水平)H1:1,2,…,r不全相等对前面的例子提出假设H0:1=2=3=4颜色对销售量没有影响H0:1,2,3,4不全相等颜色对销售量有影响1)提出假设组内均方差组间均方差F2)构造检验统计量为检验H0是否成立,需确定检验的统计量—F统计量3)统计决策如果颜色是销售量的影响因素(拒绝原假设)差异主要集中在组间组内均方差组间均方差F取值越大接受域拒绝域检验规则(1,)rnrrF若FF,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。若FF,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响。分析结果:F较大,显著性为0.000,颜色会影响该饮料的销售。4、其他分析方法相关分析法用相关系数分析两个变量之间的关系适用于两个变量都是定量数据相关关系的图示:散点图完全正线性相关完全负线性相关负线性相关正线性相关不相关非线性相关相关系数correlationcoefficient是对变量之间关系密切程度的度量;相关关系(Pearson)的计算公式22)()())((yyxxyyxxSSSryxxy或化简为2222yynxxnyxxynr案例四资料:1、您的受教育年限()年2、您首次参加工作时的月平均工资()元回归分析法选择研究变量,X和Y建立模型bxay计算出a和b模型检验简单的例子研究变量:工作的年数和工资建立模型:工资=a+b*工作年数开展调查,收集员工工资和工作年数的资料数据回归分析结果:每月工资=823.3+53.487*工作年数三、数据分析的软件ExcelSPSS管理学院叶樊妮博士