营销研究8

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2019/10/23营销研究81第八章相关性分析第一节相关系数第二节独立性检验第三节样本分布与总体分布的一致性检验2019/10/23营销研究82相关性分析营销研究中经常讨论两个变量之间的相关性问题。根据它们的相关性结论,可以制定相应的对策。如:研究某地区市民对戒烟令的态度。抽样调查434名市民,询问他们的抽烟状况和对戒烟令的看法。结果如下对戒烟令的态度总计抽烟状况认可不认可无所谓从未吸过237310250以前吸过10647117现在还吸24321167总计3673928434对吸烟的人,可能还需要其他措施。2019/10/23营销研究83第一节相关系数相关系数是反映两个变量之间的相关性及相关程度的一个系数。有代表性的相关系数主要有:两个类别变量的相关系数两个量值变量的相关系数两个顺序变量的相关系数类别变量和量值变量的相关系数2019/10/23营销研究84两个量值变量的相关系数在一次抽样调查中会得到两组量值数据,如调查消费者的年收入和每年用于旅游的支出。并在分析中要分析这两组量值数据的相关性,如旅游支出是否与年收入有关。我们把这两组数据的相关性也叫两个量值变量的相关性。设一个变量为x,另一个变量为y,如年收入为x,年旅游支出为y,对n个样本(消费者)的调查,得到一组两变量的数据(x1,y1)、(x2,y2)、……(xn,yn)。通过这一组数据,我们可以计算变量x,变量y的相关系数。公式如下:r=(xi–x)(yi–y)(xi–x)2(yi–y)2CORREL函数2019/10/23营销研究85举例随机抽样调查了15名消费者,得到他们的年收入和年旅游花费的数据如下:年收入x年旅游花费y编号123456789101112131415单位:万元5.42.31.60.80.92.80.73.41.82.710.34.23.50.91.80.10.050.8000.0200.40.050.10.40.20.0800x=2.87y=0.15(xi–x)(yi–y)=2.63(xi–x)2=85.07(yi–y)2=0.71r=(xi–x)(yi–y)(xi–x)2(yi–y)2=2.6385.070.71=0.342019/10/23营销研究86相关系数的几何解释xi-x反映了在x轴上xi至x的距离,yi-y则反映了在y轴上yi至y的距离,(xi-x,yi-y)则反映的是在两维平面上,(xi,yi)至(x,y)的相对位置。不妨设xi=xi-x,yi=yi-y,则(xi,yi)是到原点的相对位置。xiyi的符号“+”、“-”,反映了(xi,yi)在平面坐标中的哪个象限。比如,xiyi的符号为正表示(xi,yi)在第一或第三象限。如果xiyi为正,则表示(xi,yi)的大部分在第一或第三象限,反映了x和y的一致变化。因此,xiyi可作为x和y倾向于一致变化的一个度量。如果(xi,yi)散乱地分布在坐标的四个象限内,则不具有沿第一和第三象限或第二和第四象限一致变化,即不具有相关性,而且由于xiyi中的xiyi相互抵消而趋于零。2019/10/23营销研究87相关系数的一些结论|r|1如果对变量做线性变换,则变换后的变量之间的相关系数的绝对值不变相关系数只度量了两个变量之间的线性相关程度,r=0表示线性不相关,|r|越大表示线性相关程度也越大。r=0表示两个变量线性不相关,但不表示它们一定不相关。两个变量之间相关并不能说明它们有因果关系2019/10/23营销研究88结论的证明1、证明|r|1:记ai=xi–x,bi=yi–y|aibi|2=ai2bi2+2aibiajbjai2bi2+(ai2bj2+aj2bi2)=(ai2)(bi2)ijij|aibi|2(ai2)(bi2)1|aibi|(ai2)(bi2)1|r|12019/10/23营销研究89结论的证明2、证明|ruv|=|rxy|,设ui=axi+bvi=cyi+d则ui-u=axi+b-(ax+b)=a(xi-x)vi-v=cyi+d-(cy+d)=c(yi-y)|ruv|=(ui-u)(vi-v)(ui-u)2(vi-v)2=ab(xi-x)(yi-y)a2b2(xi-x)2(yi-y)2=|rxy|2019/10/23营销研究810结论的证明3、设有一组数据是(1,1)、(1,-1)、(-1,1)、(-1,-1),则它们的相关系数是零,即它们不是线性相关的。但它们是某种相关,满足,x2+y2=24、设有一组数据是调查小学生考试的成绩和他们的身高获得的数据,结果得到的相关系数是接近于1,但成绩和身高显然不具有因果关系。2019/10/23营销研究811两个类别变量的相关系数对于两个类别变量的交叉统计可得到一张关于这两个变量的交叉频数列表,通过交叉列表可以计算这两个变量之间的相关系数。例,对1990年《亚运会》的调查资料统计,得到如下关于北京市被调查者的教育和性别之间的交叉列表:性别变量x和教育程度变量y的交叉列表性别频数教育男女总计总计未回答358大专及以上197150347初中185178363高中或中专208211419小学及以下41428363458612202019/10/23营销研究812—相关系数相关系数又称Guttman预测系数,能够测量两个类别变量间的相关系数。如果变量x与y是对称的,即无所谓谁是自变量,谁是因变量,则它们的相关系数如下:=mx+my-(Mx+My)2n-(Mx+My)如果变量x与y是不对称的,假设x是自变量,y是因变量,则有:=my-Myn-My2019/10/23营销研究813参数说明Mx=x变量中的最大频数My=y变量中的最大频数my=x变量取固定类别值时,y变量中的最大频数mx=y变量取固定类别值时,x变量中的最大频数n=样本量2019/10/23营销研究814举例亚运会北京市民的调查,计算教育与性别的相关系数,数据如前面的表。性别频数教育男女总计总计未回答358大专及以上197150347初中185178363高中或中专208211419小学及以下4142836345861220My=419Mx=634my(男)=208my(女)=211mx(未回答)=5mx(大专及以上)=197mx(高中或中专)=211mx(初中)=185mx(小学及以下)=422019/10/23营销研究815举例解:解:My=419Mx=634my(男)=208my(女)=211mx(未回答)=5mx(大专及以上)=197mx(高中或中专)=211mx(初中)=185mx(小学及以下)=42,如果把x与y看成是对称的,则有=mx+my-(Mx+My)2n-(Mx+My)=640+419-(419+634)21220-(419+634)0.004如果把与y看成是不对称的,x是自变量则有=my-Myn-My=419-4191220-419=02019/10/23营销研究816—相关系数这一相关系数主要测量不对称的两个类别变量x与y的相关程度。如果x是自变量,y是因变量,则它们的相关系数是y=f(x)2fx–nfy2nnfy2–其中,f(x)=交叉汇总表中固定x变量的y变量频数(共有s行t列)fx=交叉汇总表中x变量的频数(共有t个)fy=交叉汇总表中y变量的频数(共有s个)2019/10/23营销研究817举例同上例,求y系数解:y=f(x)2fx–nfy2nnfy2–=fx=32+1972+2082+1852+412634+52+1502+2112+1782+422586=357.59=nfy2f(x)282+3472+4192+3632+8321220=356.30357.59–356.301220–356.300.0015注:—相关系数应用了所有交叉汇总的频数,测量效果比—相关系数好2019/10/23营销研究818两个顺序变量的相关系数Spearman等级(秩)相关系数:它适合于测量两个对称的顺序变量的相关系数。在计算相关系数之前需要先将对x、y的测量值换算成顺序排列值秩1、2、3…、s。当然,如果x、y已经用秩表示时,则可直接计算。计算公式如下:10、如果不存在等值项时,相关系数为:R=1–6D2n(n2–1)20、如果较多的存在等值项时,相关系数为:R=n(n2–1)–6D2–—(cx+cy)12n(n2–1)–cxn(n2–1)–cy2019/10/23营销研究819参数说明其中:D=x的秩与对应y的秩之差(满足D=0)cx=(di3–di),它是对x的所有等值组求和,即求和i从1到所有等值组数t,di表示第i个等值组的重复数cy=(ej3–ej),它是对y的所有等值组求和,ej表示第j个等值组的重复数n=样本量比如:x的秩是1、2.5、2.5、4、5、6.25、6.25、6.25、6.25、10,则cx=(di3–di)=(23–2)+(43–4)2019/10/23营销研究820举例某地举行选美大赛,有10位佳丽参赛,评委对她们的容貌和才智进行打分。数据如下:参赛者12345678910总计n=10容貌x99957960935040863554才智y20109080308870409558x秩10965832714y秩21973864105D88-3-25-5-43-9-1D=0D26464942525169811D2=298问参赛者的容貌打分与才智打分是否相关?先将打分值换算成两个变量的秩,由于x和y的秩中不存在等值项,故用公式10R=1–6D2n(n2–1)=1–629810(100–1)=–0.806分析结论:x和y反向相关,容貌较差的倾向于有较高的才智2019/10/23营销研究821举例随机调查电视观众对15个电视剧进行评价,评价它们的“娱乐性”x和“艺术性”y,下面是样本总体对“娱乐性”x和“艺术性”y排序后的秩参赛者123456789101112131415总计n=10x秩321785461415129101113y秩1234.54.56789.59.51112131415D20-22.53.5-1-3-24.55.51-3-3-3-2D=0D24046.2512.2519420.2530.2519994D2=123求娱乐性”x和“艺术性”y的相关系数由于y变量存在两个等值组4.5、4.5,9.5、9.5,故采用公式20解:n=15D2=123cx=0cy=(23-2)+(23-2)=12R=n(n2–1)–6D2–—(cx+cy)12n(n2–1)–cxn(n2–1)–cy0.782019/10/23营销研究822类别变量与数值变量的相关系数相关比例E2也称为eta平方系数,主要针对自变量为类别变量,因变量为数值变量的相关性测定。计算公式为:E2=(Y-Y)2-(Y-Yi)2(Y-Y)2其中,Y=自变量x=xi时,因变量Y的平均值Y=全样本的Y的平均值,一般在实际计算时,还可以将以上公式变成更简洁的形式:E2=niYi2-nY2Y2-nY2或E=E2其中,ni是自变量的样本数,n是总的样本数。2019/10/23营销研究823举例随机调查三种不同的家庭背景的20名学生的英语成绩,试求家庭背景与英语成绩的关系。数据如下:知识分子家庭工人家庭农民家庭7885819084867058516362597178848174758081n1=6n2=7n3=7Y1=84Y2=62Y3=792019/10/23营销研究824举例的解niYi2=6×842+7×622+7×792=112931Y=6×84+7×62+7×796+7+7=74.5nY2=20(74.5)2=111154.05Y2=782+852+…+802+812=113385E2=112931-111154.05113385-111154.05≈0.796E=√E2=0

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功