1城市规划系统工程学2系统的定量分析方法(四)一元线性回归在城市规划中的初步应用3知识点回顾样本变量间的相互关系函数关系相关关系4知识点回顾相关系数r(r绝对值越大,相关性越强)如何判断两个变量之间是否有相关性(看相关系数r,以及看t值是否通过检验)5样本相关系数的计算公式22)()())((yyxxyyxxr-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加大于0.8高度相关,0.5到0.8之间中度相关,0.3到0.5之间低度相关,小于0.3可视为不相关6知识点回顾相关性在城市规划中的应用判断两个事物是不是存在相关关系,以此来帮助我们在设计中确定需要关注的对象。如通过研究我们发现住宅层数与犯罪率有相关性,且高层建筑的电梯间里发生的犯罪率与层数的相关性最大(r值较大),所以我们在设计的高层建筑的时候,需要注意采取一些措施防止犯罪案件的发生。7作业中主要问题1)无论函数关系还是相关关系,应该是两个变量之间的关系。“座椅使用率”与“座椅的朝向”“出行率”与“交通便利条件”“车流量”与“上下班的高峰”“使用人数”与“公园的位置”乘坐出租车交费是一种函数关系“出行率”与“出行工具的选择”“交通出行”与“出行的目的”大学生一年运动的总时间与生病次数的关系82)描述函数关系时,应该加上必要的前提条件。“建筑面积”与“容积率”“商品的价格”与“商品销售总额”作业中主要问题“水费”与“用水量”之间的关系当用地面积一定的时候,建筑密度与建筑基地面积之间的关系93)没有准确理解什么是函数关系。“建筑密度”与“容积率”是函数关系“人口”与“居住用地面积”是函数关系作业中主要问题“停车位的数量”与“客流量”之间的关系104)利用相关性进行调研时,注意考虑分析出来的结果有什么用处,有什么意义。调查一个城市若干个开盘的项目的开盘价格,记录为变量x。过一段时间后,对同样的楼盘再进行调查,记录其价格为变量y。根据r值与t值,分析变量x(开盘价格)与变量y(一段时间后的价格)之间是否存在紧密的相关关系。结论?目的?意义?作业中主要问题115)“言简意赅”、“意犹未尽”。城市林荫大道道路横断面设计最优方案。怎么做?这正是要你们设计的。作业中主要问题126)各样本的变量值应该是一个确切的数,而不是区间调查小区绿地的使用率与绿地的多种要素的关系。1)调查绿地的使用率与绿地的面积的是否有相关性,相关性强不强2)调查绿地的使用率与绿地的活动设施占有率是否有相关性,……3)调查绿地的使用率与居住组团中的位置是否有相关性,……4)调查绿地的使用率与绿地跟住宅的步行距离是否有相关性,相关性强不强。调查了3个样本,其中第一个样本这个距离为小于等于50,第二个样本距离为50-100,第三个样本为大于100想法非常不错,但1)绿地的位置如何量化,需要考虑。可能改成绿地的居中度更合适些2)样本的变量值应该是一个确切的数,不然如何计算R值?作业中主要问题137)阐述不够完整年龄与居住区楼层的关系调研。通过计算项关系属来分析不同年龄与层数的相关性大小。来判断年龄与层数之间的相关性是否密切。想法非常不错,但需要阐述的更清晰些。因为我们需要设计一个调研。应该把整个过程和步骤都考虑和设计清楚后,再行动。作业中主要问题148)优秀的作业例一:我们通过观察发现城市路网密度越大,人们同样距离的出行时间(都以公交的方式出行)就会越短。(表象)因此,我们希望通过调查他们之间的相关性,来帮助我们缩短人们的出行时间。(调研目的)我们通过统计若干个地区(样本)的道路密度(变量x),以及该地区人们以公交方式同距离的出行时间(变量y)(抽样统计),并分析之间的相关关系(R值,t值)。可以看出两者之间的相关关系密不密切。(分析)如果密切,(R值较大)。说明,道路网密度过小对于人们在路上耽误时间过长这个现象有非常大的责任。那为了缩短人们的出行时间,我们应该增加路网密度。如果不密切(R值很小)。说明,道路网密度的大小,对于人们在路上耽误时间过长这个现象没什么影响,我们应该再去寻找其他原因,来缓解出行时间过长的现象。15例二:商业中心销售额(变量Y)与一些影响因素(变量X1、x2、x3、x4)之间的相关性1)我们观察发现商业中心销售额与一些因素有关(地理位置的优劣,知名度,商品档次的高低,人均开放空间的面积)(表象)2)我们希望调查他们之间的相关性,来帮助我们增加商业中心的销售额。(调研目的)3)通过统计若干个商业中心(样本)的销售额(变量y),以及这些商业中心的地理位置的优劣(x1),知名度(x2),商品档次的高低(x3),人均开放空间的面积(x4)(x1、2、3、4的数值通过专家打分或者其他方式获得)(统计调查)。并分别计算X1、2、3、4与Y变量之间的相关系数。如果密切,(R值较大,R值最大)。说明?如果不密切(R值很小)说明?16调查餐馆的利润与它的一些因素的相关性(菜品好坏、周围居民区的规模、所在地区地价、交通便利程度、功能混合程度。)调查道路拥堵程度与一些影响因素的相关性(道路宽度、道路交叉口数量、车流量大小、上路车类型的多少、道路周边用地类型)调查公共服务设施使用率与一些因素的相关性(居住区的人口、公服的面积、公服与居住区的距离)8)其他一些好的想法调查道路宽度与交通事故之间的相关性…………………………17从数量的角度去研究相关关系,是数理统计的一个任务.这包括通过观察和试验数据去判断变量之间有无关系,对其关系大小作出数量上的估计,对互有关系的变量通过其一去推断和预测其它,等等.回归分析就是研究相关关系的一种重要的数理统计方法.一、回归分析18回归这一术语是1886年英国生物学家高尔顿在研究遗传现象时引进的.他发现:虽然高个子的先代会有高个子的后代,但后代的增高并不与先代的增高等量.他称这一现象为“向平常高度的回归”.二、来源19这意味着,若父亲身高超过父亲这一辈人平均身高6英寸,那么其儿子的身高大约只超过儿子这一辈人平均身高不到6英寸,可见身高有向平均值返回的趋势.诚然,如今对回归这一概念的理解并不是高尔顿的原意,但这一名词却一直沿用下来,成为统计学中最常用的概念之一.6英寸6英寸20比如:随着城市人口的增加,城市用地规模也会增加,虽然这种增加并没有一个确定的函数关系,但是总是围绕着某一个规律在发生。数学中的回归分析正是对这个回归规律的科学的概括和抽象,有相关关系的变量,它总是围绕着一根直线(或曲线)上下波动。回归分析就是要找出这根直线、或曲线。三、统计学中回归分析的含义21在回归分析中,当变量只有两个时,称为一元回归分析;当变量在两个以上时,称为多元回归分析.变量间成线性关系,称线性回归,变量间不具有线性关系,称非线性回归.在这一讲里,我们主要讨论的是一元线性回归.它是处理两个变量之间关系的最简单的模型.它虽然比较简单,但我们从中可以了解到回归分析的基本思想、方法和应用.重点讨论22相关分析只能帮助我们了解两个变量之间是不是有相关关系,以及相关关系大不大。而回归分析则能帮助我们找到两个变量之间的规律是什么样的,以及已知一个变量,对另一个变量进行预测。四、相关分析vs回归分析23五、一元线性回归在居住区规划里面,商业网点的配置一般是根据千人指标的计算进行的。但千人指标只提出商业面积规模,并未明确各商业点的数目。一般来说,居民数越多,商业点应该越多,但是他们之间并没有一个很确定的函数的关系,只能说他们有相关性。我们可以通过一元线性回归分析来,找到他们所围绕的那根直线(或者说拟合的函数关系)让我们用一个例子来说明如何建立一元线性回归方程.24小区编号居住区规模(户)超市数(个)1800121200231600241600351800362000372000482400492600410280050超市数123451000户2000户3000户居住区规模散点图250超市数(y)123451000户2000户3000户居住区规模(x)y=ax+b散点图从图看到,数据点大致落在一条直线附近,这告诉我们变量x和y之间大致可看作有线性相关关系.从图中还看到,这些点又不完全在一条直线上,这表明x和y的关系并没有确切到给定x就可以唯一确定y的程度.这是因为,还有许多其它因素对y产生影响,如城市密度,生活习惯等等。现在,我们只研究超市数与居住区规模之间的关系,希望找到他们之间的拟合的函数关系。从而可以通过知道居住区规模的大小,来确定居住区内超市的数目。26用Spss统计分析软件来进行一元线性回归分析大家初步了解这个软件就可以了回归的结果在Coefficients表中查找Constant常数:b=-0.338人口变量前的系数a=0.00182870t1.96表示两变量显著相关最后拟合出的方程超市数目=0.00182870居民户数-0.33827检验与预测最后拟合出的方程超市数目=0.00182870居民户数-0.338小区编号居住区规模超市数180012120023160024160035180036200037200048240049260041028005根据方程计算出来的超市数1.121.862.582.582.953.323.324.054.414.78根据方程计算出来的超市数,与统计调查所得到的样本变量(超市数)差别不大,说明我们所得回归方程是正确的。我们可以利用回归拟合的方程来预测不同规模的居住区,需要超市的数目。比如居住区居民户数达到4000的时候,超市数多少?28六、一元线性回归分析的一般步骤1、统计调查,收集样本值Xi,Yi2、做散点图,直观判断或者通过求相关系数(R)与t值检验,判断是否线性相关,如不是线性相关则无法求得回归方程。3、非线性相关先作线性化处理后,按照线性相关求解。(此步骤我们不需掌握)4、用spss软件进行一元线性回归分析,得到拟合的一元线性方程5、运用回归方程进行拟合验证和预测29七、线性回归分析方法在城市规划里的其他应用如:对城市化水平与商业服务设施数量进行回归分析,求出拟合的方程。这样就可以通过已知的城市化水平来预测相应的城市化水平下城市的商业服务设施数量。又如:对城市人口规模与城市发展的时间进行回归分析,求出拟合的方程。这样就可以预测规划末期城市人口的规模。(这是总规中城市人口规模的重要预测方法)30八、城市人口规模预测方法:1)综合平衡法:根据自然增长率、机械增长率来推算。2)区位法:根据城市在区域中的地位、作用来对城市人口规模进行预测。3)职工带眷系数法:根据职工人数与部分职工带眷情况来确定城市人口。4)一元线性回归法5)环境容量法:根据环境条件来来确定城市允许开发的最大规模。6)类比法:通过与发展条件、阶段、现状规模和城市性质相似的城市进行对比分析。……31九、用一元线性回归的方法对城市人口进行预测有这样一个中等城市,我们将对其进行总体规划,规划期限是2009-2020,现在需要预测规划末期(2020年)的城市人口。问:如何用一元线性回归的方法对城市人口进行预测。32年份200020012002200320042005200620072008人口(万人)14.7815.4716.4817.3618.0519.0919.9522.2524.622、为了便于计算,将时间变化数而不是年份作为自变量时间变化x123456789人口y(万人)14.7815.4716.4817.3618.0519.0919.9522.2524.621、统计调查,收集样本。该城市2000年到2008年的城市人口规模。333、根据统计数据做散点图,判断人口规模与时间之间有无相关关系。时间变化x123456789人口y(万人)14.7815.4716.4817.3618.0519.0919.9522.2524.620人口(y)万人510152025第2年第4年第8年散点图第6年第10年时间变化量从图看到,数据点大致落在一条直线附近,这告诉我们变量x和y之间大致可看作有线性相关关系.从图中还看到,这些点又不完全