第八章模型的构建和检验的若干问题•我们建立的什么类型的模型?•在什么程度上模型是正确的?•模型建立中存在问题吗?第八章模型的构建和检验的若干问题一.模型构建的问题二.模型的有效性检验三.模型的可信度评估一模型构建的问题数学分析的严密性给人们深刻印象,以及给人以精确而细致的感觉,但这可能蒙蔽我们,使我们看不到制约整个过程的前提和缺陷。建立在不可靠前提上苦心完成的细致的数学过程,恐怕比任何的欺骗手段都更为隐蔽和更为危险。1.1归纳和演绎•把观测数据排列成互相联系的形式是“归纳”的思维过程,包括提出一种和事实相符合的假说或理论。•如果最初基于直觉做出的工作假说导致了可以得到验证的“演绎”,这种工作假说就起了有效的作用。•根据假说进行的逻辑演绎可用来预测尚没观测到的事实。假说的有效性是根据指定该假说时的事实进行检验的,新的事实可能导致这种假说的修改1.2方法论的谬误•统计联系与因果关系•事后解释•生态学谬误•还原论•混淆统计检验显著与实际意义的显著1)统计联系与因果关系•因果关系是事物之间的一种本质联系•统计联系只是观测数据中所反映的事物的数量联系•统计模型是进行假说检验的一种手段,其检验的本质是证伪,而不是证实2)事后解释•如果在进行统计分析之前没有理论假设,那么这一分析属于探索性或描述性的。在得到的统计结果基础上,可以形成新的理论假设。•然而,如果反过来再将同一统计分析作为假设检验看待,就是犯了事后解释错误事后解释谬误的要害•将一个仅仅处于刚刚建成的假设当作经过检验的假设来对待,将一个探索性或描述性分析结果当作了一个解释性分析的结果,完全混淆建立假说和假说检验的区别•由一个数据集所形成的假说或假设不能用同一数据集进行检验3)生态学谬误•根据集合单位的分析结果作关于个体的断言•在人口研究中,微观行为模式(如夫妇或家庭)可能与宏观行为模式(省和国家的汇总资料)有重大区别。从宏观来说,人口控制已经成为一种公共利益,但是个人、家庭却不一定能够自觉按照公共利益要求行动,因为宏观利益并不完全与微观利益相一致•教育和经济水平越发达、地区生育水平越低•个人受教育水平越高、收入越多,生育数量越低?生态学谬误的表现•发达国家的家庭多没有子女–这个家庭是发达国家的–这个家庭没有子女区别:所有的树都有根这是棵树这棵树有根血统论?生态学谬误的表现•在国家这个层次上,可能看到收入和犯罪之间有强烈的关系,即低收入往往伴随着高犯罪。•但是,如果我们据此认为低收入的人更可能干坏事,那就犯了生态学谬误的错误4)还原论•与生态学谬误相对的一种方法论谬误•根据较低层次研究单位的分析结果推断较高层次单位的运行规律还原论的表现•物理学、生物学对一般物质或生物研究所得到的规律,套用在社会研究中,便产生了社会物理学、社会生物学等种种理论5)混淆统计检验显著与实际意义的显著•根据抽样数据得到的统计量只是总体参数的点估计统计检验是否显著受到三个方面的影响•实际差异幅度或作用强度的影响-对总体的推测•所要求的把握或称置信度的大小•抽样样本规模的大小•如果不根据统计量的实际意义来判定,样本规模足够大,或者降低对结论的把握性要求,一个完全没有实际意义的差异幅度或作用强度也可以取得统计显著的结果下面的显著是没有意义的•省际平均收入相差0.001元,在样本规模很大时,也可能取得统计检验十分显著的结果模型中的可能错误•混淆因果关系和统计关系•混淆统计显著和实际意义•使用相同的数据产生结论并证实自己•使用个体行为推测整体行为•使用整体行为推测个体行为1.3模型解释与研究对象•科学研究并不企图以模型形式完美地再现客观世界,而是努力寻求其最本质的特征,去揭示和发现世界•地理学研究对象的复杂性决定了地理学的研究主要采用常规模型(nomotheticmodel)来解释世界,它不需要(也不可能)列举所有的影响因素,而只选用解释总体时最重要的因素。所以,它实际上是对人类活动或影响人类活动的自然过程的部分解释,它的目标是用尽可能少的原因变量提供尽可能多的解释力,解释各变量之间的基本联系和因果关系形式1.4统计分析与理论分析•统计分析是在理论分析的基础上,检查各个模型变量的作用,对其作用进行量化描述,并对有关理论假设进行检验1.5真理性检验与统计检验•实践是检验真理的唯一标准•实践是一个活动过程,不能简单归结为直接经验这样的个别环节•统计检验,可以认为是实践检验的一种形式二模型的有效性检验•模型验证•模型确认模型验证•考察模型与模型计算机实现之间的关系•强调当前模型与计算机程序之间的一致性模型确认•考察模型(所建立的模型)与被仿真系统(研究对象)之间的关系•强调理论模型与实际系统之间的一致性数据有效性问题实体概念模型计算机模型实验分析与建模编程与实现运行有效性计算机模型有效性概念模型有效性理论模型理论模型可能的错误•I类错误:结果本应有效却判为无效;–建模者风险•II类错误:结果本应无效,却判为有效;–用户风险•III类错误:研究目的不明确而误认为明确,即研究的实际内容与所需研究的内容不相符–建模者与用户共同风险影响因素•建模的原理和方法不正确,或者原理和方法虽是正确的,但建模时的假设条件、参数选取或模型简化的方法不对•建模过程中忽略了部分次要因素影响因素•目前尚没有标准能确定哪些约束在建模时是可以忽略的•模型实验的时间过短•对模型初始数据的选取存在失误影响因素•随机变量的概率分布类型确定或参数选取有误•模型输出结果的统计误差•在进行计算机实现、求解和实验过程中,模型的有效性还会受到诸如计算机字长、编码错误和算法等方面的影响模型确认的内容•理论模型有效性确认•数据有效性确认•运行有效性确认三模型可信度评估•理论模型有效性确认;•模型软件验证;•模型运行有效性确认;•数据有效性确认;•内部安全性验证理论模型的有效性•表观确认•历史分析•预期应用和需求分析•模型概念和逼真度分析模型的软件验证•计算机模型追踪分析•软件度量分析•代码分析•正确性证明