1第二讲:社会统计学的基本知识23一、社会学定量研究的基本逻辑4社会现象之间的关系可以分为两类,一类是确定性关系,一类是非确定性关系。确定性关系是指某一或某几个现象的变动会引起另一个现象的变动,它们之间的关系可以用数学函数式确切的表达出来,即Y=f(X),当知道X值时,就可以获得一个确切的Y值,自然科学的许多公式就是这一类型。非确定性关系是指,两个或多个现象之间虽然存在某种关系,但是这种关系是不确定的或不确切的函数关系,除了这些现象的影响之外,还受许多其他因素的影响,变量之间的关系围绕一定的函数关系上下波动,这类关系又称为统计关系。如经济水平和受教育水平的关系,经济水平高的地区,居民的受教育水平也越高,但两者也不是唯一确定的关系,可能除了经济因素外,受教育水平还与人们对教育的重视程度、教育的投入以及对男性和女性受教育程度的不同要求有关。纷繁复杂的社会现象作为一个有规律的社会现象进行研究5EG:中国人社会地位的获得_阶级继承和代内流动.pdf布劳-邓肯:美国的职业结构(1967).研究发现:越是工业化社会,先赋性因素对个人社会地位获得的影响就越弱;越是传统社会,先赋性因素对个人社会地位获得的影响就越强.为此,得出以下结论:6中国:白威廉的研究,白氏通过对中国大陆1972-1978年间迁居香港的132位移民的访谈,得到了他们2865位邻居的数据,发现:对于那些在“文革”前(1966年前)就年满20岁的同期群案例来说,父亲的“受教育水平”与“职业地位”对子女的受教育水平,父亲的“职业地位”与“阶级出身”对子女的“职业地位”获得等,具有显著影响作用。但对于那些在“文革”时期才年满20岁的同期群案例来说,作用却并不显著。谢文和林南于1983年在北京的调查(N=1774)、林南和边燕杰于1985在天津的调查(N=1000)等进一步证实:父亲的职业地位既对人们的初职地位获得毫无影响,也对人们目前职业地位的获得缺少明显作用。引进“工作单位部门”这一指标时发现,父亲的“工作单位部门”却通过对儿子“工作单位部门”的作用而影响了儿子的初职地位获得,但女儿却无此殊荣。71、何为理论?(1)人们由实践概括出来的关于自然界和社会的知识的有系统的结论。(《现代汉语词典》)(2)(a)由逻辑的或数学的陈述所连接的一组假设性命题,它对经验现实的某一领域或某一类现象提出解释。如圆周定律:L=2лr,Mean,Median的计算等等;(b)在不太严格的意义上,有关现实某一领域的任何抽象的、一般性的陈述都可称为理论,它通常包括对一般性概念的详细阐述。(《哈珀柯林斯社会学词典》)如受教育程度越高,工资水平就越高8理论的层次宏观理论(或者说一般性理论)往往以全部社会现象或各种社会行为为对象,提供一种高度概括的解释框架。它的体系通常十分庞大,结构十分复杂,概念十分抽象,有时人们把这种类型的理论称为“巨型理论”。社会学中的结构功能主义理论、交换理论、冲突理论等。这种宏观理论往往并不直接与具体的、经验的社会研究发生联系,它们更多地是作为研究者观察问题、分析问题时所采取的一种理论视角或所依据的一种理论背景。9中观理论(中层理论)是以某一方面的社会现象或某一类型的社会行为为对象,提供一种相对具体的分析框架。它由有限的几组假定所组成,通过逻辑推导可以从这些假定中产生能接受经验研究证实或证伪的具体假设。它只涉及有限的社会现象。比如,社会学中常见的社会流动理论、社会分层理论、角色理论、参照群体理论等等。韦伯等人提出了社会分层的标准,实际调查分析中提出了更多的指标。将社会成员按这些指标分成6层,9层,甚至27层布劳等人的代际流动框架,是否适用于中国。10微观理论则是一组陈述若干概念之间关系、并在逻辑上相互联系的命题,其中一些命题可以通过经验检验。如性别与大学生的学习成绩有很大关系。男生比女生更善于处理人际关系。通过对微观概念间关系的分析,发现宏观社会的规律。112、概念(concept)是对现象的一种抽象,它是一类事物的属性在人们主观上的反映。对实际事物的抽象如“凳子”:方形的、圆形的、长条木头的、铁的、塑料的红色的、白色、棕色等等它们具有某些共同的特征:由若干条腿支撑着的一个可供人坐的平面。12概念的抽象层次物质财富生活用品家具桌子高大含糊操作化低小明确抽象层次涵盖面特征理论抽象可见、可测量问卷设计/调查统计分析13概念的分类常量:一类概念仅仅标识某类现象,是唯一的,如“太阳”、“月亮”;数学上称为“常量”,如л。变量:另一类概念则往往包括若干个子范畴、属性或亚概念,它们反映出概念所指称的现象在类别、规模、数量、程度等方面的变异情况。如性别,职业,文化程度,意愿,收入等.正是因为概念具有这种多值的特性,在社会研究中,人们借用了一个数学术语,把所研究的概念称做“变量”(或变项)143、变量所谓变量(Variable),就是具有一个以上不同取值(不同的子范畴、不同的属性,或不同的亚概念)的概念。而那些只有一个固定不变的取值的概念,则叫做常量。---社会统计学就是对这些变量特征或变量之间关系的描述和分析如“性别”:男性和女性两个取值“文化程度”:文盲半文盲、小学、初中、高中或中专、大专、本科、硕士、博士等多个取值154、命题与假设所谓命题(proposition),我们指的是关于一个概念的特征或多个概念间关系的陈述。比如,“工业化水平很高”就是关于“工业化”这一概念的特征的陈述。而“工业化使得人际关系疏远”则是关于“工业化”概念与“人际关系”概念之间关系的陈述。命题具有不同的类型,如公理、定律、假设、经验概括等等。在社会研究中最常用的命题形式则是假设。16二、研究的基本过程社会调查指的是一种采取自填式问卷或结构式访问的方法,系统地、直接地从一个取自总体的样本那里收集量化资料,并通过对这些资料的统计分析来认识社会现象及其规律的社会研究方式。17具体的研究步骤确定研究课题了解所要研究课题的基本情况:查阅资料、向有经验的人咨询建立研究假设:主要针对解释性研究,探索性和描述性研究一般没有研究假设确立概念和测量方法设计问卷调查实施校核和登录统计分析与命题检验(研究假设)18三、社会调查资料的特点(一)随机性客观现象分为确定性的关系和非确定性的关系对确定性的关系,则存在“若A,则必有B”的确定的函数关系:B=f(A)如,一个正方形的边长是5cm,则其周长是20cm不确定性的关系,则存在“若A,则可能是B,也可能是C;D;E”的关系,现象与现象之间联系的命题也往往是非确定性.比如,我们不能像抽查一滴水而知所有水成分那样,抽查一部分人的情况就知道全体人的情况.因为,社会现象产生的原因是非常复杂的,具有一定的随机性.19(二)具有统计规律性如大多数年轻人都在22-28岁结婚如婴儿的出生性别比保持在103-107之间20四、几个重要的概念变量(1)根据变量取值的性质:定类变量定序变量定距变量定比变量21变量的测量层次史蒂文斯在1951年创立了被广泛采用的测量层次分类法,对社会现象各种不同性质和特征的测量分为四种,定类测量、定序测量、定距测量和定比测量,不同测量层次对应的测量对象则分别称为定类变量、定序变量、定距变量和定比变量。221、定类测量其在本质上是一种分类体系,即将调查对象的不同属性或特征加以区分,变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有等于或不等于的数学特质。如对人们的性别、民族、婚姻状况、职业等的测量就是定类测量的例子。而获得的性别、民族、婚姻状况等的变量则是定类变量。23定类变量实质是一种分类体系,分类既要具有穷尽性,又要具有互斥性。所分的类别是相互排斥、互补交叉重叠,又要对可能的各种情况包罗无遗,每个调查者属于其中的一种情况。24定类变量的两种属性对称性。是指甲对乙的关系也就是乙对甲的关系,如果甲和乙同类,乙一定与甲同类。传递性。指的是如果甲与乙同类,而乙与丙同类,那么甲一定与丙同类。252、定序测量其取值按照某种逻辑顺序将调查对象排列出高低或大小,确定其等级及次序。其取值不仅具有等于不等于的特征,还具有大于或小于的特征。如文化程度、收入水平(高、中、低)、城市规模(特大城市、大城市、中等城市、小城市等等)26除了具有定类测量区分事物类别的特征外,还能反映事物或现象的高低、大小、强弱等等级序列上的差异。其数学特征是大于或小于,因此具备不对称性。传递性关系依然存在。273、定距测量也称为间距测量或区间测量。它不仅能够将社会现象或事物区分出不同的类别、不同的等级,而且可以确定它们相互之间的距离和数量等级差异。如测量人的智商:张三120-李四110=10测量温度:厦门28-南京24=4南京24-济南24=028注意:定距测量所得的值可以为0,但这个0不具备数学中0的含义。如0度,我们不能说没有温度,表示的是一个特定的数字。294、定比测量定比测量除了具有上述3种层次测量的全部性质外,还有一个绝对的0值。因此,它测量得到的数据既能进行加减运算,又能进行乘除运算。如张三的月收入是3000元,李四的月收入是2000元。(1)在分析的时候,即可以说张三的收入高于李四的收入(定序),(2)也可以得到张三的月收入比李四高1000元(定距),(3)还可以说张三的月收入是李四月收入的1.5倍。(定比)30四种测量层次的数学特性定类测量定序测量定距测量定比测量类别区分(=、≠)√√√√次序区分(>、<)√√√距离区分(+、-)√√比例区分(×、÷)√31请判断下列变量属于哪种类型的变量他们的年龄分别是:17,18,22,24,27,29,32….他们是:中年,青年,老年,儿童,青少年,…..他们的月收入分别是:3000,5000,6000,2000,8000,1000,…..他们的收入分别是:1000-2000,2000-3000,3000-4000,……他们的态度分别是:同意,不同意,说不清,同意,不同意,不同意,同意,……32变量之间的关系自变量(independentvariable):引起其他变量变化的变量,通常用x表示因变量(dependentvariable):由于其他变量的变化而导致自身发生变化的变量,通常用y表示.用符号表示就是xy,x是“导致”或“引起”y这和结果的原因。形成两者之间的因果关系33中介变量(interveningvariable):是出现在更复杂一些的因果关系链中的第三个变量,它处于自变量和因变量之间。如“高的受教育程度倾向于低的生育率”中,自变量是“受教育程度”,因变量是“生育率”;“低的生育率导致人口老龄化”中,“生育率”是“人口老龄化”的自变量。自变量中介变量因变量在同一个因果关系链中,中介变量既是相对于自变量来说的因变量,又是相对于因变量来说的自变量。原来两个变量之间的因果关系是通过中介变量而相连34其他主要术语☆总体(Population)所关心的所有元素的集合☆样本(Sample)总体的一部分☆参数(Parameter)总体的数字特征☆统计量(Statistic)样本的概括性测度值总体样本35总体(population):总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位。社会调查中,最常见的总体是由社会中的某些个人所组成的,这些个人就是组成总体的元素。样本:就是从总体中按一定方式抽取出的一部分元素的集合。如2012年教育部全国高校教师思想政治状况滚动调查,在我校抽取教师100人.362012年教育部全国高校教师思想政治状况调查问卷发放表参加问卷调查的党委、党总支参加教师数机关一3机关二3机关三3机关四3后勤处4图书馆3机械学院5交通学院5农工学院5电气学院5计算机学院8化工学院4建工学院4资环学院3材料学院3生命学院3理学院6文学院4外国语学院8法学院4商学院7美术学院2音乐学院2体育学院3合计10037参数值(parameter):也称总体值,它是关于总体中某一变量的综