王小明SocialNetworkAnalysis社会网分析讲义2内容提要第五讲1整体网研究的内容2整体网的研究方法及相关问题3整体网研究的优缺点和意义整体社会研究概要社会网络分析主要有两大研究领域:个体网研究和整体网研究,当代社会网络统计技术的突破主要是在整体网领域出现的。通过研究个体网,我们对个体网的各方面有了较全面的认识,了解了个体网的类型、规模、同质性、异质性和构成等,就这个意义而言,个体网研究是非常重要的。但是,有时不能不考虑到如下事实,即就一个相对封闭、有明确边界的行动者集合(如一个村落、一个组织、一个犯罪团伙)来说,如果把该集合看成是一个整体,那么该整体本身会表现出一定的结构,这些结构或多或少对其中行动者的行为产生影响。用社会学的术语来说,“社会结构”影响“能动作用”,这是很多社会学家,特别是坚持“结构主义”视角的社会学家所大力倡导的观点。这些问题需要利用“整体网”研究来回答。人生的幸福和精神健康与个体网有密切关系,与整体网络的关系更不可忽视。可惜的是,“个体网”研究一般不考察这一点。下面探讨整体网研究,主要包括整个网络的结构,整体网络的密度,研究方法和整体网研究的意义。整体网研究概要第五讲整体网研究的内容一、整体网的分类个体网关注的是“自我”,整体网关注的是整体网络的结构,在二者之间还存在一种中间网络,可视为局域网。如果把这些网络结合在一起,并且根据不同的标准,那么“关系网络”可以分为多种类型。1)根据“规模”来划分,有二方组、初级群体、2-步局域网等依此类推。2)根据“行动者”类别进行分类,有人际关系网、组织关系网、城市网、村落网和国际关系网等多种类型。我们主要探讨1-模关系整体网研究的内容。3)根据行动者间的关系内涵来分,有各种类型。如,就国际关系的具体内容来分,有国际贸易网、国际政治关系网等;就企业关系网来说,有财务同盟网、战略联盟网等,企业内部的员工之间有情感关系网、咨询关系网、情报关系网和信任关系网等;另外,“隶属关系网”也可看成是整体网。目前,整体网研究特别是1-模网络研究取得很大进展,近三十多年在统计方法上有重要突破。这些研究加深了对整体网络结构的认识。第五讲整体网研究的内容二、整体网络的构成和规模1.整体网的构成在整体网中,也要研究网络成员的构成,研究方法类似于对个体网络构成的研究。如:我们可以分析在整体网络中的每个行动者的个体网络成员由哪些行动者构成,研究方法完全等同于个体网络成员构成的研究。不再赘述。除此之外,我们还可以按照某种关系来分析另外一类整体网络的构成。例如,在研究“公司内部成员之间的建议关系网”的时候,研究者可以根据自己感兴趣的项目对网络的“构成”进行分析。如果根据“上下级关系”来分类,可以分析在“建议关系网”中,存在多少“同级别职员之间的建议关系”,“不同级别职员之间的建议关系”等。实际上,这种分析类似于在“二方组”研究中所分析的那样,研究整个网络是由多少个“互惠对”、“不对称对”和“虚无对”构成的。我们也可以研究三方组的16个同构类在整个网络中有哪些表现,这也是对整体网络构成的研究。实际上,关于整体网的各种结构的研究都属于“网络构成研究”的范畴,我们将在本节第五部分加以介绍。显然,这种研究就完全不同于个体网的构成研究。第五讲整体网研究的内容二、整体网络的构成和规模2.整体网的规模•整体网的规模指的是网络中包含的全部行动者的数目。某个行动者的个体网的规模往往需要调查才能有所了解。而整体网络的规模往往是研究者事先有所了解的。例如,如果研究一个企业内部员工之间的“建议关系网”,那么该企业内部的全体员工总数就是该整体网的规模。如果研究N个国家之间的“贸易关系”,该网络的规模就是N。显然,整体网规模的含义不同于个体网规模的概念,因为在计算个体网规模的时候,一般不包括“自我”,而整体网的规模要包含其中的所有行动者。•一般情况下,整体网的规模越大,其结构越复杂,分派现象越普遍,派系、n-派系、k-丛等也往往越多,这种结构对社会行动者的影响可能越大。在当代的整体网络研究中,一般情况下分析的网络规模不会超过1000。实际上,有时候研究大量(如超过1000)行动者之间的整体网络也没什么实际意义,例如,研究一个城市社区内部几千人之间的关系网络,这种研究可能没有太大的学术意义,也没有什么实践价值。研究者往往对具有较大社会学意义的相对封闭的整体进行研究,而这种整体的规模一般不大。第五讲整体网研究的内容三、整体网的密度整体网密度的计算与个体网密度的计算略有不同:如果整体网是无向关系网,其中有n个行动者,那么其中包含的关系总数在理论上的最大可能值是n(n-1)/2。如果该网络中包含的实际关系数目为m,那么该网络的密度就是“实际关系数”除以“理论上的最大关系数”,即等于m/(n(n-1)/2)=2m/(n(n-1))。如果整体网是有向关系网,并且其中有n个行动者,那么其中包含的关系总数在理论上的最大可能值是n(n-1)。该网络的密度因而等于m/(n(n-1))。总的来说,整体网的密度越大,该网络对其中行动者的态度、行为等产生的影响可能越大。联系紧密的整体网络不仅为其中的个体提供各种社会资源,同时也成为限制其发展的重要力量。关于这一点,当代整体网研究技术已经能够检验此类命题的统计显著性。第五讲整体网研究的内容3四、整体网成员之间的距离在整体网络中,两点之间的距离是二者之间在图论或者矩阵意义上的最短途径的长度,与个体网研究中的“距离”概念不同。实际上,在利用UCINET软件计算一个整体网的各个成员之间距离的时候,需要计算出整体网所对应的矩阵中所有点之间的“距离矩阵”或者一般化的距离矩阵,同时也允许把“距离矩阵”转变为“接近矩阵”。所谓两个点之间的“一般化的距离”指的是这两个点之间的一个最优途径的长度。两个点之间可能存在多条途径。问题是,什么样的途径是最优的途径?有三种标准:费用最小、强度最大和概率三种类型。1.一个最优途径是费用最小的途径;而一个途径的“费用”是该途径上的所有边值(赋值)之和。即在两个点之间的多条途径中,费用最小者为最优途径。2.一条途径的“强度”(strength)指的是该途径中的最弱一条线的强度。最优的方法是采用强度最强的途径。3.一条途径的概率是其各条边的概率(probability)之积,最优途径是“最可能出现的途径”。第五讲整体网研究的内容3五、整体网的结构研究“结构”一词的含义是非常广泛的。广义地说,第二部分探讨了整体网的构成,是“纵向”地对网络的结构进行分析。对三方关系、凝聚子群的研究等也都是一种整体网的结构研究。我们认为,如果深入到整体网络的每一种“构成”,从“横向”进行分析,探讨关系网络的内部构成,得到的将是对整体网络“深层次结构”的认识。这种研究是个体网研究所做不到的。整体网的结构是深层次的,可分为多种结构类型。我们可以结合“关系变量”来探讨这个问题,因为与不同结构对应的关系变量也是不同层次的。在讨论之前,首先区分“属性数据”和“关系数据”两种数据类型。关于行动者自身拥有的性质(如身高、体重、年产值、GNP等)的数据可以叫做“属性数据”,与之对应的变量叫做“属性变量”;与之类似,与关系有关的变量可以称为“关系变量”或者“网络变量”。常规统计学、社会统计学可用来分析属性数据和变量,而社会网络分析则尤其适用于分析关系数据及网络变量。第五讲整体网研究的内容3五、整体网的结构研究1.属性变量和网络变量属性变量是指行动者(个人\企业\国家等)本身独有的变量(性别\年龄\收入\GDP\师生比等),称为属性变量,相应的分析单位是相对独立的“点”。与之对应,网络变量指的是与整体网络的结构性质对应的变量。它至少可以包括如下5类:(1)个体层次网络变量;(2)二方关系网络变量;(3)三方关系网络变量;(4)子群层次的块网络变量;(5)整体网络变量。通过研究网络变量,可以更深入地分析社会行动者之间的社会结构。这是利用其他统计分析方法所做不到的,也是仅仅分析各种“属性资料”所不能得到的。对“关系数据”进行整体结构分析很重要,这是因为关系既影响网络成员的行为,也影响行动者系统的行为;另外,关系数据不能还原到属性数据。例如,关系处得好的人之间可以多提供帮助;在正式群体中的“高度凝聚力”状态也会影响群体成员的各方面行为。这是仅仅利用属性资料所不能解释的。既然存在关系,则至少涉及到两个行动者,因此,“关系”不是任何一个行动者自己拥有的属性,而是至少两个行动者共同拥有的属性。正是在这个意义上,我们说关系数据是不能还原到属性数据的,“关系”是一类独特的分析单位。作为分析单位的“点”和“关系”是不同的。第五讲整体网研究的内容3对属性变量和网络变量、“点”和“关系”的分析如表2-1所示。第五讲整体网研究的内容32.整体网络结构研究的内容(1-10)整体网络结构研究可以分为至少如下10种类型:(1)中心性分析——权力的量化研究在什么意义上说一个“行动者”或“子群体”有权力?在社会网络中我们是通过研究“点”或“群体”的“中心度”和网络的“中心势”指数探讨这个问题。内容包括:如何研究行动者个体的“中心度”和整体网络的“中心势指数”。(2)二方关系研究社会网络意义上的“二方关系研究”主要是“定量”研究。就“量化研究”来说,要研究的问题有,在一个社会网络中,“互惠关系”出现的频次多大,在统计上是否显著?“虚无关系”、“不对称关系”等出现的频次是多少?在统计上是否显著?所有这种研究都与“二方谱”有关系。就“质的研究”来说,要研究的问题可能有,二方关系的表现(竞争、合作,还是互不干扰?)、二方关系的演变过程及机制是什么?结合具体的二方关系(如夫妻关系、朋友关系、上下级关系、两个国家之间的关系等)来说,二方关系表现出怎样的特点?这些问题既可以进行定量分析,也可以进行定性探讨。第五讲整体网研究的内容3(3)三方关系研究与“二方关系”类似,对“三方关系研究”也可“定量”研究和“定性”分析。就定量研究来说,需要探讨的问题主要有,在一个社会网络中,“三方关系”有哪些的表现?“三方关系”的16个同构类(即三方谱)分别发生多少次?在统计上是否显著?另外,对某种三方关系命题进行统计检验也属于定量的研究。就定性研究来说,三方关系要研究的问题有,“三方关系”中的行动者如何拉关系,如何形成“二打一”的局面?根据社会行动者权力分布的不同,三方关系有哪些表现,三方关系未来的走向是什么。三方关系中的冲突和合作,“二对一”理论研究等也是三方关系研究的内容。(4)小群体的量化研究——块模型分析块模型(blockmodel)关注总体的网络结构,在理论和实践上都具有重要意义。在块模型研究中涉及到的内容有:“块模型”的几种定义,构建块模型的两种方法:Concor以及层次聚类方法,如何解释块模型分析的结果等。块模型研究的目的是为了找到在总体网络中存在的“子群体”。第五讲整体网研究的内容3(5)凝聚力的量化研究——凝聚子群分析“社会团结”、“社会凝聚力”乃是社会学经典研究的核心之一。如何定量研究“社会团结”?一个社会的“团结”依靠什么维持?我们通过研究各种凝聚子群探讨这个问题,这就需要分析凝聚子群。研究的内容包括:凝聚子群研究的渊源;凝聚子群的几种类型(派系、n-派系、n-宗派、k-丛、k-核等),这些子群之间的关系;探讨复杂网络中的各种凝聚子群研究;分析现实网络数据中存在的凝聚子群;这种研究有助于揭示现实生活中存在的“人浮于事”、“效率低下”的原因,并提出对策。(6)多个行动者之间的对等性分析“位置”和“角色”是“关系性”概念。通过对关系数据的分析来探讨行动者的位置和角色。通过对行动者所处的“位置”和“角色”进行结构性的考察,可以分析个体在社会网中的重要性。包括:“结构对等性”分析;“自同构对等性”分析和“规则对等性”分析。结构对等性研究的目的是为了找到在结构上对等的点集合,从而对整体网有更细的认识,也有助于对日常生活中常见的“角色”这个概念进行深入的量化认识。第五讲整体网研究的内容3(7)“中心-半边缘-边缘”结构分析关于“