回顾•已经学习了:–社会网络的典型结构:静态特征–网络中边形成的典型过程:动态特征•接下来学习–网络所处的环境和背景–外在因素对网络结构变化的影响同质性同质性•朋友之间往往有很多共同的特点–种族、观念、年龄、职业、经济情况、兴趣等•柏拉图:相似性带来友谊•亚里斯多德:人们喜欢与自己相似的人•俗语–物以类聚、人以群分–夫妻相詹姆斯-穆迪(2001)美国某镇中学生的社会网络,颜色:种族;从上往下:年级资料来源:教材第55页驱动网络连接形成的因素•共同朋友介绍-内部•同在一所学校上学–外在环境影响-同质性三元闭包的基础•三元闭包:A-B,A-C-》B-C–机会、信任–社会环境:B和C的相似性•大多数连接的出现是多个因素相结合的产物–部分是由于网络中其他节点的影响–部分是受周围环境影响问题:如何判定同质性?同质性是否真实存在?某个网络是否依赖于某个特征而具有同质性?如何定量评估一个社交网络中同质性现象的程度?•给定社交网(只考虑一种特征下两种不同特征值:红,白)•我们能得到的信息–节点数(n),边数(e)–不同颜色节点的占比:p,q=1-p–两端节点相同的边数(s)基于它们,如何讨论同质性现象的程度?•认识:两端节点相同的边越多(占比越高),同质性越明显节点数n=9边数e=18红色节点占比p=1/3白色节点占比q=2/3两端节点相同的边数s=13两端节点不同的边数d=5•认识:两端节点相同的边越多(占比越高),同质性越明显se=?有没有一个基准?多少就算多?用“随机情况”作为基准:给定不同颜色节点的占比(红p和白q),随机情况下,一个节点是红色的概率就是p,白色的概率就是q,那么任何一条边的两节点颜色相同的概率就是p2+q2,也就是两端节点相同边的占比。跨不同类型的节点的概率是2pqppppqqqq–节点数(n),边数(e)–不同颜色节点的占比:p,q=1-p–两端节点相同的边数(s)pqedqpes222n=9e=18p=1/3q=2/3s=13d=5同质性现象在这个社交网中有所表现2pq=8/18d/e=5/18逆同质性•d/e2pq或s/ep^2+q^2问题一此图源于一个真实班级在最初的社交网络,其中有21个节点,27条边。红色代表女生(8名),黑色代表男生(13名)。两端点相同的边有15条。试判断此网络是否显现同质性。问题二•如果某个属性的取值为多个(而非2个),如何计算?同质性背后的机制个体特征•不可变特征–出生地、性别、年龄•可变特征–行为、活动、兴趣、信仰、观念同质性背后的机制•选择(selection)–人们倾向于与相似的人形成友谊–吸毒的找吸毒的•社会影响(socialinfluence)–人们会因为与朋友保持一致而改变自己的(可变)特征–因为朋友吸毒而吸毒?近朱者赤、近墨者黑同质性背后的机制•选择和社会影响相互作用–经常同时存在–在网络快照上很难区分–如何量化?社会学的一个基本问题:因为“羽毛相似”才交往(selection)呢还是因为“同林”后才变得“羽毛相似”(socialinfluence)吸毒团体具有一定的同质性如何对吸毒团体进行干涉?选择和社会影响•方法:利用网络的动态性–改变网络连接,观察个体行为变化–改变个体行为,观察他的网络如何变化•选择和社会影响的分布将影响干预的效果–吸毒群体的控制:具有因选择作用而产生同质性的网络不容易控制同质性研究案例•克里斯塔和福勒:肥胖状态•12000人,32年的肥胖状态数据•肥胖人群和非肥胖人群呈现同质性聚集•为什么?–胖人愿意找胖人(选择)?–潜在的其他特征同质性(选择,比如天气)?–朋友变胖(社会影响)?•肥胖症显示出一种社会影响,“肥胖传染”?总结和思考•某些网络中存在同质性•问题–为什么会存在同质性?–选择和社会影响如何影响社会网络的演化影响网络的背景因素•同质性•节点相似性、节点参与的行为与活动等•这些因素是存在于“网络外”的•如何也通过网络的概念来刻画和分析这些外部因素?方案•构建一种特别的网络•包含人和情景(活动、社会焦点)两类节点归属网络Affiliationnetwork归属网络•二部图(bipartitegraph)爱心社车协李启明周远山人活动实例:董事兼职现象•职业经理人,可能在多家公司的董事会中兼职•分析兼职的结构,以及他们之间的个人关系,对理解公司的行为有帮助AmazonJohnDoerrShirleyTilghmanArtherLevinsonAlGoreSteveJobsAndreaJungSusanHockfieldGoogleAppleDisneyGE资料来源:教材第59页•两个原本不认识的人(李启明、周远山),因为车协而认识,且有了联系,并可能会成为朋友,甚至……•在李启明和周远山之间成为朋友以后,原本不在爱心社的周远山,也有可能加入了爱心社爱心社车协李启明周远山社会网络和归属网络的协同演化社会归属网络社会网络归属网络社会从属网络上的闭包过程•选择爱心社车协李启明周远山社会从属网络上的闭包过程•社会影响爱心社车协李启明周远山•同样是“闭包”,不过,这次是因为人际的关系在先,对另一场所的兴趣在后,受到影响之后,有了兴趣,找到了“归属”,即社会影响(socialinfluence)社会归属网:描述从属关系与社会关系•在现实社会中,选择与影响似乎很难明确区分,实际是交替甚至同时发生的现象,同质性是两种机制共同的后果爱心社车协李启明周远山张月琴张月琴•选择➔社团闭包•影响➔会员闭包社会归属网:三类闭包爱心社车协李启明周远山张月琴王语嫣三元闭包会员闭包社团闭包三种机制–总结•三元闭包–社会网络•选择机制–社团闭包•社会影响–会员闭包思考:如何验证三类闭包的存在?三元闭包的存在性验证•?•22000学生的电邮数据社团闭包的验证•社团闭包–由于参与同一件事情,两个原本没联系的人之间,建立了联系•共同参与的事情越多,建立联系的可能性越高资料来源:教材第64页会员闭包的验证•会员闭包–由于朋友参与某件事情中,原本不在这件事情的另一个一个人也加入了这件事情•参与某件事的朋友越多,其被影响而参与的可能性就越高资料来源:教材第64页资料来源:教材第64页选择与社会影响共同作用的量化朋友间相似的原因?•当看到两个关系不错的人在某些特质上相似相似朋友?朋友相似?如果我们能长期观察一群人,看到他们之间关系的演变,以及他们参与的社会活动…•InProceedingsof14thACMSIGKDD,2008需要一个数据集•反映随时间变化的大规模社会归属网•大规模:人多,社交聚点多•随时间变化:人和人之间,人和社交聚点之间英文维基百科数据:50万人,300万文章利用在线数据研究同质性现象•两个编辑之间相似性的变化与“自然选择”和“社会影响”的关系•没有联系(通信)之前,相似(编辑相同文章)主要因为选择;达到足够相似度时则容易发生联系,然后社会影响开始对相似性提高起作用两人相似性(度)的测量两人都编辑过的文章数相似性=----------总共编辑过的文章数ADCB甲乙相似性、选择与社会影响KDD2008两人认识之前相似性的变化-只有选择的作用两人认识之后相似性的变化-社会影响的作用加进来了图4.13小结•我们展示了一种利用“社会归属网”大数据,剖析同质性现象原因的思路•学习的要点是:从问题,到模型(社会归属网),到数据(维基百科),到映射(数据与问题要素的关系)这样一个过程谢林(Schelling)模型经济学家托马斯·谢林马里兰大学从一个现象开始194019501960芝加哥,黑人在居住区的比例变化图资料来源:MobiusandRosenblat,2001同质性的动态•现象–越来越多的黑人在某个区域聚集•理解–自然属性相同,选择相同–相互认识,相互影响,进而趋同资料来源:MobiusandRosenblat,2001动画制作:邱泽奇种族隔离•蓝色-黑人•黄色:拉美•绿色:亚裔收入隔离•红色:富人•浅蓝色:穷人•深蓝色:中产谢林模型示意•隔离的动态模型(1972)资料来源:教材第68页•节点为代理(居住者)•两类居住者(O,X)•约束条件(阈值)•每一个居住者都要与一定数量(t)的同类为邻•动态•如果一个居住者发现自己的邻居数小于t,他就有兴趣搬家,以满足邻居数谢林模型示意•假设t为3,≥3,就满意•小于3(用*表示),就搬家(最近地)初始后果资料来源:教材第68页谢林模型动态•150×150•X,O=10000•t=3•初始:随机•运行:2次资料来源:教材第69页谢林模型动态•150×150•X,O=10000•t=4•初始:随机•运行:20,150,350,800次资料来源:教材第69页现象•隔离不是个人刻意选择的后果•即使没有人刻意要求隔离的结果,但隔离也会出现•宏观层次上发生的种族隔离、由经济收入产生的隔离或者由其他任何因素产生的隔离,可能并不是由于在微观层次上人们对周围环境的苛刻要求造成的•微观上的动机并不一定等同于宏观上的表现谢林模型中的临界点现象•发端引爆点:当有同类人搬走,就会导致有人跟着搬走。•迁徙引爆点:不同类人搬进来,原来住这里的人就想搬走。小结•以居住隔离为例,谢林模型模拟了同质性的动态变化•如果同质性是一个自然现象,则促进或阻止不同社会情景下的同质性,将会对社会发展产生重要影响总结•同质性•社会归属网–解释同质性机制•谢林模型–刻画同质性的动态模型