排名相结合的理念,社会网络分析来检测串通群体网上拍卖世林仁一,易英旅馆中正店一,郑贤宇的A,B,⇑一个国立中央大学,中坜市,桃园,台湾技术,湖口,新竹,台湾b中国大学摘要由于网上拍卖市场的普及,拍卖欺诈已成为普遍现象。通常情况下,骗子将创建多个帐户,然后在这些账户交易获得了较高的评价分数。这是由于匿名性和低费的网上拍卖平台的容易做的。文献综述透露,以往的研究主要集中在检测异常行为评级,但并未提供排名方法来评估骗子有多危险。因此,我们提出了一个过程,可以提供一种方法来检测串通舞弊团体网上拍卖。首先,我们实现一个Web爬行代理来收集真实的拍卖情况,并确定基于一个k-核潜力合谋诈骗集团聚类算法。第二,我们定义一个数据清洗过程以去除不相关的数据。第三,使用页面秩算法来发现基的临界帐户。第四,我们开发了一个秩荷兰国际集团的方法进行拍卖欺诈行为的评价。此方法是标准页秩algo-的延伸rithm并结合网络结构和风险评估的概念。最后,我们进行采用自适应神经模糊推理系统(ANFIS)神经网络和验证实验我们的方法运用到实际拍卖的情况下的表现。总之,我们发现,所提出的排名方法有效地识别潜在的欺诈合谋群体。关键词:排名方法串通组检测网上拍卖?保留2012Elsevier公司所有权利介绍由于网上拍卖市场的普及,拍卖欺诈已成为普遍现象。据一位网络欺诈报告(2003-2009)由互联网犯罪投诉中心(IC3)发行,联邦调查局和国家白领之间的联合行动犯罪中心(NW3C),关于互联网的投诉数量从1400,2001年增加了欺诈每月22,940元不等在2008年2008年1月1日至2008年12月31日,IC3接到共有275284投诉,较增长33.1%,比上年。从1700万美元损失的总金额增加2001年的2.64亿美元在2008年的总损失的美元挂钩在线诈骗2008年2.64亿美元,2500万美元,比2007年对于多种类型的欺诈行为,未交付可销的chandise排名第一(32.9%)。网上拍卖欺诈是第二大报的罪行(25.5%)(IC3,2009)。这些数字表明,在线拍卖欺诈造成的损失显著。这种类型的欺诈行为实际上是由卖家信誉便利排名显示在最流行的在线拍卖网站,如雅虎和eBay。由于这些排名是基于一个简单的反馈机制,拍卖可以采取ano-优势nymity和低网上拍卖费用,以创建多个帐户并通过虚假交易提高他们的等级分数。如此,他们可以欺骗他们很高的评价得分买家。有关研究还表明互联网诈骗的,最严重的情况下,占数百万美元的损失,报告了这些谁被评价反馈(格里格斯2003误导;汉,2003;威尔克和温菲尔德,2003年)。尽管存在这些事实,以往的研究对网上拍卖诈骗集中在已知的异常等级行为的检测拍卖诈骗集团(王&秋月,2008),或专注于类型拍卖欺诈(潘迪特,洲,王和分类Faloutsos,2007)。因此,他们并没有怀疑排名的程度与拍卖组的每个帐户相关联。此外,他们并没有提供一种简单的方式为用户获得相关信息来评估串通群体。因此,我们提出了一个方法,可以提供一个排名方法来评估网上拍卖欺诈合谋群体。首先,我们实现了一个Web爬行代理来收集真实的拍卖情况并确定基于k-核潜力合谋诈骗集团聚类算法。第二,我们定义一个数据清洗过程以除去无关的数据。第三,我们使用页面秩algo-rithm发现组的临界帐户。第四,为拍卖诈骗评价排序方法。此甲OD从标准页面排名算法和扩展的COMbines网络结构和风险评估的概念。最后,我们进行使用自适应神经模糊实验Infer-ENCE系统(ANFIS)神经网络和验证的性能我们的方法运用到实际拍卖情况。综上所述,我们发现,所提出的排序方法是有效的identify-荷兰国际集团的潜在欺诈合谋组。⇑通讯作者为:科技,湖口乡的中国大学,台湾。E-mail地址:sjlin@mgt.ncu.edu.tw(S.-J.林),chyu@cute.edu.tw(C.-H.宇)0957-4174/$-见前面的问题?爱思唯尔2012公司保留所有权利。2.文献综述在本节中,我们调查了相关办法进行在线auc-化欺诈检测,然后检讨社交网络分析这是用来分析的拍卖'相互作用。我们还重新查看页面-排名算法的相关工作,这将是适用于我们的拍卖欺诈排名算法。2.1。欺诈检测网上拍卖据文献报道,欺诈检测的方法可以分为三种方法:统计方法,数据挖掘技术和形式化方法(东,沙茨,徐和,2009a的)。关于统计方法,Rubin等。(2005)亲提出了新的信誉系统拍卖网站,以帮助用户亲通过警告的拍卖欺诈风险的TECT他们自己的利益。该模型使用三个变量(投标平均数,平均最低起拍,以及投标人的配置文件),以确定是否一个账户显示活动的典型抬价的招标(Rubin等,2005年)。其他研究人员还用统计方法来检测骗子(东,沙茨,与徐,2009年b的行为;Trevathan&读,2007年,2009年)。对于数据挖掘技术,潘迪特等。(2007)提出NetProbe方法,该款机型auc-tioneers与他们交易的马尔可夫随机场到德TECT骗子“可疑的模式。它还构建一种信仰传播机制来检测类似的骗子(潘伟迪等人,2007年)。正式符号和逻辑数学中使用rigor-的OU技术规范,开发和验证软件和硬件的设计。徐和程(2007年)和克拉克与永(1996)用正规的方法来检测先令行为。近日,王秋月(2008)利用社会网络分析基于k-核心(SNA)的指标和集中权重算法检测欺诈拍卖群体,因为正常交易不具有复杂的关系。但是,如果串通auc-tioneers是操纵他们的声誉,他们必须有反他们之间的行动。因此,串通拍卖“交易有复杂的关系,并有高在交易结构的核心特征。拍摄struc-通过集中交易商之间的关系角度遴选名单而不是它们的属性值,王秋月用K-核心,中心的权重算法来创建一个协作为基础的市盈率ommendation系统,该系统可以建议串通associ-风险ated与帐户(Wang和邱,2005,2008)。2.2。页面排名算法Web挖掘是数据挖掘技术的应用,以显示封面图案从Web。它也可以推广到三种不同类型:Web使用挖掘,Web内容挖掘,和Web结构挖掘(库利,Mobasher,与塔瓦,1997年,1999年;斯里瓦斯塔瓦库利,德什潘德,与陈,2000年)。Web使用采矿ascertains用户配置文件和用户的行为记录内部网络日志文件。Web内容挖掘的应用数据挖掘技术非结构化或半结构化的数据,通常是HTML文档。Web内容挖掘试图解散涵盖了从Web内容的有用信息。网络结构挖掘分析所述网页的超链接结构来发现关系船舶网页之间。基于该超链接的拓扑结构网络结构挖掘分类网页和重新生成迟来的图案,如相似和之间的关系不同的网站。最近,许多研究人员应用社交网络analy-SIS(SNA)结合谷歌的页面排名算法,超链接诱导主题搜索(HITS)算法,或者其他页面级排名算法来生成用户有用的信息(贾迈利&Abolhassani,2006;Mislove,Gummadi,&Druschel,2006;普霍尔,桑格萨,与德尔加多,2002年)。因此,我们也使用SNA作为帧并结合排名算法来评价的重要性在事务组的帐户。引入引用排名权重的页面浏览量矢量由布林和佩奇(1998年)。的想法介绍网页的概念权限,这是独立的网页内容。迭代基于图形的排名算法提供决定的方式一个顶点的曲线图内决定祁门功夫,功夫和重要性tance网络上的页面。页秩被定义为:PRðuÞ¼D1?DTHñþðXv2BðuÞ珠三角电压VTH=Nvð1Þ其中u是一个网页;d是阻尼因子是usu-盟友设定为0.85;B(U)是一组指向ü页;PR(u)和PR(V)分别是菜单Page和v,秩分数;ñV表示第v的导出链接数量;和c是用于因子正常化。页秩算法指出一个链接到页许多网页具有高页秩收到高排名本身。一流行的网页通常是由其他页面和一个称为重要的网页包含了大量的外链。Further-更多的,串通交易结构符合煤焦页面-排名算法CucumisSativus查阅全文。有很多的帐户在串通组数据被认为是一个重要的AC-计数;如果网页上有连接到它的重要环节,它的出联网页也将成为重要的网页。因此,页面排名algo-rithm可用于发现权威性和重要AC-计数。我们将修改页面排名算法来构建我们拍卖欺诈排名算法查找账户的潜在风险在该组中。2.3。社交网络分析SNA是社会关系之中的一组演员的研究,并参与者可以是个人,组织或社区(Borgatti,2010)。它被广泛应用在社会和行为科学,如以及在政治学,经济学,组织学,和工业工程(加顿,Haythornthwaite,与威尔曼,1999年;威尔曼,1996年)。该网络的观点已经加工水果证明FUL在广泛的社会和行为科学学科(沃瑟曼和浮士德,1994)。一个SNA研究的基本部件是演员或节点和连接或链接(Borgatti,2010)。该节点可以是个人,公司或集体社会单位,和节点链接到彼此通过关系(沃瑟曼&浮士德1994年)。演员师成亚组可能是一个非常重要的AS-面面观社会结构,可帮助解释为什么网络整体上可能出现的行为。子组可以通过确定集团,K-复杂,和K-芯(埃弗雷特,1982年的测量结果;埃弗里特&Borgatti,1998;Hanneman的&里德尔,2005;柳&特尔齐先生,2008;吴,萧,王,何,王和2010年;周沛和2008年)。最强可能是派谁拥有所有可能的行动者给定数量的联系彼此之间存在。一个完整的最大子图就是这样一个分组,扩大到包括尽可能多的参与者尽可能(强招,1996年),如图。1。K-Plex的是放宽严格的假设的另一种方式最大完全子图。K-Plex的允许者可图。1.SNA集团群的例子。是即使他们有联系的所有钾素以外的集团成员件(埃弗里特,1982)。图。如图2所示,子组中所示,其中包括(A,B,C,D),是一种2-plex的基。K-Core是一个最大子图,其中每个节点是相邻至少为K的其他点。它也被认为是一个基本组成plement到密度的测量,这可能无法捕捉许多全球网络(斯科特,2002年)的特点。该MATH-k-核的ematic定义是:设G=(V,L)是一个曲线图。V是顶点组及L是集线(边缘或弧)。我们将表示n个=|V|且m=|L|。一分图ħK=(W,L|W)引起的集合W是k-核或芯k阶当且仅当“V2W:度HD电压VTH=K,和Hk是最大子图形与此属性如图。3,该小组,其中包括(A,B,C,D,E,F),是2核心小组。在以往的研究(王&照,2005年,2008年),第k核心indi-示器被用来揭示一个账户的交易的凝聚力关系以及信誉结构来自于交易记录,因为经常从事帐户将形成可以由第k核心指标被捕获子组。通过使用K-核心指标的,恶意的交易者可以区分从正常帐户。但是,如果我们只用K-核心iDEN的tify凝聚力帐户,它将具有较高的假阴性和假宝sitive结果。如图。3,该小组,其中包括(A,B,C,D,E,F),是2芯子组。我们假设(A,B,C,D,E,G)是串通账户和F是正常的帐户。G的仅用于操纵声誉一次,但它不是2-成员核心群。F是一个正常的帐户,但F有两种键来图。2.SNA2-plex的子群的例子。图。3.SNA2核心群的例子。该2芯子组的成员。因此,F成为成员该2芯子组。如果我们只用K-核心识别串通AC-计数,我们会错误地识别F之类的合谋AC-成员计数和G作为普通帐户。王使用的方法等,高假阴性和假阳性结果将是德源性因为2核心群的许多成员都有可能链路的1芯子组的正常帐户和成员有可能联系到串通账户。为了解决这个上述的问题,还需要其他的指标。此外,王等人的方法不能满足所有真实世界的情况。事实上,2芯小组将经常出现在现实环境中的拍卖,但并非所有的2芯子群是串通基。3.排序方法3.1。拍卖欺诈排名算法在本节中,我们将介绍我们的排名方法,该Auc-化欺诈排名算法。我们修改标准页秩算法来匹配串通结构。拍卖欺诈排名算法是网络结构和潜在风险的组合per-spectives。它更适合用于识别共谋