第五届全国搜索引擎与网络信息挖掘会议(SEWM2007)程序册主办单位:中国计算机学会互联网专业委员会承办单位:海南大学海南海口2007年3月9-11日前言第五届全国搜索引擎与网络信息挖掘会议(SEWM2007)于2007年3月9日—11日在海南海口召开。本届会议由中国计算机学会互联网专业委员会主办,海南大学承办,雅虎公司协办。作为国内信息检索领域最主要的学术活动,SEWM2007受到了众多学者的积极支持和参与。经过大家的共同努力和辛勤工作,本届会议共收到论文稿件570篇,创造了SEWM征文数量的历史纪录。本届会议共录用论文250篇,录用率约43%。本届会议收到的论文稿件覆盖了全国大部分省区。录用的论文基本反映了我国SEWM跟踪国际前沿,为国民经济服务的研究成果。丰硕的研究成果表明我国在该研究领域的蓬勃发展和研究水平的进一步提高。在会议论文出版之际,我们谨向所有的投稿者、与会代表、论文评审专家以及所有为SEWM2007付出辛勤劳动的人们,表示衷心的感谢。特别感谢《JournalofComputationalInformationSystems》、《广西师范大学学报》和《郑州大学学报》编辑部对本届会议论文的出版所做的努力和辛勤工作。感谢雅虎公司等单位对SEWM2007的支持和赞助。我们有幸请到北京大学的李晓明教授、清华大学马少平教授、香港城市大学祝建华教授和雅虎公司的孙国政博士等几位著名专家做特邀大会报告,在此对他们表示衷心感谢!尊敬的专家、代表,我国信息检索领域的研究要走向国际,还需要对所面临的关键性、挑战性问题进行艰难的探索,还需要不断加大研究的力度和深度,让我们共同努力,使我国在搜索引擎与网络信息挖掘领域的研究迈向世界,更创辉煌!预祝大会圆满成功!SEWM2007程序委员会、组织委员会2007年3月9日会议组织机构会议主席:李晓明(北京大学)康耀红(海南大学)程序委员会主席:马军(山东大学)马少平(清华大学)董守斌(华南理工大学)程序委员会委员:程学旗(中科院计算所)黄萱箐(复旦大学)马严(北京邮电大学)丁伟(东南大学)汪文勇(电子科技大学)王继民(北京大学)雷景生(海南大学)钟声(海南大学)王明文(江西师范大学)周水庚(复旦大学)袁方(河北大学)宋自林(解放军理工大学)吴扬扬(华侨大学)林坤辉(厦门大学)吕学强(北京信息工程大学)袁华(华南理工大学)阎宏飞(北京大学)彭波(北京大学)陈茂科(清华大学)令锋(肇庆学院)顾兆军(中国民航大学)李太君(海南大学)组织委员会主席:雷景生孙盛杰组织委员会委员:任一凡卢春燕刘文进伍庆清唐英靳婷谭毓银李颖娟会议程序3月9日(全天报到)18:00晚餐3月10日(上午开幕式、大会报告,下午分组报告)7:00–8:00早餐8:10–9:00开幕式,李晓明教授主持:1.会议主席,海南大学副校长康耀红教授致辞,宣布会议开幕2.组织委员会主席雷景生教授介绍会议组织情况3.与会代表合影9:00–10:20大会报告I康耀红教授主持9:00–9:40祝建华教授(香港城市大学):搜索引擎在社会科学研究中的应用前景9:40–10:20孙国政博士(Yahoo!Inc):Multi-TaskLearningandWebSearchRanking10:20–10:30茶歇10:30–11:50大会报告II李晓明教授主持10:30–11:10马少平教授(清华大学):从SIGIR看信息检索技术的过去与未来11:10–11:50李晓明教授(北京大学):WebInfoMall:Past,Present,andtheFuture12:00–14:00午餐14:00–15:40分组A1分组B1分组C1分组D1每组各8篇论文,每篇10分钟15:40-16:00茶歇16:00–17:40分组A2分组B2分组C2分组D2每组各8篇论文,每篇10分钟18:00晚宴3月11日(上午分组报告,下午评测报告、闭幕式)7:00–8:00早餐8:00–9:40分组A3分组B3分组C3分组D3每组各8篇论文,各10分钟9:40-10:00茶歇10:00–11:40分组A4分组B4分组C4分组D4每组各8篇论文,各10分钟12:00–14:00午餐14:00–17:20评测报告(主持人:董守斌教授、彭波博士)17:20–18:00闭幕式,马少平教授主持:1.颁发学生优秀论文奖;2.李晓明教授总结发言;3.宣布下届会议地点和承办单位,承办单位代表简要介绍情况。18:00晚餐注:12日参加旅游的代表,上午7:30吃早餐,8:00出发,14日18:00前返回海口。如果14日晚上乘飞机返回的代表,在返回海口时可集中到一个车上,直接送往海口美兰机场。其他代表可继续住宿丽华大酒店。分组报告安排A1:文本与图像信息的索引与检索(Ⅰ)(主持人:马军教授山东大学)1.ExploitingClickThroughDatatoImproveWebSearchRanking报告人:郑朝晖(雅虎公司)2.E0063:Anovelimageretrievalusingcolorquantizationandindexhistogram报告人:汪华章(四川大学)3.E0306:TextureimageretrievalusingbiorthogonalMultiwaveletFilters报告人:洪日昌(中国科学技术大学)4.E0311:Anovelmethodtolearnregionweightingfromrelevancefeedbackinimageretrieval报告人:葛永(中国科学技术大学)5.E0310:medicalimageretrievalbasedonFCMusingfeaturefusion报告人:宋卫华(宁波大学)6.一个面向互联网的基于内容的图像搜索系统——VAST报告人:陶文兵(华中科技大学)7.C0137:一种基于度量距离学习的图像检索方法报告人:罗辛(日本德岛大学)8.E0200:WebTopicTextExtractionBasedonDocumentFeatures报告人:肖治民(厦门大学)A2:文本与图像信息的索引与检索(Ⅱ)(主持人:马少平教授清华大学)1.C0156:一种基于区域模糊特征的图像检索方法报告人:唐敏(湖南工业大学)2.C0145:基于语义的图像搜索报告人:屈志毅(兰州大学)3.C0139:基于XML索引动态分组的P2P信息检索机制报告人:蒙应杰(兰州大学)4.C0088:企业与局域网内部信息检索方法概述报告人:富羽鹏(清华大学)5.C0062:多Agent技术在信息检索中的应用报告人:李燕(潍坊学院)6.C0138:基于关键词提取的娱乐新闻文档去重算法报告人:沙芸(北京石油化工学院)7.C0063:一个面向搜索引擎的文本相似性算法报告人:钱丽萍(北京建筑工程学院)8.E0266:ResearchonAuto-MiningofChineseNewWords报告人:吕学强(北京信息工程学院)A3:搜索引擎设计(主持人:董守斌教授华南理工大学)1.C0174:面向专题的智能化中文搜索引擎报告人:梁循(北京大学)2.E0135:iRank:ApowerfultoolforPersonalizedSearchinInterests-OrientedSubnet报告人:邱源枞(四川大学)3.E0150:BestBiblio:AnEffectiveWebBibliographyRetrievalTool报告人:王大玲(东北大学)4.E0276:SIRM-O:SemanticInformationRetrievalModelBasedonOntology报告人:林培光(山东财政学院)5.E0040:ANewAlgorithmfortheWebCrawler报告人:康丽(中国农业大学)6.C0106:一种瘦服务器--胖客户分布式搜索引擎的设计报告人:陶跃华(云南师范大学)7.C0151:基于用户群的智能主题爬虫报告人:陈晓云(兰州大学)8.E0190:ANovelDocumentSimilarityMeasurebasedonNamedEntity报告人:荚济民(中国科学技术大学)A4:智能问题回答系统(主持人:林坤辉教授厦门大学)1.E0114:AnswerExtractingBasedonPatternLearningandPatternMatchinginChineseQuestionAnsweringSystem报告人:余正涛(昆明理工大学)2.E0138:ChineseQusetionClassificationBasedonHowNet报告人:贾可亮(北京理工大学)3.E0191:CHINESEQUESTIONCLASSIFICATIONBASEDONDEPENDENCYRELATIONSHIPANDSVMs报告人:林旭东(华南理工大学)4.E0258:AnAnswerFusion-basedinterfaceinQuestionAnsweringsystem报告人:唐素勤(广西师范大学)5.E0299:InsunTourQA:ARestricted-DomainQuestionAnsweringSystem报告人:孙承杰(哈尔滨工业大学)6.E0284:Anonlinecommunitythreadsimilaritymeasurementalgorithmbasedonauthoranalysis报告人:吴磊(南京大学)7.E0333:TheFrameandImplementationofEMCDiagnosisExpertSystem报告人:陈静(重庆大学)8.E0185:EstateSpider:AnInformationSystemTowardsAsymmetryandOpacityinRealEstate报告人:陈良育(华东师范大学)B1:Web挖掘(Ⅰ)(主持人:王继民教授北京大学)1.E0334:ExpectedLocationforTargetWebPagesBasedOnWeb-LogMining报告人:郭平(重庆大学)2.E0336:EfficientEntityRelationDiscoveryonWeb报告人:何靖(北京大学):3.E0270:vision-baseddeepwebresultschemaautomaticextraction报告人:仲华(苏州大学)4.E0251:AutomaticHierarchicalClusterofStructuredDeepWebbyQueryProbing报告人:赵朋朋(苏州大学)5.E0250:Vision-basedDeepWebQueryInterfacesAutomaticExtraction报告人:崔志明(苏州大学)6.E0221:AnEnhancedAlgorithmforWebProcessMining报告人:葛季栋(南京大学)7.E0038:CombinationofFolksonomyandSupportVectorMachinesforChineseWeblogpagesClassification报告人:白如江(山东理工大学)8.E0092:Web2MMS:AdaptingWebContentstoMMS报告人:汪立东(北京建筑工程学院)B2:Web挖掘(Ⅱ)(主持人:王明文教授江西师范大学)1.E0108:Process-orientedDynamiccompositionofwebservicesinIPVita报告人:张立群(山东大学)2.E0147:ResearchofBoosting-basedontextclassificationprecision报告人:周屹(黑龙江工程学院)3.E0160:AFastHashPacketClassificationAlgorithm报告人:尚凤军(重庆邮电大学)4.E0181:AnImprovedWebDocumentsClusteringMet