基于语义网格的语义关联存储模型及管理和通信平台金海集群与网格计算湖北省重点实验室华中科技大学2汇报提纲•2005年研究进展情况–语义网格存储概念结构–主要研究内容和进展–论文发表情况•基于语义网的语义关联存储管理平台开发进展•应用系统介绍–SemreX:文献元数据信息共享应用•总结3语义网格存储概念结构网格语义概念层网格资源层网格语义关联存储层底层数据网格存储层基于语义的自组织语义网格拓扑结构高效语义信息搜索网格数据存储基于本体的网格语义信息提取本体的半自动定义本体更新和映射42005年主要研究内容•语义关联存储模型研究–基于语义的存储及语义关联存储–本体的半自动定义–基于本体的信息提取–语义相似度•基于主动存储的语义网格计算模型–基于语义相似度的语义网格自组织拓扑结构–基于语义的高效网格资源搜索机制–基于语义的网格资源自主探测和更新5基于语义的数据存储•基于语义网技术的数据存储趋势(OntoWeb)–对RDF/S支持远多于对标准本体语(DAML+OIL)的支持–大多数的查询语言是基于三元组的–大多数工具基于关系技术(对象或者关系数据库)来存储数据•目前存在的主要问题–工具不成熟–缺乏可扩展性–查全、查准等性能指标不高6语义关联存储•语义关联–语义相似度及语义相关度•分布–利用网格和对等网技术来增强语义存储的可扩展性•Edutella实现了基于p2p的RDF元数据网络(’02)–结合传统的数据库索引机制如B+树,来索引分布数据库,优化分布架构7语义关联存储所涉及的技术•本体定义•信息提取•信息分类•语义相似度及语义相关度8本体的自动及半自动定义•网格中存在大量异构的元数据可采用本体方法表示和存储•人工定义本体开销非常大,要求能自动或人工辅助半自动定义本体•运用机器学习、数据挖掘等技术创建新本体,使本体具有自学习功能9定义本体的方法•自顶向下–人工构建上层本体–运用机器学习、数据挖掘等技术创建新的概念–比较语义相似度并检测概念冲突,构建新本体•自底向上–对于大量的元数据采用核心本体表示–合并核心本体并形成上层本体10基于本体的信息提取•信息提取–信息从无结构到有结构–从自然语言到机器可识别•传统的信息提取技术–基于规则的方法:模式匹配、模板库–机器学习的方法:HMM、SVM等–弊端:缺乏对提取出的实体之间联系的领域知识的识别能力•本体提供机器可识别的领域概念知识及其联系11基于本体的信息提取•广域网中文档数据信息的一致性•信息抽取的特异性•实体以及实体间联系的自动识别12智能搜索引擎基于本体的信息抽取信息抽取工具知识库知识库知识库P2P无结构、半结构化的文档Ontology面向任务的本体…13基于本体的资源分类•资源分类结合知识管理、数据挖掘、机器学习以及信息检索等方面技术•研究方法–对网格数据提取语义特征向量,运用数据挖掘、信息检索中潜在语义索引(LSI)等技术–根据语义特征向量对数据进行基于本体的分类,结合kNN、支持向量机、贝叶斯概率等分类方法14本体的自动定义和资源分类本体自学习异构资源本体设计和编辑本体冲突检测分类系统特征提取基于本体的资源数据库具有自学习功能的本体基于本体的资源数据库本体15语义相似度•存储结点之间的相似度–定义对象的语义相似度–网格存储结点之间的相似度–Query语句和网格存储结点之间的语义相似度16存储结点之间的相似度||||121112(,)[(,)()]jPiPijijjiSimPPSimTTGridNodeA...............GridNodeB...............17语义Query语句和存储结点之间的语义相似度(,)max(,)iQQTPSimTPSimTTiiPaperAuthorSemreX:Paper2005ACMTopic/Software/Operating_Systemsrdf:typeSemreX:isAboutSemreX:YearSemreX:authorSELECTAuthor,PaperFROM{Paper}rdf:type{SemreX:Paper};SemreX:Topic{acm:ACMTopic/Software/Operating_Systems};SemreX:Year{“2005”};SemreX:author{Author}USINGNAMESPACESemreX==基于语义相似度的语义网格自组织结构•基于存储结点语义相似度的网格存储结点自组织结构•基于语义相似度的网格资源高效信息搜索机制19基于相似度的自组织存储结构20基于语义的网格结点资源的主动存储•网格中基于语义的主动存储–代理主动发现、监控和管理本地资源的状况,更新本地语义知识库中的内容–代理将语义知识库更新广告发送给邻居结点,主动更新路由信息212005年论文发表情况-期刊文章(1)•HaiJin,XuanhuaShi,WeizhongQiang,andDeqingZou,“DRIC:DependableGridComputingFramework”,IEICETransactionsonInformationandSystems,2006•HaiJin,XuanhuaShi,WeizhongQiang,andDeqingZou,“AnAdaptiveMeta-SchedulerforData-IntensiveApplications”,InternationalJournalofGridandUtilityComputing,Vol.1,No.1,2005,pp.32-37•HaiJin,WeizhongQiang,XuanhuaShi,andDeqingZou,“RB-GACA:ARBACbasedGridAccessControlArchitecture”,InternationalJournalofGridandUtilityComputing,Vol.1,No.1,2005,pp.61-70222005年论文发表情况-期刊文章(2)•金海,陈汉华,宁小敏,袁平鹏,武浩,郭志鑫,“SemreX系统中一种基于语义相似度的Peer-to-Peer拓扑及路由算法”,《软件学报》,2006•郭志鑫,金海,陈汉华,“SemreX中基于语义的文档参考文献元数据信息提取”,《计算机研究与发展》,2006•金海,陈汉华,吕志朋,宁小敏,“CGSP作业管理器的合成服务的QoS优化模型及求解”,《计算机学报》,2005年,第28卷,第4期,pp.578-588•金海,武浩,李运发,陈汉华,“OntoSLAt:基于本体构建的SLA模板知识库”,《小型微型计算机系统》,2005232005年论文发表情况-会议文章(1)•YijiaoYuandHaiJin,“BuildingaSemanticP2PScientificReferencesSharingSystemwithJXTA”,APWeb’06•HaiJin,HaoWu,YunfaLi,andHanhuaChen,“AnApproachforServiceDiscoverybasedonSemanticPeer-to-Peer”,ASIAN’05•HaiJin,XiaomingNing,HanhuaChen,andZuoningYin,“EfficientQueryRoutinginSemanticOverlaysBasedonLatentSemanticIndexing”,SKG’05•YijiaoYuandHaiJin,AnOntology-basedHostResourcesMonitoringApproachinGridEnvironment”,WAIM’05242005年论文发表情况-会议文章(2)•HongboZou,ZongfenHan,HaiJin,JingTieandXuanhuaShi,“AVirtual-Service-DomainBasedBiddingAlgorithmforResourceDiscoveryinComputationalGrid”,WI’05•HaiJinandHaoWu,“Semantic-basedSpecificationforWebServiceAgreement”,NGWSP'05•XuanhuaShi,HaiJin,ZongfenHan,WeizhongQiang,SongWu,DeqingZou,“ALTER:AdaptiveFailureDetectionServicesforGrids”,SCC’05•HaiJin,HanhuaChen,ZhipengLuandXiaomingNing,Q-SAC:TowardQoSOptimizedServiceAutomaticComposition,CCGrid’05•HanhuaChen,HaiJin,FengMao,andHaoWu,“Q-GSM:QoSOrientedGridServiceManagement”,APWeb’0525基于语义的语义关联存储管理平台开发进展26软件系统结构本地网格资源本体数据库元数据库结点控制器语义关联存储路由器语义关联计算本地元数据获取元数据自动抽取本地资源逻辑映射用户界面编程接口结点语义信息存储管理本体管理元数据管理语义关联路由表数据网格接口网格数据传输文件接口语义关联存储拓扑网格结点27应用系统-文献元数据共享28应用系统-文献元数据共享•基于语义的文献元数据提取–在线文档的获取–在给定的领域本体下,提取有效信息•基于语义的文献元数据关联存储–将文献元数据基于语义相似度存储在知识库中•基于语义的路由信息发布•基于语义的文献搜索•……29总结•2005年研究内容基本完成–语义关联存储研究–基于主动存储的语义网格计算模型–发表/录用论文16篇•基于语义网的语义关联存储管理平台开发(开发ing)•中期检查应用系统框架基本完成–SemreX:文献元数据信息共享应用30谢谢!欢迎多提宝贵意见!