CALIS资源整合与服务模式——云计算等新技术下的探索王文清CALIS管理中心2009年12月22日扬州2提纲•概述•社会网络接口标准OpenSocial•关联数据和OAI-ORE•云计算•CALIS整合服务模式云平台、Gadget平台3IT技术的发展3 主机时代 C/S时代 SOA Web 2.0 IaaS 云计算 网格计算 SaaS 语义网 PaaS 网络时代 4理解整合共享•从内容角度:索引、元数据文档、对象社会化数据(评论、评价、tags等)专用模式的数据关联标准化的数据关联本馆创建数据支持用户创建数据•从应用系统角度单个大系统(系统瘦身)单项功能优势的系统/组件群专用组件(难以共享)通用组件(跨平台共享)5理解整合共享(续)•从服务角度服务接口整合服务流程整合简单页面整合深度服务整合在本地整合在用户端整合本馆自行整合用户参与整合•从人的角度个人信息整合社会关系信息整合社会活动信息整合6整合模式的变化•服务整合——基于云计算•数据整合——基于关联数据/语义网•社会关系整合——基于SNS,跨平台(OpenScial)•服务模块整合——服务器端标准化组件整合(OSGi)+客户端组件整合(Gadget/Widget)7社会网络接口标准8新一代门户和社会网络技术•OpenSocial:2007年11月Google推出了OpenSocial开放平台2008年9月Google成立了OpenSocial基金会2009年6月发布V0.9•OpenSocial目标:OpenSocial为社交网络提供了一组通用应用程序接口(APIs)。它可以方便企业搭建社交网络或者相关程序,让更多的应用程序可以被更多的用户访问。开发人员只需使用JavaScript、html和XML就能创建应用程序,无需使用专用开发语言。9OpenSocial的主要部分•Container:平台容器指支持OpenSocial的社区平台/网站。暴露OpenSocialAPI,提供JS、REST调用•Gadget:小工具/小应用可以运行在各种支持OpenSocial的社区平台上,提供社交、检索、游戏等各种应用。10OpenSocialGadget的特点•Gadgets是一种易于开发的软件组件构成:XML文件+HTML+JavaScript+CSS在xml文件中定义展示的html及JavaScript代码xml文件由Gadget容器转化为html页面呈现给用户•Gadgets可以是:一个简单的widget一个可复用的组件一个完整的应用•Gadgets可以被嵌入到单独的web页面、web应用、社区网站其他Gadgets•Gadgets能与其他Gadgets通信,能实现整合11Gadgets示例12OpenSocialv0.9技术组成OpenSocial 规范 客户端 API 服务器端API Content Definition 13OpenSocialv0.9的内容•OpenSocailAPIv0.9定义了在容器上下文中访问与用户以及朋友关系相关信息的方法•Gadgets规范v0.9GadgetsXML格式规范+GadgetsJavaScriptAPI•OpenSocialMarkupLanguageTags规范v0.9容器支持的公共标签集合14OpenSocialv0.9的内容(续)•OpenSocial模板规范v0.9支持创建模板,方便HTML重用。•OpenSocialRESTful协议规范v0.9基于REST的通信协议•OpenSocialRPC协议规范v0.9基于JSON的通信协议15OpenSocial平台的核心•提供社区应用所需的数据:用户信息UserData好友信息Friends(社交关系)活动事件Activities(可订阅)——“人、物、交互”是社会网络SNS的关键•各个小应用gadget:可以分享上述核心信息,通过利用上述信息为用户提供更好的用户体验16OpenSocial带来的好处•对开发者仅需学习一次API,即可在所有OpenSocial社区网站上开发和部署应用代码维护代价大大降低•对社区网站任何网站都可以实现OpenSocial即使是新网站,也能马上就有很多可用的应用能让更多第三方开发者为其提供更好的应用•对用户能享受到更丰富多彩的社交应用所带来的全新体验使用多个社交网站时,无需处处手动维护个人相关信息(个人资料、好友列表、个人偏好等)用户自己能将内容和服务重新整合到他们自己的环境中。17OpenSocial为图书馆带来的启发•图书馆逐渐成为专业化的SNS•图书馆需要做的:以标准化方式开放自己的服务(API)让更多读者来参与应用gadget的创建、整合和分享,从而提高用户的体验自己开发应用,并使自己的服务能嵌入到用户所在的外部平台中——使得本馆的服务无处不在图书馆之间,可以共享上述各类小应用18关联数据、语义网与OAI-ORE19关联数据W3CLinkingData•SIOC-Semantically-InterlinkedOnlineCommunitiesSIOC提供一种标准化方法,在社区中表示信息•W3CMemberSubmission–June2007SIOCCoreOntologySpecificationSIOCOntology:ApplicationsandImplementationStatusSIOCOntology:RelatedOntologiesandRDFVocabularies•一种URI规范,使人们通过HTTP/URI机制,直接获得资源(Thing,用RDF描述)•建立数据源、信息、知识和资源之间的关联关系•用于构建DataWeb20SIOC、FOAF和SKOS的结合•SKOS(SimpleKnowledgeOrganisationSystem)能表示受控词表等内容SIOC与SKOS结合,能用于链接标签Tags和分类,能用SKOS概念来定义任何内容的主题•FOAF–FriendOfAFriendFOAF已广泛应用于语义网中,提供了巨大的关联数据源SIOC与FOAF结合起来,能很好描述人的社会活动21对象重用与交换标准OAI-ORE•OpenArchivesInitiativeObjectReuseandExchange()2008年10月V1.0正式发布用于对Web资源聚合进行描述和交换。资源粒度是任意的:概念、物理文件、聚合实体可以用RDF或ATOM来表示22OAI-ORE•用资源位图来描述资源集合23标准OAI-PMHOAI-ORE架构仓储结构对象结构着眼点以元数据为中心以资源为中心用途元数据收割对象重用(obtain,harvest,register)•通过OAI-PMH来交换ORE数据:如:=ListRecords&metadataPrefix=oai_rem_atomOAI-PMH与OAI-ORE的互补24ORE与Web2.0、语义网、关联数据Web2.0语义网、关联数据ORE与Web2.0ORE与语义网和关联数据Atomprofiles,APP,特殊APIsVocabularies,SPARQLORE对ATOM的扩展OREterms,dcterms,foafFeed技术:RSS,AtomRDF,RDF序列化AtomReM(资源位图)RDF-based数据模型;HTTP303;RDF/XMLReM,RDFaReMHTTPURIHTTPURI将HTTPURI用于表示聚合、资源位图、代理25关联数据和ORE的应用•美国国会图书馆将主题词表LCSH转成SKOS,并作为关联数据对外发布(2008夏)30多万条主题规范数据封装成RDF/XML,供下载(200904)•荷兰SURFshare和欧洲DRIVERII采用OAI-ORE来增强对各类出版物的表示提供复合对象管理服务为各类科学仓储提供基础设施26关联数据和ORE的应用2•LIBRIS瑞典联合目录SwedishUnionCatalogue全部做成关联数据的联合目录6.5万书目记录20万馆藏记录20万规范文档记录(人名、地名、主题等)通过URI,能链接到美国国会图书馆主题词表数据LCSH•SIMILE(2009)用语义搜索、SKOS等技术来扩展DSpace的元数据将结构化数据(包括MARC)转成RDF用Gadget、扩展浏览器等技术来显示数据27JeromeDL语义数字图书馆(爱尔兰国立大学)•通过用户信息与社会网络集成•对相互关联的元数据,采用语义网方法描述(RDF,FOAF等),对社会网络中有意义的资源元数据(如评价等)进行关联•基于社会网络,扩展用户身份认证和访问控制•协同浏览和检索28关联数据和ORE在图书馆中的应用•唯一URI图书馆中的任何‘资源’都应该有唯一的URI,能通过HTTP定位和访问,提供RDF格式的信息•关联数据:以下信息可表示为关联数据主题词表、人名、地名等规范数据书目信息、馆藏单位信息作者信息、人物信息各类元数据元素集:图片、教参、音视频等•ORE:采用ORE进行关联数据的封装、交换和链接,具有更大的开放性和灵活性建立新的仓储基础结构29云计算30云计算的基本概念•从最终用户角度通过Internet,以服务方式(asaService)透明地使用/租用各类IT计算资源(记为X)原来本地部署的部分服务,改用远程服务可定制、可集成31公式:XasaService(XaaS)X:代表CPU、内存、存储、带宽、系统软件、应用软件等各类IT资源(池)。常见XaaS类型:Infrastructure-as-a-Service(IaaS)基础设施即服务Platform-as-a-Service(PaaS)平台即服务Software-as-a-Service(SaaS)软件即服务X=Everything32基础设施即服务InfrastructureasaService,IaaS•IaaS:采用虚拟化技术构建的数据中心,它将分布在大量的计算机和存储设备(包括本地或远程设备)上的计算资源和存储资源(包括内存、I/O设备、计算能力CPU、带宽、存储等)集中起来成为一个虚拟的资源池,以服务方式按需提供给网络用户。•如:Amazon的EC2(弹性计算云)和S3(简单存储服务)等33平台设施即服务PlatformasaService,PaaS•PaaS:平台供应商把开发环境、应用程序运行环境、数据库环境等作为一种平台,以服务方式提供给用户,由后者在该环境中开发和部署自己的应用程序,再通过互联网提供服务。•这类模式代表有:Salesforce的网络应用软件平台force.com,Google的应用软件引擎GoogleAppEngineMicrosoft的Azure平台等。34软件即服务SoftwareasaService,SaaS•SaaS是一种通过Internet提供软件的服务模式。供应商将应用软件部署在自己的服务器上,通过Internet提供给用户。用户不用再购买软件,而改用向软件提供商租用这些软件,通过Internet来使用这些软件,并按租用的服务类型和时间付费。•这类模式代表有:Salesforce的软件服务Salesforce.comGoogle、Microsoft等也提供这类服务。35云计算技术的特点•从服务提供和管理者角度,能对各类IT计算资源实现:各类IT资源虚拟化、服务化单点管理:设备/应用等IT资源的统一管理高度自动化高扩展性——动态伸缩能力:设备的透明更换、扩展服务的动态加载/激活/休眠高可靠性36OCLC的云计算计划WorldcatLoc