元数据的功能及在人文学科的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

历史研究所刘洪波元数据的功能及在人文学科的应用一、元数据的过去及现状1.定义2.格式3.MARC4.DublicCore5.一些人的看法元数据的定义•我们所说的“元数据”,英文作Metadata。目前在国内有多种译法,大陆一般译作“元数据”。香港和台湾则译法较多,台湾有人译作“预设资料”、“诠释资料”、“元资料”,也有人译作“后设资料”。•关于这一名称,西方学者大多定义为:DataaboutData,即关于数据的数据。它是用于描述信息资源的高度结构化数据。•数据是手提箱,而元数据是它上面的姓名标牌;数据是文件夹,而元数据是夹子的标签;数据是书的内容,元数据是书脊上的杜威十进制数码。图书管理信息书名信息作者信息图像信息资料库建库人员来源及类别所用平台信息组织方式管理维护人员反馈信息后续信息检索方法•网络资源:DublinCore、CDF、WebCollections•文献资料:MARC,DublicCore•人文科学:TEIHeader•社会科学数据集:ICPSRSGMLCodebook•博物馆与艺术作品:CIMI、CDWA、RLG•政府信息:GILS元数据的格式•MARC于1965年由美国会图书馆一个研究小组制定,后来不断完善,成为图书馆数字化检索的重要格式。1991年,我国有关部门在UNIMARC基础上加上我们所需的特定字段,编制了《中国机读目录通讯格式》(CNMARC),此后多次修订•DublicCore最初于1995年制定,从时间上看要比MARC晚,在技术上要先进MARC及Dublic(DC)•由来:在1995年联合召开了第一次都柏林(都柏林为美国俄亥俄州的一个城市)核心集会议。来自图书馆、计算机及有关领域的专家达成一致意见,创建了只包含能够描述电子文献基本特征的DublinCore•从1995年开始,专家小组共召开了13次会议,讨论与核心集相关的各种问题。2004年10月11-14日,我国上海图书馆主办了第12次会议。最近一次会议于2005年9月12-15日在西班牙首都马德里召开,来自33个国家和地区共计214名专家学者出席了会议。DublicCore(DC)•简单性原则”。定义一个能得到最广泛应用、被全球所理解和接受的最小元素集,并能作为特殊用户详细描述需求的一个核心集。•“易用性原则”。能方便作者和信息提供者描述自己的文档,而不给他们增加太多的负担,并能方便地实现资源发现工具之间的互操作性。DublicCore的原则•“内在性(intrinsicality)原则”。指DC元数据以揭示描述对象自身的内容属性为主,外部属性为辅。•“可扩展性原则”。希望DC成为一个“核心”元素集合而可以通过各种方式扩展为适应各领域资源描述需要的元数据方案。•“句法独立(syntaxindependence)原则”。指DC元数据的元素可以以多种方式编码,应用于各类技术平台中。DC只规定元素的基本语义。•“可选择性”。指DC元素集合中的任何元素都是可选的。•“可重复性”。指DC元素集合中的任何元素都是可重复的。•“可修改性”。指在具体应用中可以对DC元素集中的任何元素进行进一步“修饰”或“限定”,但不能扩大或改变元素的基本语义。•元素:标题、作者、主题、出版者、描述、其他参与者、日期、类型、格式、标识、关系、资料来源、语言、内容范围、版权15个元素组成•都柏林核心集目前已经扩展成一个世界性元数据标准,有五个国家(澳大利亚、芬兰、丹麦、英国、美国)把它确定为国家标准,各类推荐方案被翻译成33种语言。当前对都柏林数据集的看法•由于Google等检索工具出现,一些人甚至断言,元数据特别是DC,在还没有成为通用标准以前,已经寿终正寝了。•Google等通用检索工具,查全查准两方面都还有很多问题。•而在这两个方面,使用元数据的专用信息库则会充分发挥自己的优势。•在今后的一段时间内,元数据不会因为信息技术的进步而失去其存在的价值。这是我们断续研究和使用元数据的最主要的动力。使用者元数据服务器使用者数据服务器数据服务器数据服务器1.元数据的功能2.元数据在我国的应用二、元数据的功能及我国元数据应用状况•在某些方面,例如元数据有利于管理信息和检索信息,取得了大体一致的意见,但对元数据功能的认识还是有差异的,这种认识上的差异则导致元数据设计时产生不同的结果。•大多数人仍未认识到元数据在信息库建设中的重要作用1.元数据的功能•按照统一的标准建设资料库,合理有序地组织信息。•确立元数据标准在大型的、多学科、多单位合作的项目中尤为重要。既使简单的、信息内容较少、参加人员不多的信息库,在建设之初也要先确定元数据标准。元数据单位一单位二单位三单位四资料库可以通过对相同的元数据元素进行比较,来获取最新的资料版本。•在元数据元素中,通常都有各信息库的版本资料,通过对相同元数据元素进行比较,可以在访问不同数据源时,决定获取哪一版本的资料。元数据数据库数据服务器比较版本数据服务器利于数据维护、转换和扩展•在信息库运行过程中,总会出现这样那样的问题,这就要求精心管理维护信息,这是信息库正常运行的一项重要工作,元数据则成为这项工作必须要件。可以说,没有元数据,特别是在信息库建设人员(或管理人员)发生变动之后,要想顺利维持信息库的正常运行是极为困难的。在这方面,已经有很多前车之鉴。可以帮助使用者快速、准确、全面地查询所需要的信息•信息库建设的最终目的是为使用者服务,信息库从设计到维护都要方便使用者,以快速、准确、全面地为使用者提供所需信息为目标。为了实现这一目标,在元数据的设计过程中,就要全面、合理、细致地考虑所有因素,在各种因素之间比较、平衡,从中选出最可行、最简捷、最有利于使用者的方案。使用者可以通信息库提供的元数据,快速、准确、全面地查找所需要的信息。交互性是元数据的一项重要功能•一方面是信息库建设者和信息获取者之间的交流•另一方面则是各种信息源之间的交互性数据信息库元数据信息库信息库与使用者信息交换示意提供数据数据请求信息源之间的交互性示意数据源1数据源2数据源3元数据信息库信息交换平台•在数字图书馆方面的应用•在自然科学方面的应用•在政务办公方面的应用•社会科学方面的应用2.当前我国元数据应用状况•1991年,我国有关部门在UNIMARC基础上加上我们所需的特定字段,编制了《中国机读目录通讯格式》(CNMARC),此后多次修订•1997年启动的我国大陆第一个“中国国家试验型数字图书馆”项目对DC元数据进行了跟踪和引进•《中国数字图书馆标准规范建设网》简称CDLS,网址为:在数字图书馆方面的应用•自然科学研究方面的应用(国家基础地理信息系统(NFGIS),中国动物物种编目数据库,生态共享系统等)•医学上的应用(中国肿瘤数据库)•农林业方面的应用(农业科学数据中心,中国林业科学资源共享)•地质采矿(中国矿产资源数据库,中国火成岩数据库)•气象(静止气象卫星红外云导风元数据)在自然科学方面的应用•国土资源数据交换网络•基础教育教学资源元数据规范(教育部)•中国西北地区水资源水环境基础数据库系统(水利部)•城市信息资源协作网系统•北京信息资源管理中心•档案信息管理(研究中)•东莞市国土资源空间数据库•吉林市地籍信息系统•黑河流域资源调查在政务办公方面的应用•全国文化信息资源共享工程•新闻元数据属性总表•统计地理信息系统(国家统计局)•湖南省农村老年人的生活状况调查数据集社会科学方面的应用1.元数据在人文和社会科学领域应用的必要性2.元数据应用中要采取统分结合的原则三、人文和社会科学应用元数据的必要性及标准•各研究单位缺乏有效沟通,各学科内部基本没有统一的标准,这种状况,给将来的资源整合和扩展带来很多困难。随着信息资源的迅猛增加,制定人文和社会科学元数据标准的要求越来越迫切。在人文和社会科学领域应用的必要性•资源整合、资源共享、互相兼容、多方协作、多方吸收、多方扩展、交互使用已经成为信息化建设的基本要求,而所有这些,都要通过确定元数据标准来实现。•在借鉴国内外经验的基础上,制定一套适用的元数据标准。只有这样,才能少走弯路,避免重复建设,多快好省地开展我们的工作。•参考国内外元数据标准,吸其前人的经验教训,根据人文和社会科学的特点,以实用、好用为原则,在兼容国内外标准的前提下,建设自己的元数据体系。2.采取统分结合的原则•可以在大的原则上制定统一的标准。这个统一的标准,主要依据元数据的功能来制定,比如根据上面提到的元数据的几项功能,来确定元数据应包括哪些元素。•在服从大原则的条件下,各学科可以根据自己的实际情况,从自己学科特点出发,分别设计本学科或课题的元数据元素集。谢谢

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功