GB-T 13725-92 建立术语数据库的一般原则与方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中华人民共和国国家标准建立术语数据库的一般原则与方法1范围本标准规定了建立术语数据库(简称“术语库”)的一般原则与方法。本标准适用于术语库的研究、开发、维护及有关管理工作。在其他涉及术语数据处理的工作中也可参照使用。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/Tl.6—1997标准化工作导则第一单元:标准的起草与表述规则第6部分:术语标准编写规定(neqISO10241:1992)GB4943信息技术设备(包括电气事务设备)的安全(idtIEC950:1991)GB/Tl0112术语工作原则与方法GB/T15237.1—2000术语工作词汇第1部分:理论与应用(eqvISO1087-1:2000)GB/T16786—1997术语工作计算机应用数据类目(eqvISO/DIS12620:1996)GB/T17532—1998术语工作计算机应用词汇(eqvISO/DIS1087-2-2:1996)GB/T18155术语工作计算机应用机器可读术语交换格式(MARTIF)协商交换(eqvISO12200:1999)3术语和定义GB/T15237.1—2000、GB/T16786—1997、GB/T17532—1998确立的术语和定义适用于本标准。为了便于使用,本标准重复了其中的部分术语和定义。3.1术语term在特定专业领域中一般概念的词语指称。[GB/T15237.1—2000,3.4.3]3.2术语数据库terminologicaldatabase存储术语数据的数据库。[改自GB/T17532—1998,7.6]3.3数据元dataelement在一定的上下文中具有区别特征的数据单元。[GB/T17532—1998,7.11]3.4数据字段datafield为特定的数据元而保存在一个记录中的变长或定长的部分。[GB/T17532—1998,7.12]3.5数据类目datacategory数据元类型dataelementtype关于给定数据字段的类型说明。[GB/T17532—1998,7.14]3.6术语条目terminologicalentry术语数据集合中所包含的关于一个概念的术语数据。[GB/T17532—1998,3.22]4术语库的建设4.1术语库可分成三级:a)国家标准化术语库;b)专业领域术语库;c)基层术语库。4.1.1国家标准化术语库具有管理我国标准化术语的功能。4.1.2专业领域术语库应明确专业分工,界定范围,搞好协调工作,避免重复、遗漏和浪费。4.1.3有关单位可根据工作需要建立基层术语库。4.2术语库的建设应遵循国家有关信息系统建设的规定,做好与其他术语库的协调,实现信息交换与资源共享。5术语库的类型和信息流程5.1术语库的类型5.1.1面向概念的术语库突出概念体系的合理性与层次性,并包括概念的严格定义,且定义具有权威性的术语库。5.1.2面向翻译的术语库根据需要包含两种或两种以上语言的术语对应词,含有较多的语言学信息(如词性、语境、用例等)的术语库。5.1.3面向特定目标的术语库作为专家系统、知识库系统、机器翻译系统等的组成部分,为满足各种特定目标要求而建立的术语库。5.1.4其他特殊用途的术语库根据实际需要进行设计的术语库,如通用词库等。5.2术语库系统信息流程术语库系统信息流程如图1所示。5.2.1术语信息源术语信息可以来自国家标准、行业标准及其他标准文献,也可以来自权威性的辞典、百科全书及其他工具书和文献;或者是由专家、学者及用户提供的对新概念的定义和指称,还可以通过与其他术语库联网、交换术语数据及记录载体等方式获得。5.2.2规范化处理按照已定的标准格式或规则,对从各种途径获取的术语信息进行加工。5.2.3输入原始术语信息经规范化处理后,通过输入设备,例如键盘、文字识别设备、语音识别设备等,输入到术语库系统。5.2.4术语库系统术语库系统对输入信息(数据)进行处理后,存入存储器,可以方便地存取、检索、修改、删除、更新和补充数据。5.2.5输出用户通过输出设备,例如屏幕显示器、打印机、软盘驱动器、光盘驱动器、语音设备、缩微胶片设备、照排设备等使用术语库中的信息。5.2.6用户术语库的用户包括:标准的制修订者、翻译工作者、辞书编纂人员、编辑人员、教育工作者、语言学工作者、科技工作者、学生以及其他用户。5.2.7信息共享通过联网、交换数据记录载体等方式实现与其他术语库系统信息资源共享。6术语库系统的基本要求6.1设计原则与质量要求6.1.1目的性应对各方面的用户需求进行调查分析,并依据大多数用户对术语库功能、性能、数据等方面的要求,在充分考虑社会效益和经济效益的前提下开发术语库。术语库的开发应符合实际使用的需要。6.1.2科学性应对术语库开发中涉及到的各种学科的理论与技术进行充分的研究,运用系图1术语库系统信息流程图术语库系统输入输出用户术语信息源其他术语库系统规范化处理接口统工程的方法在科学的基础上开发术语库。6.1.3易用性系统应简单易学,使用方便。6.1.4经济性应选择技术上先进,经济上合理的设计方案。6.1.5可靠性硬件配置、软件的选择和开发保证术语库具有高可靠性。6.1.6易维护性a)为使系统保持良好工作状态和防止事故于未然而进行的预防性维护;b)为克服故障而进行的纠错性维护;c)为使软件产品能够在改动的环境下继续使用而进行的适应性维护;d)为改善性能而进行的完善性维护等。6.1.7安全性a)应按GB4943的要求进行系统的硬件设计和安装;b)应制定保证术语库系统设备安全的分级管理守则;c)应对各类用户在不同条件下对各种范围内的数据的存取权限作出规定;d)应能防止数据交换过程中可能出现的计算机病毒侵入,并具备检查和清除病毒的有效措施;e)应根据需要对特殊数据的保密提供保护机制和保密措施。6.1.8易扩缩性应能根据需求的变化,易扩充或缩减系统功能。6.2对计算机系统的要求6.2.1基本要求6.2.1.1术语库计算机系统应有较强的文字处理能力,能支持汉字信息处理。根据需要能支持多种语言、文字、符号、公式、图形、图像、声音等多媒体信息等。6.2.1.2大型术语库系统应能通过互联网与国内其他大型术语库及世界上主要术语库实现信息资源共享。6.2.2对硬件的基本要求a)根据系统设计要求优选适用的计算机;b)能较容易地实现主机与外设的配套;c)有足够的内存和外存空间;d)数据处理速度、系统输入输出能力应满足业务类型和用户数量等的需要;e)系统应兼容性好,维修方便;f)系统具有安全性和高可靠性;g)具有联网功能;h)具有较强的可扩充能力,能方便地实现现场升级。6.2.3对软件的基本要求a)应完整、配套,形成系统。包括系统软件、汉字支持软件、数据库管理软件、通信控制软件、网络管理系统、安全保密及其他应用软件;b)应具有较好的灵活性和可移植性,对运行环境有较强的适应能力;c)具有较强的可扩充能力,能够根据需要升级;d)有较好的人机交互能力;e)数据库管理系统功能强,能方便地进行数据存取、检索、补充、修改和删除等;f)具有较好的安全性和保密性。g)应使用国家标准和有关国际标准所规定的字符集。应尽可能使字符集可扩充,使特殊字符可直接访问,并根据需要考虑多语种的兼容处理问题。6.2.4对通信系统的要求根据需要,可支持实现先进的计算机网络通信,支持开放系统互联,能实现通过网络的数据库存取。6.3对术语数据的要求6.3.1基本要求6.3.1.1正确性入库术语数据应是经核查正确无误、有效的。6.3.1.2一致性应排除由于术语数据来源不同而产生的不一致。6.3.1.3完整性应保证术语数据元、数据类目和数据结构的完整。6.3.1.4独立性数据应独立于计算机系统,且独立于存储方法和存取方式。6.3.1.5适时性及时更新术语数据。6.3.2数据类目的选择数据类目应首先从以下五类中选择。6.3.2.1描述术语的数据主要包括:——[汉语]主条目术语;——简称(缩略语);——全称(当主条目术语为简称时);——同义词;——其他语种对应词;——符号;——词类;——其他语法信息;——注音;——术语的注释;——参见。6.3.2.2描述概念的数据主要包括:——概念的定义;——概念的描述;——语境;——示例、公式、表格、图形等。6.3.2.3描述概念体系的数据主要包括:——分类(分类法);——叙词(叙词表);——上位词;——广义词(如果上位词不清楚);——下位词;——狭义词(如果下位词不清楚);——同位词。6.3.2.4用于管理的数据主要包括:——记录标识;——语种代码;——文献来源代码;——记录的生成日期;——数据修订日期;——责任者代码;——使用的地域限定;——标准化或非标准化;——现行用法或过时用法;——首选或许用或拒用或被取代;——行业用语(行业范围);——机构内部的用语;——可靠性代码。6.3.2.5表示文献的数据主要包括:——文献的类型(如标准、辞典、百科全书、手册等);——文献信息:a)著(作、编)者;b)题目;c)出版日期;d)出版机构;e)出版物的卷期号;f)标准号g)术语信息在文献中的页码。6.3.2.6其他数据项应考虑到不同类型的术语库要求不同的数据类目,不同的用户群(如学生、翻译、学科领域的专家)需要不同类型的信息。一个多功能的术语库应具备灵活性,允许增加新的数据类目。6.3.3数据结构在进行数据分析时,应建立起数据结构模型。6.3.3.1术语数据元之间的关系术语数据元可以是面向概念的,可重复的或不可重复的。它们可以由其他数据元组合而成。术语库中词条的数据元可以是与概念相关的信息(如定义、描述等),也可以是与术语相关的信息(如语法信息、语境等),如图2所示。6.3.3.2术语的多语种对应关系学科(专业)领域概念概念概念定义说明术语同义词术语(其他语种对应词)……语法语境语境语法语境语法源资料源资料源资料源资料………………图2与概念有关的和与术语有关的信息同一概念的术语在不同的语种中的对应关系有以下三种类型:a)完全对应概念体系是在两个语种中独立地建立起来的,术语所表达概念的定义以及概念在概念体系中的位置在两个语种中完全相同。b)不完全对应当概念在两个语种中不能完全对应,但其差别能用两个概念的若干术语相互翻译时,则应将这些术语并列在该词条下,并加注解指出差别和相似性。c)完全无对应当一个概念在另一语种中无对应时,可以翻译定名(或空缺),但应在术语库中特别标记。6.3.3.3数据结构的描述可使用实体—关系图(E—R图)描述数据结构。见附录A。术语库实体—关系图应将每个数据元独立地分开,并描述术语库中不同数据元之间的逻辑联系。6.3.3.4数据结构的修改——增加一个字段;——增加一个层次结构;——改变字段的顺序;——细分和(或)合并字段;——改变字段名;——改变字段的数据类型;——其他修改。6.4对术语信息源的要求6.4.1科学性入库概念、定义和术语应符合GB/T10112的各项规定。6.4.2权威性术语应从具有权威性的文献中选择并经有关专家审定。6.4.3系统性术语的选择和收录应系统地进行,并保证概念体系的完整性。6.4.4一致性审核入库术语时,应避免一个专业领域内的一个概念用多个术语表达,或一个术语指称多个概念,尤其要避免同一概念的定义不一致。6.5术语库的服务方式服务方式应方便用户使用,建库时可根据需要加以选择。例如:——查询;——屏幕显示;——打印;——磁盘、光盘录制;——排版;——缩微;——联机检索;——通过互联网下载;——其他可用的数据交换方式。7建立术语库的基本过程7.1术语库开发的基本过程及需备文件术语库开发的基本过程及需备文件见表1。表1术语库开发的基本过程及需备文件初始期开发期运行期规划论证需求分析系统设计系统实施审查与验收系统运行应具备的工作文件项目申请书用户需求报告

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功