第五章数字出版信息组织.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

电子书(数字图书)光盘、互联网、无线网等渠道获得计算机、平板电脑、电子阅读器、手机上阅读特点直接由计算机或其他电子设备存储、检索、显示和处理制作非常简单,可使用专用工具载体多样化经由互联网、移动互联网等通道非常快速地传播方便检索和永久保存问题:为什么出版业没有充分受益?纠结!第五章数字出版信息组织5.1数字文档方式数字出版中所用到的文档形式,在实际中最典型有四种图像方式公司自有格式PDF标准格式标记语言方式数字文档方式图像方式图像方式指对印刷稿直接用扫描仪扫描成图像,阅读时原样显示图像实现简单,占存储容量大,不能用于全文检索和超文本链接只出现在早期,现在基本不再使用观点:图像方式并不是合适的数字文档形式图像方式应用文本转化为图像形式显示,以降低被盗版风险数字文档方式公司自有阅读格式微软(LIT)、Adobe(PDF),国内超星(PDG)、方正(CEB)、书生等,全部拥有自有格式和浏览工具用户使用不同阅读器,一定程度上增加用户阅读成本,可能无形中造成数字图书用户流失观点:竞争后的事实标准数字文档方式PDF格式与印刷密切相关继PostScript(解决符号字型描述的标准化)之后的一项重要技术,解决排版格式上的标准化问题用于印刷的文稿可以直接制作或上网使用,数字文稿完全体现印刷文稿形式,可以原样打印输出,复杂的公式图表也可以很好的描述。一些报刊在网上提供PDF格式,以便读者了解版面情况,出版社也用其存档保存图书信息PDF是可加密文档:可给用户不同等级的权限,可附数字签名,做批注、审批加印等数字文档方式PDF格式不主要针对电子阅读面向版面,而不是面向数据组织在相对很小的屏幕上看大的印刷版面不方便检索功能相对较弱对文章的检索不很方便,超文本链接功能不够强,这些功能是数字文档突出的特点交互功能弱观点:PDF格式实际上是印刷出版的数字化延伸,建立了印刷出版和数字出版的桥梁,是对传统出版的数字化兼容,而非全新意义上的数字出版格式数字文档方式标记语言方式以HTML为代表的数字文档标识方式标记语言专门为计算机描述文档,用户可以方便的浏览和检索信息文稿可以在浏览器在上直接识读网络将Internet上的信息资源联结起来,因而成为今天网络环境中最主要的数字文档描述方式在数字出版领域?浏览器的核心工作就是显示HTML文档(所以叫浏览器)5.2数字出版数据5.2.1数字出版数据信息方正博思内容管理平台中文在线数字出版平台数字出版平台项目建设核心在于数字内容资产的整合、管理、跨平台发布及信息服务平台数字化产品(书+内容)业务流程内容选题脚本与媒体设计素材准备总集成与测试试用与调整销售推广跟踪服务与反馈改进与再版教学审查二审内容创作模板准备(选择)交稿规范化初标媒体制作一审内容编辑版式调整与集成媒体集成三审媒体审查在线发布印制生产在线检查质量控制内容检查整体检测批准发布交稿审查发稿生产加工的对象关键控制点工种实体书收货内容创作(图书\多媒体)结构化内容加工和标注数学物理机械...高等教育出版社内容资产内容管理平台逻辑架构图图书网动图书...OnlineFirstXML模板1模板2模板3高等教育出版社基于内容管理的业务流程5.2.2文献文本是知识交流的主要方式文献——单一的信息单元文本是文献的典型数据形式,文献也可以包含其他媒体可以是一个完整的逻辑单元,如研究报告、书、手册;也可以大型文本的一部分,如一个或多个自然段,词典的一个条目,一个汽车零部件的描述等可以是任意物理单元,如一个文件、一封电子邮件或一个网页信息处理文献化文献的特征语法用于定义结构、表现样式、语义甚至是外部行为结构,文献生产者指定,如章、节(内部结构)语义,由文献作者说明(内容)样式,如何打印或显示(外部形式)文本+结构+其他媒体语法结构表现样式语义文献文献的特征文献类型一次文献指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用他人的著作,也不管该文献以何种物质形式出现,均属一次文献。大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献二次文献指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献文献类型三次文献指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等文献的处理MVC(ModelViewController)一种软件设计架构,用于组织代码一种业务逻辑和数据显示分离的方法Model描述结构内容如何组织View表现形式内容以何种形式表达Controller控制动作如何操作内容内容(本身)是什么?数字出版数据在数字出版中,需要一种描述出版行为结构框架的工具组织不同类型、格式数据,以形成产品方便联结不同阶段的加工过程方便流程管理方便知识(不仅是数据)保存便于数据转换便于以各种形态发布……内容创作(图书\多媒体)结构化内容加工和标注数学物理机械...高等教育出版社内容资产内容管理平台逻辑架构图图书网动图书...OnlineFirstXML模板1模板2模板3文献的处理人的理解通过内容(智力,知识)计算机理解自然语言?计算机理解文档结构计算机能够识别的格式格式:专用(只是具体系统)/开放(任何系统)……格式标准化计算机认识的“普通话”文献自身的信息(与内容无关)元数据业内称版权与标准问题制约数字出版业发展自然语言理解:我们正在努力真的总有必要?5.2.3元数据元数据——关于数据组织、不同数据域及其相互关系的信息。简言之,元数据就是“关于数据的数据”数据库中的关系名、每个关系的字段和属性、属性区域文本相关的元数据包括作者、出版日期、出版商、文献长度(如页数、字数、字节数)以及文献的类型(如书、文章、备忘录等)元数据功能信息发现:帮助使用者检索和确认所需要的资源,如Dublincore(简称DC)主要用于组织网络信息资源信息描述:用于对数据单元进行详细、全面的信息描述,如图书的MARC、档案的机读目录、地理空间信息(FGDC)等资源管理:支持对资源利用和管理过程的政策与控制机制的描述,例如权限管理、资源评价、电子签名、使用管理等元数据功能资源保护与长期保存:支持对资源的长期保存,除了对信息资源的描述与确认之外,往往还需要关于该资源的格式信息、制作信息、转换方式、技术环境等,以便于资源的利用使用:用以描述信息资源的使用层次与类型。如使用与使用者记录追踪、内容再利用与不同版本的信息真实性保障(正处于研究之中)DC(都柏林核心集)都柏林核心元数据(DublinCoreElementSet)元数据中的一个标准集,简称DCDC元数据主要为了能够以比较简单的方式来描述网上各种主题的电子资源简练、易于理解、可扩展、能与其他元数据形式进行桥接能较好地解决网络资源的发现、控制和管理问题成为一个较好的网络资源的发现描述元数据集,并正在逐步发展成为世界公认的标准DC元素(都柏林核心集)内容描述知识产权外形描述题名Title创建者Creator日期Date主题Subject出版者Publisher类型Type说明Description其他责任者Contributor款式Format来源Source权限Rights标识Identifier语种Language关联Relation覆盖范围CoverageDC元数据一个完整的DC元数据体系,可以包括三个方面的内容语义对元数据的概念实体的定义,比如说定义DC中的题名或日期元素的含义句法规定DC元数据体系的表达与描述结构的定义与描述结构描述DC各个元素之间的相互关系DC元数据目前,国际上对DC元数据的表达与描述多数采用的是标记语言(XML)优点保证了元数据的结构化,易于被计算机处理和交流,对人来说也有很好的可读性标记语言采用了最简单的文本格式,使其具有很强的兼容性和不依赖于软硬件平台的独立性,同时这些特性也确保其具有很强的生命力可以将元数据与资源内容的管理结合在一起,元数据描述与其被描述的对象整合在一起,大大提高了内容管理与交换中元数据的可用性摄影元数据—Exif标准可交换图像文件常被简称为EXIF(Exchangeableimagefileformat),是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据数码相机可以把各种拍摄信息记入数码图像中,应用软件可以读取这些数据读取图片的EXIF信息描述性元数据可以用程序读取例:EXIF信息处理的Java包是DrewNoakes写的metadata-extractor,可以直接从下载该项目的最新版本包括其源码描述性元数据的层级第一级第二级第三级记录特性简单格式非标准化的全文索引结构化的格式逐渐成为标准字段结构复杂格式国际标准详细的标记元数据格式举例LycosAltavistaYahooetcDublinCoreIAFAtemplatesRFC1807SOIFFGDCEADTEIGILSMARC描述能力低高元数据标准体系描述上述信息内容的规则、方法和机制信息服务过程和服务系统模式作品与对象集合信息内容作品与对象作品/对象及其集合的管理和服务机制元数据元数据元数据元数据元数据元数据一次文献二次文献(描述元数据)三次文献与系统相关的元数据-引自张晓林《元数据研究与应用》编码与著录方法SGML结构化、规范、复杂、描述能力强、需要DTDHTML半结构化、不断变化发展、描述能力差、单一DTDXML结构化、规范、简洁、描述能力强、DTD可选RDF在结构基础上引入语义(语义出版)其他方式通用可选数据元素核心LOM必须数据元素课件网络课程媒体素材文献资料案例常见问题解答资源目录索引试题试卷高等教育出版社5.2.4数字对象数字对象数字信息库中表示信息的基本逻辑单位。如文章,图片,一部音乐作品数字对象元数据描述对象实体的信息。元数据中可包含数字对象的唯一句柄数字对象构成数字对象头数字对象体A1A2A3An元数据句柄数字对象唯一标识符DOIDOI(DigitalObjectidentifier)提供标识与数字对象之间的链接,针对因特网环境下如何对知识产权进行有效的保护和管理产生1998年,美国出版协会(AAP)创立非赢利组织IDF。IDF在CNRI(美国全国研究创新联合会)配合下制定了DOI标准和相应的解析系统由IDF、注册机构(RA)、CNRI构建了DOI应用体系DOI的作用123FourdynamicfactorsDOI的作用图书馆通过在本地导入DOI并与OpenURL结合,为用户提供访问更多全文文献的机会DOI的作用DOI的作用4搜索服务在学术搜索中引入DOI可以提高搜索质量。CrossRef与Google合作的CrossRefSearch。仅在成员所提供的学术内容中进行搜索,通过DOI保证了检索结果到全文的链接有效性和持久性政府机构相关政府机构通过DOI的推广和应用更有效地管理学术信息资源,从标识体系的建立和应用上实现包括科技文献和科学数据在内的资源整合,从而有助于建立一个基于分布环境下的一站式的科技基础信息服务平台5CrossRef利用DOI形成跨出版商的链接服务PublisherAPublisherCPublisherDPublisherAPublisherBPublisherCPublisherDPublisherEPublisherFPublisherBPublisherEPublisherF15bilateralrelationships6networkrelationships万方数据资源系统期刊学位会议图书……国外出版社国内文摘数据库CBM医学文献数据库;社会科学期刊评价数据

1 / 212
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功