新闻出版内容资源加工规范第9部分:报纸加工2014-01-29发布2014-01-29实施中华人民共和国新闻出版行业标准Specificationofcontentresourceprocessinginpressandpublication—Part9:NewspaperprocessingCY/T101.9—2014ICS35.240.30L70发布中华人民共和国国家新闻出版广电总局I前言………………………………………………………………………………………………………………I1 范围…………………………………………………………………………………………………………12 规范性引用文件……………………………………………………………………………………………13 术语和定义…………………………………………………………………………………………………14 成品数据……………………………………………………………………………………………………34.1 元数据集………………………………………………………………………………………………34.2 图像数据………………………………………………………………………………………………74.3 内容结构化数据………………………………………………………………………………………74.4 对象数据………………………………………………………………………………………………84.5 版式文件数据…………………………………………………………………………………………94.6 流式文件数据………………………………………………………………………………………104.7 命名及存储…………………………………………………………………………………………104.8 数据清单……………………………………………………………………………………………115 数据验收…………………………………………………………………………………………………136 数据维护…………………………………………………………………………………………………13参考文献………………………………………………………………………………………………………14目次CY/T101.9—2014ICY/T101《新闻出版内容资源加工规范》分为以下10个部分:──第1部分:加工专业术语;──第4部分:数据加工质量;──第5部分:资料管理;──第6部分:数据管理;──第7部分:数据交付;──第8部分:图书加工;──第9部分:报纸加工;──第10部分:期刊加工。本部分为CY/T101的第9部分。本部分由中华人民共和国国家新闻出版广电总局科技司提出。本部分由全国新闻出版信息标准化技术委员会归口。本部分起草单位:方正国际软件有限公司、北京拓标卓越信息技术研究院、新闻出版总署信息中心。本部分主要起草人:赵海涛、周长岭、安秀敏、刘成勇、蔡京生、周卫国、吴治强、张沫。前言──第2部分:数据加工应用模式;──第3部分:数据加工规格;11 范围CY/T101的本部分规定了新闻出版内容资源报纸加工的成品数据、数据验收和数据维护等方面的要求。本部分适用于报纸内容资源的数字化加工和电子资源的加工制作。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T4754国民经济行业分类与代码GB/T18793信息技术可扩展置标语言(XML)1.0GB/T20093中文新闻信息分类与代码GB/T25100信息与文献都柏林核心元数据元素集CY/T101.4新闻出版内容资源加工规范第4部分:数据加工质量3 术语和定义CY/T101.1-2014中所界定的以及下列术语和定义适用于本文件。3.1 新闻出版内容资源pressandpublicationcontentresource新闻出版领域内任意形式、任何粒度的内容及其他有价值的资源。[CY/T101.1-2014,4.1.1]3.2 数字化加工digitalprocessing针对纸质出版物、表单、公文、档案文献等,通过专业化的解决方案,加工成PDF、Html、Txt、Doc、Xls等多种可编辑的电子文件格式的活动。[CY/T101.1-2014,5.1.1]3.3 电子报e-newspaper数字报可通过相关设备直接呈现文字、图像、音频、视频等内容,以刊载新闻、信息或时事评论为主的连续性数字出版产品。[CY/T101.1-2014,7.1.9]3.4 都柏林核心元数据Dublincoremetadata;DC一种根据各类信息资源的共同特点确定的,适用于不同领域间信息资源、特别是网络信息资源的元数据。[CY/T101.1-2014,6.1.3]新闻出版内容资源加工规范第9部分:报纸加工CY/T101.0—201423.5 新闻news媒体用于记录社会、传播信息、反映时代的一种文体。3.6 成品数据finisheddata已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态。[CY/T101.1-2014,7.1.1]3.7 版式文件fixed-layoutdocument版式文档排版后生成的,包含版面固化呈现需要的全部数据的一种文件。[CY/T101.1-2014,6.3.10]3.8 流式文件reflowingdocument流式文档按照内容逻辑顺序,内容呈现可适应终端设备屏幕或窗口变化的一种文件。[CY/T101.1-2014,6.3.11]3.9 单层图像版式文件imagedfixed-layoutdocument图像版式文件通过扫描方式,生成与原加工对象版式完全一致的图像文件集合,并打包成独立完整的可浏览的数字版式文件(含书签信息及书签信息和版式文件页面之间的链接关系)。[CY/T101.1-2014,6.3.12]3.10 双层矢量化版式文件vectorizeddual-layerfixed-layoutdocument双层版式文件在单层图像版式文件基础上,同时生成与图像层对应的透明字体模式的文字层,可支持选取、拷贝和查找的版式文件。[CY/T101.1-2014,6.3.13]3.11 单层矢量化版式文件vectorizedfixed-layoutdocument矢量版式文件按照原加工对象的文字位置,文字采用矢量字,修饰性图片、艺术字、底纹、线条、图表和公式等以图像形式显示的版式文件。[CY/T101.1-2014,6.3.14]3.12 单层矢量PATH版式文件curved-textfixed-layoutdocument转曲版式文件在原加工对象的文字位置上采用曲线绘制文字的版式文件。[CY/T101.1-2014,6.3.15]34 成品数据4.1 元数据集4.1.1 概述报纸资源部分的元数据包含报纸基本元数据,报纸单期元数据,报纸单版元数据,新闻元数据,图片元数据,广告元数据和管理元数据等。元数据集通常包含在内容结构化数据中,以XML1.0及以上版本格式存储。4.1.2 报纸基本元数据报纸基本元数据包括了报纸的各种基本信息,见表1。序号中文名称英文标签必备性可重复性备注(对应DC)1报纸种类唯一标识符Identifier必备不可重复标识符(Identify)2报纸CNCN必备不可重复3正报名Title必备不可重复4副报名SubTitle有则必备可重复5外文报名ForeignTitle可选可重复6其他OtherTitle可选可重复7主管单位InCharge有则必备不可重复8主办单位Hoster有则必备可重复9出版单位Publisher有则必备可重复出版者(Publisher)10印刷单位Printer有则必备可重复11发行单位Delivery有则必备可重复12其他Others可选可重复13主编ChiefEditor可选可重复14社长President可选可重复15创刊日期StartPublication可选不可重复16出版周期PublishCycle必备不可重复17发行范围PublishRange可选不可重复公开/内部18邮发代码PublishiCode可选不可重复19国外代码ForeignCode可选不可重复20自办发行SelfIssue可选不可重复21幅面尺寸Format可选不可重复22单价UnitPrice可选不可重复23年价WholeYearPrice可选不可重复24语种Language必备不可重复语种(Language)25网址WebSite可选可重复26地址Address可选可重复27邮编ZipCode可选可重复28办公电话OfficeNumber可选可重复29办公传真FaxNumber可选可重复表1 报纸基本元数据CY/T101.0—20144序号中文名称英文标签必备性可重复性备注(对应DC)30热线电话ServiceLine可选可重复31监督电话ControlLine可选可重复32名称变更UsedName可选可重复33社址变更UsedAddress可选可重复34责任变更UsedDuty可选可重复35类别分类Classify可选可重复36学科分类SubjectCatalog可选可重复(续表)4.1.3 报纸单期元数据报纸单期元数据包括了单期报纸的基本信息,见表2。序号中文名称英文标签必备性可重复性备注(对应DC)1报纸唯一标识符Identifier必备不可重复2单期唯一标识符VolumeIdentifier必备不可重复3期号VolumeNumber有则必备不可重复4出版日期VolumeDate有则必备不可重复日期(Date)5总版数TotalPageNumber必备不可重复6总新闻数TotalNewsNumber可选不可重复7总广告数TotalAdvNumber可选不可重复8总字数TotalWords可选不可重复表2 报纸单期元数据4.1.4 报纸单版元数据报纸单版元数据包括了单版报纸的信息,见表3。序号中文名称英文标签必备性可重复性备注1期次唯一标识符VolumeIdentifier必备不可重复2单版唯一标识符PageIdentifier必备不可重复3版次号PageNumber必备可重复4版名PageTitle有则必备可重复5外文版名ForeignTitle可选可重复6专版版次SpecialPageNumber有则必备不可重复7专版名称SpecialPageTitle有则必备可重复表3 报纸单版元数据5(续表)序号中文名称英文标签必备性可重复性备注8副刊版次SupplementNumber有则必备不可重复9副刊名称SupplementTitle有则必备可重复10号外ExtraTitle有则必备可重复11栏目名称ColumnTitle有则必备可重复12本版主办PageInCharge可选可重复13本版责编PageEditor可选可重复14本版美编PageArtEditor可选可重复15本版图编PagePicEditor可选可重复16本版责校PageProofreader可选可重复17本版版式PageLayout可选可重复4.1.5 新闻元数据新闻元数据包括了报纸新闻的基本信息,见表4。序号中文名称英文标签必备性可重复性备注(对应DC)1期次唯一标识符VolumeIdentifier必备不可重复2版次唯一标识符PageIdentifier必备不可重复3新闻唯一标识符NewsIdentifier必备不可重复标识符(Identify)4新闻标题NewsTitle必备不可重复题名(Title)5新闻引题NewsPreTitle有则必备可重复6新闻副题NewsSubTitle有则必备可重复7作者NewsCreator必备可重复创建者(Creator)8来源NewsSource有则必备可重复来源(Source)9体裁NewsGenre可选可重复依据GB/T2009310头条NewsHeadLine可选不可重复11报眼PageEar可选不可重复12连载信息ContinueFlag可选可重复13