金税三期工程1金税三期工程数据架构蓝图设计方案V1.0汇报人:总体规划设计项目组金税三期工程2目录1、概述2、数据分布3、数据交换与共享4、元数据5、数据治理6、通用数据标准金税三期工程3数据架构的目标以科学的信息资源观和规划理念,基于合理设计的应用系统的体系结构,并以信息利用能力为目标,构建全局化、规范、统一的数据架构,提高应用系统运行性能,提升税收数据的分析利用价值信息资源(InformationResources)与人、财、物资源一样,都是企业的重要资源,金税三期工程41.功能性:满足当前应用的需要。2.灵活性:适应应用功能在一定范围内的调整和扩展。3.长期性:业务数据一旦形成,保证在后续任意时段的可利用。4.前瞻性:为后续新业务提供支持。5.增值性:服务社会,服务国民经济。数据架构规划原则增值性前瞻性功能性灵活性长期性…数据架构规划金税三期工程5数据架构定位1、数据架构位于应用架构和基础技术架构之间,承上启下。2、应用架构的输出,是数据架构重要、核心的输入;数据架构规划是应用架构落地过程中的重要支撑。3、数据架构中数据逻辑分布尽量遵从于业务架构和应用分布。4、数据架构中的数据物理分布是从技术视角看逻辑分布,结合数据库技术、灾备等,给出相应的规划方案。5、数据物理分布中的技术发展可能带来数据逻辑分布的优化,从而促进应用架构的完善和改进。金税三期工程6架构规划内容数据架构规划的关键内容包括数据分类、数据逻辑分布、数据物理分布、数据共享交换、数据治理、数据标准数据架构数据逻辑分布通用数据标准数据架构蓝图数据生命周期管理数据产生数据处理数据存储数据应用数据归档数据管理体系数据质量管理数据安全管理数据治理数据共享交换内容数据交换共享机制数据交换共享数据质量管理方案数据物理分布当期操作数据近期操作数据统一视图管理决策数据历史数据……数据分类数据架构规划内容数据分类•从多个角度包括业务、数据生命周期和数据本身特点对税收产生的数据进行分类,从而分数据的分布夯实基础;数据逻辑分布•从逻辑的角度对业务环节产生的数据进行合理的规划;数据物理分布•基于逻辑分布和应用架构的划分,从技术的角度对数据的落地进行详细的规划、分析和合理布局,支撑应用落地和解决全国大集中性能问题;•数据交换共享•从总局与外部,总局与省局,总局内部各部门间出发,规划数据交换共享的机制和内容•数据治理•从数据的生命周期管理、数据质量管理和数据安全三面进行规划;•数据标准•简单规划数据标准内容体系;金税三期工程7工作思路数据特点分析业务战略IT战略运营战略业务架构应用架构数据分类原则和内容数据分布方案数据共享和交换数据管理方案数据标准与设计规范业务、IT、运营战略分析1业务架构分析2数据逻辑模型分析3数据生命周期分析4应用架构分析5数据集成分析67金税三期工程8现状分析缺乏统一的规划,多以迅速实现功能为主要目的,缺乏从全局的考虑,造成了数据孤岛、多头采集、业务数据分散、标准不一等问题。数据达不到全面性、规范性、一致性的要求,降低了内部管理的效率,不能为决策分析提供严谨、全面、细致的数据基础;数据的实时监控能力不强,缺乏掌握全面、及时信息的渠道,无法满足“信息管税”的业务发展趋势,缺少对全国数据的高效利用、业务集成度要求不断提高的支持。金税三期工程9数据架构的需求1.全国国地税税收生产数据在总局集中存储和处理,生产数据的第一次落地点在总局。2.满足应用系统间的松耦合性,实现应用系统间的故障隔离。3.建立数据共享、交换的机制,明确数据内容,保障数据的时效性。4.建立数据全生命周期管理机制,保证系统持续稳定高效地运行。5.建立完备的数据仓库体系,为面向管理决策的应用奠定基础。金税三期工程10目录1、概述2、数据分布3、数据交换与共享4、元数据5、数据治理6、通用数据标准金税三期工程11目录数据分布数据分类数据分布内容典型场景金税三期工程12按业务环节进行分类数据分类方式数据分类税务数据分类就是满足各种数据对数据组织的要求,并独立于具体的数据模型和数据分布按生命周期进行分类按数据结构进行分类金税三期工程13举例:按业务环节进行分类业务环节数据子类数据内容描述税务登记法人基本信息法人的基本信息、状态和关系税务认定税(费)核定信息纳税人应纳税(费)的税(费)种、税(费)目、税(费)率、征期类型、申报期限、纳税(费)期限、征收方式、预算科目、预算级次、金库名称等信息税收优惠优惠信息纳税人享受的各类优惠信息,包括减(抵)免税、税前扣除、增值税即征即退等信息发票税务机关进销存信息税务机关的库存信息,包括发票计划、入库、调拨、核销等信息凭证信息发票计划表、发票出入库单等申报申报信息各种申报记录,包括自行申报、委托代征申报、代扣代缴申报、个人所得税申报等征收应征信息应该征收的税费信息计会统税收计划信息各类税收收入、规费收入计划明细税务稽查稽查案件信息税务稽查案源、案件的基本信息法制违章类文书责令限期改正通知书等评估审计过程信息纳税评估流程数据、国际情报交换流程数据、特别纳税调整流程数据、纳税人纳税信誉等级认定流程数据纳税服务拓展业务信息通过纳税服务渠道向纳税人采集的民意调查、服务评价、投诉举报等信息外部门交换外部门信息从银监会、组织机构代码中心、工商、公安、统计、海关、国库、银行等外部门交换到税务系统的业务数据,包括税款上解入库信息、企业财务报表、企业银行账号、组织机构代码、工商登记、海关报关单等信息CA认证身份认证信息内外部业务工作平台对税务人员和纳税人进行身份认证所需的各类信息决策支持分析主题数据按照各个分析主题进行组织的业务数据金税三期工程14举例:按生命周期进行分类生命周期数据子类数据内容描述渠道数据身份认证信息内外部业务工作平台对税务人员和纳税人进行身份认证所需的各类信息比对差异信息税务系统与外部门数据进行比对后产生的差异信息生产数据法人基本信息法人的基本信息、状态和关系自然人基本信息自然人的基本信息、状态和关系扣缴义务人信息扣缴义务人的基本登记信息税务机关进销存信息税务机关的库存信息,包括发票计划、入库、调拨、核销等信息统一视图基于税务整体企业级数据模型组织后的细粒度业务数据,并按照(法人、自然人、发票、风险、税务机构、法规、第三方信息等领域)梳理并整合成统一的数据视图管理决策分析数据分析主题数据按照各个分析主题进行组织的业务数据指标维度数据用于数据分析的各类指标和维度数据,包括税源分析指标、征管质量与数据质量分析指标、成本分析指标、社会满意度分析指标等税源分析汇总数据包括收入分析、宏观税源分析、微观税收分析、重点税源分析、税收收入趋势分析、税源管理能力平均分析等。报表数据税务系统产生的各类涉税报表数据,包括税收征管、流转税、所得税、计会统、国际税收、税收法制、税务稽查、出口退税等9类报表的明细数据历史数据在线历史数据征管操作数据的在线历史库离线归档数据按归档年限进行归档的各类业务明细数据和统计数据金税三期工程15举例:按数据结构进行分类生命周期数据子类数据内容描述结构化数据业务数据存储在关系数据库中的各类生产数据和分析数据非结构化数据XML凭证按XML结构保存的各类文书凭证信息影像资料通过影像设备采集的各类文书凭证的影像信息内外网站多媒体资料包括PDF文件、图片、语音、视频,地理信息等金税三期工程16目录数据分布数据分类数据分布内容典型场景金税三期工程17分析应用系统划分、各个应用系统的特性分析应用系统之间的数据关系结合数据分类,将数据划为不同的数据存储集合,形成数据的合理分布架构数据分布数据分布数据的物理分布数据的逻辑分布金税三期工程18数据逻辑分布原则当期数据与历史数据分离操作数据与查询数据分离,减少生产系统压力生产数据与分析数据按不同的数据组织方式分离体现数据的生命周期管理需求:数据的产生、数据的采集、数据的加工,数据的利用和数据的归档几个阶段金税三期工程19数据逻辑分布框架图渠道数据管理决策数据征管生产数据行政办公生产数据历史数据元数据外部交换数据纳税服务数据内部系统管理数据当期征管操作数据近期征管操作数据主数据凭证影像数据统一视图管理决策分析数据金税三期工程20数据逻辑分布框架图渠道数据管理决策数据征管生产数据行政办公生产数据历史数据元数据外部交换数据纳税服务数据内部系统管理数据当期征管操作数据近期征管操作数据主数据凭证影像数据统一视图管理决策分析数据记录当期业务活动发生过程和结果的数据包括与当期操作数据的同构但保留更长时间的数据、实时查询统计和报表所需辅助数据、税源管理数据、按各省清分后的数据通过影像设备采集的各类文书凭证的影像信息和在业务环节中采集或生成的原始业务凭证资料电子明细信息具有高业务价值、跨各业务域被共享使用的核心数据面向业务主题、集成的、历史的细粒度数据面向管理决策分析主题、集成的、历史的、按多个维度深度加工的数据包括在线操作历史数据、脱机存放的历史数据描述流程、信息和对象的数据,涉及数据的技术属性、业务定义以及操作特征金税三期工程21术语说明生产数据:当期操作数据:记录当期业务活动发生过程和结果的数据;近期操作数据:包括与当期操作数据同构但保留更长时间的数据、实时查询统计和报表所需辅助数据、税源管理数据、按各省清分后的数据;主数据:具有高业务价值、跨各业务域被共享使用的核心数据;凭证数据:在业务环节中采集或生成的原始业务凭证资料电子明细信息;影像数据:通过影像设备采集的各类文书凭证的影像信息;分析型数据:统一视图:面向业务主题、集成的、历史的细粒度数据;管理决策分析数据:面向管理决策分析主题、集成的、历史的、按多个维度深度加工的数据;历史数据:包括在线操作历史数据、脱机存放的历史数据;元数据:描述数据的数据,即描述流程、信息和对象的数据。涉及数据的技术属性、业务定义以及操作特征金税三期工程22数据逻辑分布图征管生产数据当期征管操作数据渠道数据外部交换数据管理决策数据行政办公生产数据历史数据税库银政府部门交换数据纳税服务数据内部系统管理数据业务工作信息发布12366自助终端协作网上税局近期征管操作数据统一视图管理决策分析数据管理决策数据仓库管理决策数据集市纳税人管理稽查法制评估审计元数据技术元数据业务元数据管理元数据人力资源财务纪检监察综合办公会计核算发票内部管理网络发票自然人个税认定登记优惠证明纳税人基本账户在线历史数据离线归档数据自然人法人大企业税务机关发票知识库外部信息票证内部管理纳税人关系管理主数据纳税人基本信息代码数据申报征收征收申报纳税人税费账户发票管理纳税人发票账户票证管理纳税人票证账户发票外部管理票证外部管理当期征管操作同构数据省级清分数据查询辅助数据纳税人公共状态信息影像数据凭证资料数据财产税源管理数据金税三期工程23逻辑分布数据内容描述组成子类具体内容渠道数据外部交换数据税库银数据、出口退税报关数据、组织机构代码数据纳税服务数据网上税局、12366、企业端、自助终端、纳税人关系管理内部系统管理数据涉税数据、税务人员身份以及权限数据征管生产数据当期征管操作数据登记、申报、征收、发票、票证、稽查法制凭证影像数据登记表、申报表、出口退税申请表、影像资料等主数据纳税人基本信息、纳税人公共状态、代码数据近期征管操作数据包括与当期操作数据同构但保留更长时间的数据、实时查询统计和报表所需辅助数据、风险处理数据、按各省清分后的数据管理决策数据统一视图法人、自然人、税务机关、大企业、发票、财产、外部信息、知识库管理决策分析数据数据仓库数据、数据集市数据历史数据在线历史数据征管生产数据在一定规则下迁移成历史业务明细数据离线归档数据历史业务明细数据在一定规则下迁移成归档数据金税三期工程24数据物理分布原则生产数据和分析数据分离结构化数据和非结构化数据分离不同生命周期的数据分别存放数据大集中的性能分担降低当期交易数据库的数据量根据业务内聚性,同一业务域的数据尽量放在同一库中满足业务操作的同时,平衡数据查询的代价在分的同时,平衡数据交换和共享的代价在合的同时