龙源期刊网大数据环境中的审计技术与方法作者:杨静来源:《现代审计与经济》2016年第06期一、大数据对审计工作的影响为适应大数据新常态,利用海量数据进行审计监督,审计机关必须做出一系列转变。(一)审计方法转变。大数据审计将彻底改变以往基于抽样方法的审计模式。抽样审计模式,由于抽取样本的有限性,而忽视了大量的业务活动,无法完全发现和揭示被审计单位的重大舞弊行为,隐藏着严重的审计风险。在大数据时代,数据的跨行业、跨企业搜集和分析,可以不用随机抽样方法,而采用搜集和分析被审计单位所有数据的总体审计模式。要实现大数据环境下的总体审计模式,要求审计人员用总体审计的思维模式去分析与审计对象相关的所有数据。同时由于大数据大样本、全量分析技术的大量应用,将使审计人员不再局限于抽样样本,而是着眼于全部数据,去发现和反映问题的本质,使之更具全面性、整体性。(二)实施方式转变。大数据时代下的信息化审计使持续性审计成为现实,审计机关可以常态化开展对被审计单位业务运营进行持续监测,定期进行风险评估和专项分析;持续审计将改变传统审计立项在前、实施在后的传统审计方式,以风险为导向,充分依赖数据,转变为先分析、后立项,让审计项目立项更加科学。对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计全覆盖,是党中央、国务院对审计工作提出的明确要求。依托大数据,有目的的整合、分析、研究大数据,开展对大数据的监督,使审计机关对重点资金、重点单位、经济责任开展常态化的审计监督将成为可能,实现有重点、有步骤、有深度、有成效的全覆盖。(三)组织模式转变。这就要求打破传统的以审计小组为单位分散审查的审计模式,转变为以数据为基础,坚持数据分析的思路和方法,开展数据基础式审计。要实现组织模式的转变首先是要摸清信息系统运行特点,全面了解被审计单位(项目、行业)信息系统建设运行情况,包括信息系统的数量、名称、版本、功能模块、管理部门、访问模式、数据存储等。重点开展对信息系统数据资源的调研,详细了解后台数据库的种类、版本、数据量、存储及备份方式等信息。二是紧密围绕审计工作目标,整合全体审计资源。以审计工作目标为导向,成立数据集中分析团队。对被审计单位(项目、行业)数据进行重点分析,发现数据运行和运用过程中存在的缺陷和不足,明确数据分析的思路和方法,为审计工作的顺利开展提供技术支持和数据保障。要坚持数据分析为先导的审计新模式,在分析研究的基础上,指导审计实践工作。三是加强对数据结构的研究,确定重点数据资源。对审计工作来说,大数据中的很多内容与审计无关,与审计重点无关,过分利用和采集数据就会造成审计资源的浪费。要借助采集的数据库设计文档和数据字典,掌握后台数据结构,明确重点领域数据库的范围通过采用新数据测试、代码审查、文档查阅等技术方法确定与审计业务紧密相关的核心信息资源,如重点表、重点字龙源期刊网段、表间关联及字段含义等,为深入开展数据分析做好准备,为审计目标完成提供数据支持和保障。二、审计技术准备面对大数据时代给审计工作带来的挑战,必须不断更新理念、夯实基础、筹划发展,以数据为核心实现信息技术与审计业务的有机融合。(一)数据采集。大数据环境下开展审计工作,需要将各行业各部门的各类数据整合起来,转换成为审计工作需要的大数据。审计机关要建立健全数据定期报送制度,加大数据集中力度,对获取的数据资料严格保密。适应大数据审计需要,构建国家审计数据系统和数字化审计平台,积极运用大数据技术,加大业务数据与财务数据、单位数据与行业数据以及跨行业、跨领域数据的综合比对和关联分析力度,提高运用信息化技术查核问题、评价判断、宏观分析的能力。探索建立审计实时监督系统,实施联网审计。审计大数据采集需要明确采集范围。一是充分利用现有数据平台数据资源,做好数据的及时性储备。审计机关要明确大数据采集的领域和管理数据的部门(包括机构、社会团体、企事业单位等),要求这些部门提供相应数据信息,开放数据资源。二是积极整合大数据。要充分利用“金审工程”,加快与金税、金关、金财、金盾、金宏、金保、金土、金农、金水、金质等信息系统实现跨部门、跨区域共享。三是将以往审计成果作为数据整合的基础性数据资源,充分利用各级审计机关现有的审计数据资源。在数据采集方式上可以采取联网数据共享与采集、定点采集和定期报送方式实现。(二)数据储存。要实现大数据的有效采集,首先应完善数据储存方式。由于大数据的容量大、类型多的特点,造成审计机关采集数据储存方式难。要实现大数据的有效储存,首先应有效整合审计资源,建立多部门、多系统、跨行业的大数据审计资源,从而实现在组织架构、现场管理、数据资源、信息传递等多方面的审计大协同作业。充分利用网络优势,实现联网审计,把大数据实现无缝对接,利用审计技术和手段完成审计目标。其次加快完成审计大数据的顶层设计和统筹规划。刘家义审计长提出:将加快实施“金审三期”工程,拓展大数据技术运用,形成独特的“国家审计云”。给下一步数据储存提供了明确的方向和思路。即完成由云计算到审计云的转变。云计算系统体系的核心是资源层。“审计云”则是以审计专网为基础,依托国家审计信息资源体系建设,将云基础设施与审计信息系统、审计数据中心、审计指挥中心、国家模拟审计实验室等软硬件资源创建在审计专网防火墙之内,以供全国各级审计机关共享和利用审计专网内的资源。(三)数据清理。数据清洗(Datacleaning)是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。审计机关面临的和采集的大数据,将是数据规模庞大、增长迅速、类型繁多、结构各异的,如何将繁杂的大数据变成我们能应付的、有效的“小”数据,即构建针对特定问题的一个干净、完备的数据集,这一过程变得尤为重要。在大数据时代,若不加强数据清洗,则GlGo(垃圾进,垃圾出)现象会非常严重。对数据的清洗之后进行深度分析挖掘的过程就是审计“去粗取精、去伪存真、化零为龙源期刊网整、见微知著”的过程。只有通过清洗与过滤得到干净完备的数据,才能通过分析与挖掘得到可以让人放心的、可用于支撑决策的审计数据基础。数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给实施审计的审计组。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。其中,残缺数据主要是一些应该有的信息缺失;错误数据是指因业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的,这类数据必须经过修正后才能被采集使用;重复数据是指重复记录和重复字段,审计数据采集时往往会出现此类问题,需要进行数据整理。数据清洗是要对于每个过滤规则认真校验,将废弃的数据过滤掉,保证数据的清洁、完整,保证审计查询结果的正确性。(四)数据分析。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。依托网络化管理及云计算技术逐步将各个数据平台、各个数据中心及各级审计机关数据资源进行整合,最终建立起审计大数据环境资源平台是大数据环境下审计工作的基础,而进行大数据分析是审计成败的关键。在审计机关大数据审计顶层设计过程中,应重点关注数据分析平台建设,将取得多个部门的数据进行关联性分析,研究出有针对性的,依据不同技术水平审计人员设置不同的数据分析平台。对专家型人才可以开放一个保存数据原始面目的基础数据平台,而对于只能利用简单查询语句或者通过按键操作的普通审计人员来说,亲切、易操作、界面简单的应用数据平台可能更加能够发挥审计人员的作用。针对大数据开展审计的主要目的仍然是完成相应的审计任务,达成审计目标。通过数据分析,按照审计要求完成数据查询、趋势分析、政策执行等方面的工作,使审计工作更具效率、效果,为实现审计“全覆盖”创造有力条件,即是达到了开展大数据审计的初衷。三、人力资源准备面对大数据时代,要求审计人员积极应对电子数据高度集成、数据量巨大、数据结构复杂、数据类型多样的数据特征给审计工作造成的挑战。2015年2月,全国审计工作会议对大数据审计提出三点要求:数据归集要全、数据分析要深、技术手段要新。要达到这个要求,首先是人才的推动。审计机关急需培养一批懂得大数据,收集大数据,并且善于研究大数,据,深挖大数据的专家,急需培养一批懂审计、懂计算机、懂大数据的复合型审计干部。(一)从高校毕业生中选拔一批数据管理、采集和分析专业的毕业生,作为专业性人才充实审计队伍。利用他们的专业知识和专业能力强化审计队伍大数据处理和分析能力。(二)从专业领域聘请一批专家型人才,进入审计专家库,利用专家结合审计工作实际做好大数据审计顶层设计,建立审计分析数据平台;也可以联合高校、专业公司设计出适合专家分析、审计人员实际操作的,适应不同审计人群的数据采集、分析、审计软件。龙源期刊网(三)加强岗位技能培训。依托计算机审计中级培训,增加引入外部数据,开展多维总体分析、数据对比、关联关系配比分析、跨行业跨区域关联分析等学习内容强化审计人员适应大数据的能力,同时可以设立领军人才培养机制,力争多出人才,多出能够胜任大数据审计任务、达成审计目标的领军人物。(作者单位:陕西省审计厅)图片新闻近日,山阳县审计局在帮扶的中村镇十八盘村召开了“养殖技术培训暨良种仔猪发放现场会”,邀请县农业部门专家对养猪技术进行了全面细致的培训指导,向78户贫困户免费发放良种仔猪78头极大的调动和激发了贫困户自主脱贫的信心和决心。徐高锋智慧亚锋龙源期刊网