基于PDCA循环的审针数据分析
摘要:在总结相关文献的基础上,本文论证了PDCA循环应用于审计数据分析的可行性,并设计了一种基于PDCA循环的审计数据分析流程,确立了审计数据分析的研究技术、方法和基本模型,旨在为审计数据分析提供一种新的可行性方法。
关键词:PDCA循环;数据分析;计算机审计
中图分类号:F239 文献标识码:A
随着被审计单位信息化水平的不断提高,越来越多的企业开始实施ERP系统为审计工作带来了新的风险。企业应用ERP系统后,ERP系统实现了企业的物流、信息流、资金流的统一,使得业务处理能够跨职能部门进行处理,由生产部门开始,采购、生产、销售、库存等各个环节紧密相连,承载着企业几乎全部的关键业务,涵盖了企业最为关键和最为敏感的信息资源;与此同时,ERP系统中与企业经营活动有关的大量采购、生产、销售等各个环节的业务数据和财务数据高度电子化、无纸化,这些数据等都保存在磁性存储介质上,形成了一个统一的、集成的与企业经营管理活动有关的数据仓库。
在ERP系统下,通过职责分工赋予不同人员不同的权限,他们能在各自的操作权限范围内进行有关操作活动,而这种途径也很容易出现访问密码泄露,使得舞弊人员通过ERP系统可以快速的访问、窃取企业的客户资源、企业产能、销售渠道、合作伙伴、人力资源组成等企业重要的信息资源,并作出相应的修改、调整。在此情况下,审计面临的环境发生了改变,企业的各种单据、票证和账簿等与企业生产经营活动有关的数据都存储于磁性介质中,审计的对象从传统的手工账簿,转向对存储在ERP系统底层数据库的电子数据的审计,审计的范围和重点也从单纯的财务数据,扩展到海量的存储在ERP系统底层数据库的电子业务数据和财务数据。审计人员面对的是一个无纸化的审计轨迹,传统的审计线索因ERP系统的使用在形式上变得更加隐蔽,传统手工上的舞弊操作变成了不留任何痕迹的计算机操作,这些都增加了审计的难度,降低了审计线索的可追溯性。因此,如何从纷繁复杂的、海量的、结构化的、非结构化的ERP系统数据中获取有用的审计数据,如何从被审计单位的海量的、结构化的、非结构化的数据中确定审计重点、审计内容以及审计范围,并对这些审计数据进行综合分析,从中查找问题线索和审计疑点,是审计数据分析所要解决的核心问题。
审计数据分析工作的质量在很大程度上直接决定着审计项目的质量以及审计目标的实现,如果审计数据分析工作的质量不高、甚至出现偏差,将会直接影响到审计工作的效率和效果以及审计结论的正确性。因此,加强对审计数据分析工作质量的控制就显得尤为重要。本文在对相关文献研究的基础上,针对如何提高审计人员的审计数据分析能力,以及审计数据分析工作的效率性和质量,提出利用全面质量管理的基本方法PDCA循环,对提高审计数据分析工作质量的问题进行探讨,并给出相应的模型分析。
一、相关研究
《数据审计指南――计算机审计实务公告第33号》指出:数据分析适用于审计计划、审计实施、审计报告等审计工作过程,审计人员应当充分利用历史积累数据,以及数据准备阶段形成的基础表,采用适当的组织方式、方法、技术和工具进行数据分析,以便更高效地选择审计项目、确定审计重点,发现问题线索、得出审计结论。数据分析是计算机审计的重要组成部分,其概念有狭义和广义之分,本文的数据分析是广义的概念,涵盖了数据采集、数据整理和数据分析等方面。在信息化条件下,为有效提高审计工作★的质量和效率,规避审计风险,需要进一步加强对审计数据分析的研究。
目前,有关审计数据分析☃的研究得到了理论界与实务界的广泛关注,其中具有代表性的研究成果有冯国富等(2009)在论述审计分析模型工作原理的基础上,提出了一种基于数据流图的审计分析模型构造方法及其审计工作指南,并提供了一种实际的审计案例,用以演示其工作过程,验证其可行性和有效性;张莉等(2011)提出在审计大型企业集团资产负债表时,依据资产负债表的取数逻辑,采用平行模拟法设计单体公司报表程序,利用关联规则对比分析报表差异项目,结合审计经验,利用统计方法分析异常数据,快速锁定不同公司的疑点科目,仿真结果验证了模型的有效性,并可快速发现多家公司的审计线索,降低了因取数滞后造成的审计误受风险;施永香(2010)分析了常用的审计数据分析方法,并重点阐述了基于Benford法则的数值分析方法;赵辉等(2010)针对非结构化的审计数据问题,提出了关键字检索分析方法在非结构化审计数据分析中的运用,并运用实例进行了相关内容的阐明;王莘等(2007)在FP-growth算法的基础上,提出了一种改进的适用于安全审计数据分析的挖掘频繁模式算法,与FP-growth算法相比,改进算法在挖掘频繁模式时不生成条件FP-树,挖掘速度提高了1倍以上,所需的存储空间减少了一半;吕新民等(2007)针对传统审计数据分析技术的不足,提出了运用数据挖掘技术于审计数据分析中的必要性,并在此基础上对数据挖掘在审计数据分析中的应用进行了研究,总结了应用数据挖掘实现审计数据分析的过程;岳烈骧(2008)设计了一种基于社保审计专业知网和社保审计专业分词字典的异构数据语义分析系统,围绕异构社保数据分析系统实现过程中的专业知识库的构建,对社保专业知识的收集和组织,以及社保审计字段的理解,相似数据项的查找,基于社保审计专业知网的词义消岐等关键核心技术进行了一系列的研究和探讨。尽管这些研究成果促进了计算机审计理论的发展和应用,但大多都是对审计数据分析的方法、技术以及工具进行的研究,而对如何提高审计人员的审计数据分析能力,以及如何提高审计数据分析工作的效率性和质量的研究尚不多见。
PDCA循环是全面质量管理的基本方法,是一种按“P(计划)――D(实施)――C(检查)――A(总结与处理)”的顺序,用周而复始、不断循环向前的方式,提高企业产品质量和改善企业的经营管理。PDCA每循环一次就要对本次循环进行总结,并提出新目标,把未解决的问题进入下一次PDCA循环,PDCA的每一次循环都会促进活动水平的不断提高。目前,PDCA循环的应用已从企业质量管理扩展到许多不同的领域,如企业内部控制有效性、生产工艺安全、高校教学管理、服务绩效管理等各方面。鉴于此,本文将PDCA循环应用于审计数据分析问题,研究如何应用PDCA循环提高审计人员的审计数据分析能力,以及审计数据分析工作的效率和质量;根据PDCA循环理论以及审计数据分析过程的特点,对PDCA循环应用于审计数据分析的可行性进行论证,设计出一种基于PDCA循环的审计数据分析模型,并确立合适的审计数据分析的技术和方法,以期达到提高审计人员的审计数据分析能力,以及审计数据分析工作的效率性和质量。 二、审计数据分析PDCA循环模型
1。PDCA循环理论用于审计数据分析的可行性。PDCA循环又叫戴明环,是全面质量管理的基本方法,是由美国质量管理专家戴明(EdwardsDeming)博士提出的。经典的PDCA循环过程由计划(Plan)、实施(Do)、检查(Check)、总结与处理(Action)四个环节组成,其中计划环节(P)主要是通过对问题现状的调查,分析现状所存在的薄弱环节,明确活动的方针和目标,进行活动计划方案的制定;实施环节(D)主要是活动计划方案的具体执行,这一环节是组织完成活动预期目标的重要环节;检查环节(c)主要是对计划方案的实施情况进行全面而详细地检查,确认实施方案是否达到了预期的目标;总结与处理环节(A)主要是对检查的情况进行总结,将成功的经验进行标准化,以便执行和推广,对失败的教训要进行总结,以免问题重现,并提出相应的整改措施,把未解决的问题放到下一轮PDCA循环。因此,可以把任何一项活动都按PDCA循环划分为“计划(P)、实施(D)、检查(C)、总结与处理(A)”四个环节,通过PDCA循环把活动的各项工作有机的联系起来,不断循环往复向前转动;同时,PDCA循环又是一个递归的体系,PDCA循环的每个环节又可再细分为另一个PDCA循环,这样就形成了大环套小环、环环相扣不停地滚动前进的螺旋上升体系,如图1所示。每一次PDCA循环都会把活动的目标或标准推向一个更新的高度,如此往复不断循环,活动的目标或标准将会不断得到提升。
审计数据分析是计算机审计的一个重要环节,是围绕审计项目展开,对存储在被审计单位信息系统底层数据库中的海量业务数据和财务数据,从不同层次、不同角度进行分析,以便找出问题,获取审计线索,发现审计疑点。在审计数据分析过程中,如果没有采取合适的审计数据分析技术和方法,或者没有采用必要的控制措施,都会对数据分析工作的效率和质量产生一定的影响,从而带来审计风险,影响审计目标的实现以及审计结论的产生。针对审计数据分析过程中可能会存在的问题,需要加强审计数据分析。有效的审计数据分析是产生可靠、准确的审计结论的前提,而可靠、准确的审计结论又需要有效的审计数据分析。因此,审计数据分析是计算机审计流程中的一个重要环节,其分析过程是:
首先,结合被审计单位的特点,调查了解被审计单位的主要业务流程(包括采购流程、产品制造流程、商品销售流程等)、被审计单位信息系统部署和电子数据的详细情况,以及企业业务流程在被审计单位信息系统中的反映,明确审计目标、审计范围以及审计重点,确定审计数据分析方案。
其次,根据审计数据分析方案来采集数据,并对采集数据进行清理和转换,搭建分析环境,按照预定的审计目标展开数据分析,找出问题或者存在的薄弱环节,发现审计线索。
第三,对数据分析过程进行审核,编写数据分析报告,总结审计方法,对未达到审计目标的分析原因。提出有针对性的改进措施,并在下一个审计项目中进行改进。如此不断循环往复,达到不断提高审计数据分析工作的效率性和质量。
由此可见审计数据分析过程在逻辑上与PDCA循环理论存在着一致性,都是通过不断地循环往复,促进过程整体水平或质量的不断提高。因此,PDCA循环理论用于解决提高审计数据分析工作的效率性和质量是可行的。
2.审计数据分析的PDCA递归模型。依据PDCA循环理论,审计数据分析的过程可以分为P、D、C、A四个环节:(1)计划环节主要是编写数据分析方案。调查被审计单位的基本情况和主要的业务流程,了解被审计单位信息系统的部署和被审计单位主要业务流程在信息系统中的反映,以及被审计单位信息系统的电子数据基本情况,如数据处理流程、数据类型、数据量等。在此基础上分析存在的问题或者内控薄弱环节,明确审计目标、审计内容、审计重点和审计范围,制定审计数据分析措施计划,确定审计数据分析方案。(2)实施环节主要是根据编制的审计数据分析方案,对审计项目开展数据采集、转换、清理、验证和创建审计中间表等系列数据准备工作,经过一系列的数据准备工作,根据电子数据的特点和规律,构建审计分析模型进行审计数据分析,并对模型运行结果进行分析,对发现的线索进行延伸,调查取证,核实问题。(3)检查环节主要是检查审计数据分析方案的执行效果是否达到预期的目标,编写审计底稿。检查的内容主要包括审计数据分析方案是否全面完成,数据选择的是否准确、可靠,数据分析方法的选择是否合理等。(4)总结与处理环节主要是对审计数据分析的总体情况进行总结,形成数据分析报告,将成功的审计方法纳入有关的标准、制度和规定中,以便以后的推广;对失败的教训进行总结,分析存在的问题或者薄弱环节和未能达到审计目标的原因,提出有针对性的改进和解决措施,交给下一次PDCA循环,在下一个审计项目中予以改进。
如图2所示描述了审计数据分析的总PDCA模型,PDCA循环是一个不断循环向前转动、整体呈现螺旋上升状态的闭环系统。审计数据分析按“P-D-C-A”的顺序进行数据分析活动,并且周而复始地向前进行,一次PDCA循环结束都要对本次循环进行总结,将成功的审计方法进行制度化、标准化,加以执行和推广,并提出新的目标,然后制定下一次PDCA循环。一般来说,上一次PDCA循环是下一次PDCA循环的依据,而下一次PDCA循环又是上一次PDCA循环的落实和具体化,如此不断循环往复,审计数据分析工作的效率性和质量将会得到不断改进、不断提高。
图2描述的审计数据分析的总PDCA模型,由于PDCA循环是一个递归体系,审计数据分析的总PDCA模型中的P、D、C、A每一环节又可以再细分为一个完整的PDCA循环,即可以用PDCA循环对审计数据分析总PDCA模型中的每个环节进行建模描述,这样就形成了大环套小环、小环套更小的环、环环相扣的有机整体。由于审计数据分析总PDCA模型的实施(D)环节涉及面比较广。可以利用PDCA循环的递归特性进一步对实施(D)环节进行递归建模描述,具体环节内容如表1所示。 由此可见审计数据分析PDCA模型是一个大环套小环,环环相扣,互相制约,互为补充的有机整体。大环是小环的母体和依据,小环又是大环的分解和保证,即审计数据分析总PDCA循环是D阶段的PDCA循环的母体和依据,而D阶段的PDCA循环又是审计数据分析总PDCA循环的分解和保证。各个小环都紧紧围绕着审计数据分析的预定目标朝着同一个方向滚动,推动着大环不断向前滚动循环,通过PDCA循环把审计数据分析的各项工作有机的联系起来,相互协同,相互促进,不断提高审计数据分析工作的质量和效率。
三、审计数据分析技术的确立
对审计数据的分析和处理是计算机审计的主要任务,在审计数据分析的过程中需要构建审计分析模型,而构建审计分析模型需要采用相应的数据分析技术。目前,可以用来进行审计数据分析的技术主要有SQL查询语言、多维分析技术等,这些技术是根据已知的知识去提取符合条件的数据并获取相应的审计线索。但是,由于现代舞弊手段不断提高,这些审计数据分析技术无法获取隐藏在数据背后的审计线索。数据挖掘与传统的审计数据分析技术不同,数据挖掘是从存放在数据库、数据仓库或其它信息库中的大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。运用数据挖掘技术可以利用分类分析、聚簇分析、关联分析以及序列分析等分析方法,对企业ERP系统在运行过程中产生的大量的与采购、生产、销售等有关的业务数据与财务数据进行深入的分析,从中发现蕴含的数据模式和规律的过程,并获取相应的审计线索。因此,本文利用数据挖掘构建审计数据分析模型进行审计数据分析。图3描述了应用数据挖掘进行审计数据分析的过程模型,具体步骤如下:
1.明确审计需求。审计人员结合被审计单位的特点、主要业务流程、所使用的信息系统、电子数据,以及业务流程对信息化的依赖程度等具体情况,根据审计数据分析方案对审计目标、审计内容以及审计范围的规定进行审计需求分析,明确审计需求,并将审计需求转化为数据挖掘具体问题。
2.数据采集与清理,此阶段是实现审计数据分析的前提和基础。根据数据挖掘问题,从被审计单位的ERP系统中采集与审计需求相关的电子业务数据和财务数据,并进行适当的格式转换。当采集的源数据存在值缺失、空值、冗余、错误、数据规范性差等问题时,审计人员必须对웃采集的数据进行一系列的数据清理工作,如重复行数据、列中冗余数据等的识别与处理、空值的处理、字段值缺失数据的处理、数据类型、数据格式的转换、不规范数据的处理等,从而提高数据的完整性、准确性、一致性、唯一性以及有效性。通过对数据的一系列转换和清理工作提高了数据的质量,为后续的数据挖掘建模分析提供了可靠的数据保证。
3.数据挖掘建模分析,此阶段是审计数据分析工作核心。针对不同层次的审计需求,根据被审计单位各业务的财务数据与业务数据之间的关系,选择不同的数据挖掘方法,如分类分析、聚簇分析、关联分析、序列分析等,并进行相应数据挖掘算法的设计及挖掘参数的设定,从而建立不同的数据挖掘模型对审计数据进行挖掘和分析。如运用聚类技术建立审计数据分析模型,通过对相似数据的分组,发现分布模式与数据属性间的关系。
4.结果评价。把通过数据挖掘技术发现的审计知识以可视化的形式显示♂,并对此结果进行解释,帮助解决实际问题,然后根据可用性、正确性、可理解性等评价指标对审计知识进行评价。
5.总结及发布。对评价的结果进行总结,将成功的经验进行标准化,对于失败的教训进行总结。根据审计人员的要求,将以可视化的形式显示的审计知识呈现给审计人员,审计人员运用所发现的审计知识进行取证分析,获取审计线索,发现审计疑点。
以上步骤不是一次性完成的,如果数据挖掘结果不满足审计人员的需求,这就需要将过程回退到之前的某个步骤,如重新选择数据、设定不同的挖掘参数值等。因此,有些步骤可能需要反复进行,不断改进完善并提高,以期达到预定目标,这与PDCA循环理论在逻辑上存在着一致性,如图4所示。因此,通过引进PDCA循环的审计数据分析持续改进运行机制,可以科学、规范、有效地提高审计数据分析工作的效率性和质量,并具有较强的可操作性。
由图4所示,应用数据挖掘进行审计数据分析的PDCA循环模型,将应用数据挖掘的审计数据分析按PDCA循环划分为“P、D、C、A”四个环节,通过PDCA循环把审计数据分析的各项工作有机的联系起来。由于应用数据挖掘进行审计数据分析并不是一次性完成的,某些步骤可能需要反复进行,以期达到预定目标。因此,图4的每一环节又可再分解为一个更小的PDCA循环,这样应用数据挖掘进行审计数据分析的PDCA循环模型是一个大环套小环、小环保大环、小环里又套更小的环、环环相扣的有机整体。在应用数据挖掘进行审计数据分析的PDCA循环模型中,小环是大环的分解,而大环又是小环的母体和依据,各个小环都围绕着预定的目标朝着同一方向滚动,推动着大环不断向前滚动,从而保证审计数据分析过程统一、有序地进行。每一次循环都会使审计数据分析工作的质量提高一步,最终达到审计数据分析工作预定的目标。
四、结论
审计数据分析是计算机审计的一个重要环节,通过对审计数据的分析可以从中发现有价值的审计线索。本文运用经典的PDCA循环理论,设计了一种基于PDCA循环的审计数据分析流程,并确立了采用数据挖掘技术进行审计数据分析。基于PD-CA循环理论的审计数据分析是一种持续改进、螺旋上升的工作模式,目的在于通过对审计数据分析过程的计划、实施、检查及总结与处理环节的PDCA循环建模,不断提高审计人员的审计数据分析能力,提高审计数据分析工作的效率和质量。
本文只是从理论上探索了将PDCA循环理论运用于审计数据分析流程,在基于PDCA循环的审计数据分析模型中,最重要的是审计数据分析技术和方法的选择,以及审计数据分析模型的建立。审计数据分析模型建立的如何,将直接影响到审计数据分析工作的质量,并有可能进一步影响到审计结论的正确性。本文没有进行实证研究,只给出了基于PDCA循环的审计数据分析的思路和框架,若将PDCA循环应用于审计数据分析的ϟ实际工作,还需要从理论到实践进一步深入研究。