税源专业化管理模式下数据分析系统的应用浅析
一、涉税数据分析系统的概况
当代数据分析技术对税收信息化建设的影响
我国税收信息化建设作为现代税收征管体系中的重要方面,从上世纪八十年代初起步至今,经历了从小到大、从简单到复杂、从自行开发到统一平台的发展历程,各级税务机关软、硬件建设均已达到一定水平。特别从1994年起,作为国家电子政务十二金之一的金税工程先后经历一、二期建设阶段,三期工程已正式在全国六省、市国地税机关先行试点。 作为阶段信息化建设的成果之一,各级税务机关都已积累了大量税收业务数据,包括税务登记、纳税申报、税款征收、发票管理、纳税评估、税务稽查等环节产生的涉税信息资源,已经成为税收工作不可或缺的重要内容。但由于缺乏有效的监控工具,税务机关难以对这些数据进行深层次的分析,从而获得更有价值的信息。另一方面,大量错误数据的存在,阻碍了税收征管信息系统的运行质量和效率。因此,对这些涉税数据进行深度挖掘、整合、加工显得尤为迫切,引进数据分析理念与技术手段,将成为今后一段时期税收信息化建设的重点。通过在税务管理的全过程中实施全面数据分析,充分利用科学有效的分析手段对涉税数据进行深入分析处理,为强化税务机关征收管理和领导决策提供强有力的支撑。在今后的管理决策中,应当逐步形成无数据不发言、科学数据会说话的思维认知,将以往的感觉决策、经验决策改为现在及将来的理性决策、数据决策。
我们认为,在当前全新的税源专业化治税思想理念下,现代数据分析技术将是充分发挥税收信息化支撑作用,确保税务机关有效实施税务管理的关键。
涉税数据分析系统的工作流程及架构
涉税数据分析系统的工作流程主要包括涉税数据收集、数据仓库建立、数据模型创建、数据加载分析、结果运用。建立数据仓库是数据分析工作的基础,数据加载分析是涉税数据分析系统的核心,也是其最主要职能;是依据分析要求从数据仓库中获取不同类☮型的数据,并通过数据模型对获取的数据进行加工、处理、分析,然后以报表、图形、模型或者单个数字的形式给出结果。当前涉税数据分析系统建设的重点就是数据仓库的创建与税收风险管理模型建设与开发。
结合目前我国税收管理工作的组织架构和现代信息技术的建设要求,我们认为,一个科学、完善的涉税数据分析系统,应当主要包括如下三个系统平台:数据支撑平台、分析工具平台和终端应用平台。
1.建立以数据仓库为主要构成的数据支撑平台是基础。建立涉税数据仓库,从源头保证数据应用的标准一致和口径一致,是整个数据支撑平台非常重要的首要环节。必须建立以纳税人报送数据、税务机关征管数据、涉税第三方信息数据、法律法规知识库这四大主题数据仓库,同时在技术功能上还应当包括数据分布与部署、数据定义、数据分类、数据共享、访问与交换接口标准定义等主要功能,为分析工具平台提供稳定丰富的数据基础。
2.建立以数据分析模型为核心的分析工具平台是重点。数据分析工具平台的作用是将数据分析应用的分析指标、分析算法和规则进行统一的管理,并且以各种数据模型的形式表现出来,方便使用。它包括数据项管理工具、模型设计工具、通用分析工具、指标管理工具等若干子系统。分析工具平台可以实现分析应用业务的可持续发展和个性化的数据分析需求,它通过对数据的深加工,最终形成各类分析目的所需的数据集。
3.建立功能完善,人机界面友好的终端应用平台是目的。建设涉税数据分析系统的目的是为管理和决策服务,数据加工的结果必须通过系统终端展示反映出来。从当前税务管理来看,终端应用平台的具体目标应当主要包括领导决策、税收分析、行业税收管理、风险管理等功能。当然随着税务管理的观念、方式的变化,其功能也应当不断拓展、调整。以这三大系统平台为依托,然后再依据不同的数据源和分析方法、应用方向,再分别开发建设若干系统软件,这些应用系统软件相互衔接、相互配合,通过对涉税数据的挖掘、整合与分析,将发现的规律性问题和数据信息本质运用到税务管理中。
二、税源专业化管理中数据分析系统的功能与作用
国家税务总局在全国税务系统十二五规划中明确提出了构建税源专业化管理体系的新时期治税理念,江苏省地税则在此基础上明确提出了打造以风险管理为导向、以信息管税为依托、以分类分级管理为基础、管户与管事相结合的税源专业化管理新体系。
数据分析系统与信息管税和税源专业化管理的关系
1.从税收信息化建设的目的而言,数据分析技术是实现其目的的必由之路。税务信息化建设的目的就是利用现代信息技术,有效利用各类涉税信息,充分发挥信息在税务管理各环节的作用,以达到规范税务管理和执法行为,提高税收决策效率和水平。
显然、在信息化建设的各种手段当中,只有涉税数据的深度利用才能实现上述目的,它将有效地解决税务信息系统内部信息孤岛现象、信息资源分散等问题,使税务系统内部数据信息获取、交换、分配将大为便利,信息处理能力大幅度提高,为税收业务在深度利用丰富的涉税信息资源的基础上向着高度专业化发展创造了条件。
2.从税收信息化进程发展规律而言,数据分析系统建设是其必经阶段。当代信息界经典的诺兰模型理论认为,任何行业的信息化发展都包括初始阶段、蔓延阶段、控制阶段、集成阶段、管理阶段和成熟阶段。经过多年的税务信息化建设,税务机关已经达到了集成阶段,现在税务信息化建设的重点就是数据管理和运用。
今后的税务信息化将在数据集中和系统整合的基础上,利用相关学科的原理、方法和模型,针对大量涉税数据进行深入研究,发现其内在的规律性,用于帮助税务部门做出决策、找出风险、改进纳税服务、提高税收遵从度。
3.从税收信息化进一步深化的方式来看,数据分析技术也是其不二选择。各级税务机关的各类税收征管信息系统在长期的征收管理过程中,积累的大量的业务数据资源使用率低下,大都处于长期闲置状态,并没能发挥其应有的作用。如何从这些看似杂乱无章的数据的信息集中,萃取和提炼出有用信息,以找出所研究对象的内在规律,只有数据分析技术可以做到这一点。随着现代数据分析技术中数据仓库和数据挖掘技术的进一步发展,为这些数据的深度开发利用提供了更为先进的技术手段。对数据仓库中规律特征明显的涉税信息,分析系统可以自动加工处理,有效地解决了人工识别效率不高的问题,进而提高了税源管理的预见性、针对性,减少税收流失风险。
可以这样说,信息管税是实现税源专业化管理的技术依托,而数据分析技术则是现阶段信息管税建设的核心和重点,只有拥有了先进有效的数据分析系统,才可能真正发挥信息管税的作用。我们的税收管理才能实现从人工收税到电脑征税再到信息管税的质的飞跃。
数据分析系统在税源专业化管理格局中的作用
数据分析系统在税源专业化管理格局中的主要作用有以下几个方面:
1.提高纳税服务工作的实效性。涉税数据分析系统可以对办税服务厅的业务量、业务类型、办税时间、纳税人满意度进行统计分析,掌握办税服务厅工作现状,引导办税服务厅有针对性地改进服务措施,合理设置窗口,调配工作人员,提高服务效率。同时通过ARM自助办税终端的数据分析,掌握ARM自助办税终端在办税服务厅分流纳税人,提高办税效率、缩短办税时间等方面发挥的作用,为有针对性地推广ARM自助办税终端提供数据支撑;也可以通过数据分析,针对不同类型的纳税人提供分层次的服务措施。
2.提高税源管理工作的针对性与有效性。在以税收风险管理为导向的税源专业化管理模式下,数据分析是税收风险管理的起点,也是提高税源管理针对性和效率的关键。一是通过对行业税源状况、税负水平及其变化趋势进行分析、评价和监测,制定行业指标体系和行业管理办法,提升行业管理水平。二是通过涉税数据信息的分析,设计合理的指标,建立纳税评估模型和风险指标特征库,增强风险识别的准确性和有效性。三是通过对税收收入,分析宏观税负、行业税负及其变化的分析计算,完善预警指标体系。及时查询、发现、分析管理中存在的或潜在的问题,掌握、预测税收工作的整体情况,提出对应的有效措施,为领导提供准确、高效的决策支持。
3.提高税务稽查工作效率和威慑力。通过涉税数据分析系统,税务稽查人员可以从数据仓库中查找出若干异常企业,然后通过数理统计中行业税负离群点的计算分析,进一步发现异常纳税户,作为稽查重点关注的对象。在实施环节,我们可以将《税收征管法》整理成规则库,在实施税务稽查时利用规则库对税务稽查案件中的涉税违法行为进行定性并提出相应处罚建议。在审理环节,可以将以往税务稽查案件根据不同的性质,将其相关数据整理成范例库,审理人员进行案件审理时,可以通过范例库查找到相似案件,帮助审理人员更加有效地实施案件审理。
三、国内外税收管理中数据分析系统应用的经验与成效
当前世界上很多发达国家和地区在税收管理中早已开始运用数据分析理念和方法。如澳大利亚国税局在风险管理中积极运用数据分析手段;我国香港特别行政区税务局在税收评定、审核中对大量涉税数据采取科学有效的数据分析,都取得了良好的成效,积累了相当的经验。
ATO的税收数据分析人员将采集的内部和外部信息及评估员个人采集的信息输入由专家、行家设定的标准和数学模型方程式中,自动形成财务分析、国际信息分析、欠税情况分析等分析报告,然后评估人员再以个人的经验分析修正报告,确定纳税人的潜在风险,提出处理方法和策略,以达到控制风险的目的。
香港特区税务局早在上世纪八十年代就建成了全港集中的税务计算机中心,并逐步开发建立了相应的涉税数据收集、分析软件系统。该系统和税务应用管理应用系统、对外服务系统一起构成了特区税务局的信息化平台,支撑其高效的税务征收体系。江苏省淮安地税局自2012年以来,积极尝试建立和应用数据分析系统,有序地推进税收风险防范和应对管理。首先,该局全力推进分行业、分规模的数据模型建设,将数据模型部署到全省地税大集中数据管理系统平台。该局组织税务业务骨干,结合本地实际,已建立了采石、餐饮等行业税收风险模型26个;其次,为了提升风险管理部门的风险识别能力,该局独立设置数据分析监控机构,统筹全市风险归集、风险识别、风险等级排序、风险推送、风险应对结果评价等职能,参与风险指标和风险识别模型的建设和维护;再次,该局还通过及时维护征管系统数据,对纳税人的信息进行更新,保证通过数据平台准确判断和识别疑点。该局还进一步加强风险绩效评价,围绕税源专业化管理要求,加强应对人员管理制度和风险平台操作的学习培训,提升风险覆盖面、风险评估有问题率、风险应对贡献率三个指标。仅2013年、该局通过数据平台验证成功268个指标,结合自建模型风险识别生成案源库,分析出风险疑点20余万条,识别户数近11万户次,在进行人工分析的基础上累计推送高、中、低等风险近7千户次,完成税款5亿元。
四、数据分析系统在税源专业化管理中的角色定位
从数据分析技术与税源专业化管理的关系、作用以及它在国际国内税收管理中的应用成效可以看出,它在税源专业化管理当中将承担以下重要角色:
1.从风险管理的角度来看,涉税数据分析技术是识别、处理涉税风险的唯一有效手段。要实现对纳税人税收风险的有效识别、排序、应对,如果没有数据分析技术的定量计算分析,有针对性地发现风险隐患,仅靠税务人员的个人经验和知识水平是无法做到的。只有充分利用数据分析手段,多渠道采集、整理与处理各类税源数据信息,加强税源征管状况监控分析,深化数据的分析与利用,提高纳税评估效率和质量,才能有效防范税收风险,提高纳税人的税收遵从度。
2.从建立管户与管事相结合的税源管理体系角度来说,数据分析技术是建立该体系的技术保障。税源专业化改革所要解决的一个主要问题就是现行税收管理员制度中存在的管理力量增长与管理对象增长的日趋不成比例,管理员权力过于集中的问题。数学分析系统依托其强大的数据收集存储分析功能,将极大减轻管理人员的工作量,使得大量的工作由计算机系统自动完成;同时依据数据模型计算分析出来的风险点也将替代人工经验分析,保证了风险识别处理的科学公正,最大限度杜绝了人为因素对税收执法工作的干扰,实现管理的精细化、集约化。
3.从分级分类管理角度来说,涉税数据分析系统是其技术基础。所谓分级分类管理,是指税务机关先按纳税人规模分类进行管理,在此基础上再分若干行业管理的团队对纳税人进行管理。分级分类管理所面临的首要问题就是税款预算级次的分配管理问题,如果要区分纳税人的税款入库预算级次,统一实行集中管理、属地入库,必须在面对同一个纳税人处于不同管理环节,负责不同管理事项的若干个税源管理机构之间进行数据信息共享,将纳税人的税务登记、申报征收、纳税评估、税务稽查等涉税信息进行互联互通,才能解决上述问题。 4.从税收决策的科学化角度来看,涉税数据分析处理系统是实现这一目标的先决条件。涉税数据分析处理系统实现了对涉税数据的高度利用,通过对这些看似关联度不高的涉税数据加工分析,揭示出数据中反映出的深层次问题,决策者充分认识深层次的问题后,为进一步科学合理的税收决策甚至更高层次的税制设计与优化提供充分的依据,必将进一步推动税务机关各个层面决策的科学性、正确性、针对性。
五、税源专业化管理应用中数据分析系统的问题与对策
税源专业化管理应用中数据分析系统
1.涉税数据特别是第三方信息采集及分析结果运用尚缺乏法律法规保障。目前我国税收法律法规体系中,只在《税收征管法》及其《实施细则》中原则性提到纳税人、扣缴义务人和其他有关单位有义务向税务机关提供与纳税和代扣代缴、代收代缴税款有关的涉税信息。国家应建立管理机关信息共享制度,地方政府应当组织有关部门实现信息共享,但都缺少细化的明确规定。各地省级政府陆续颁布实施的一些☠地方保障办法当中也只有一些概略性条款,并且其法律位阶较低、强制性弱、约束力有限。随着数据管税理念和措施在税收征管中越来越多的运用,如果没有统一的法律法规约束,其运用行为很难规范,运用效果很难得到保障。
2.数据分析系统的建设运用缺乏相关专业人才。数据分析系统建设中最需要的设计数学模型的人才必须是既懂税收法律,同时也具有较强的数学、统计学理论知识才能胜任。而长期以来税务机关对上述人才招录较少,各级税务机关严重匾乏,造成各地税务机关在开发涉税数据分析系统过程中,对最核心的数据模型建设难以深入,即使寻求外部支持,因交流困难,模型建设仍局限于表象描述,无法实现对税收数据有效利用,难以发现深层次问题。
3.数据模型建设各自为政,缺乏总体规划协调。涉税数据分析系统建设中最关键的环节就是数据模型建设。各级税务机关对数据模型的建设都十分重视,从总局到基层县局、分局,都在努力建设各种风险评估模型,总体上缺乏规划。特别对于基层单位,统计学常识告诉我们,样本个数越多,越能真实反映总体的实际特征。绝大多数基层单位管户少、规模小、样本量小,采集的原始数据不能全面反映行业整体经济特征,依据这些原始数据设计开发的数据模型很难全面真实地反映出该行业的真实状况,甚至个别纳税户的异常数据就会对指标设置产生较大的偏离,造成建立的数据模型不具备推广价值。
4.基础数据质量有待提高,第三方信息来源缺乏。从涉税数据信息的总体质量来看,其完整性、准确性、规范性等方面与数据管税的要求还有很大差距。如征管系统中税务机关对房产、土½地等财产税的鉴定数据的准确性还有待进一步提高,很多税种之间逻辑关系不符,企业财务报表数据的质量问题更为突出,不少以往保存导入到新系统的数据准确性低,造成分析出的地区和行业经济指标与实际有偏差,直接导致依据这些指标设置的评估参数及预警域值失真;第三方涉税信息收集过程中,部门协作意识差,数据来源渠道少,数据传递过程不规范、标准不统一,数据质量难以保证。
完善税源专业化管理应用中数ฃ据分析系统的对策
1.从国家层面积极推动涉税数据信息立法。首先,总局应组织专家加强对涉☤税数据分析工作的研究,进一步明确涉税数据采集、存储、分析、利用工作层面。其次,在充分调研的基础上,建议全国人大对《税收征管法》进行修改,细化涉税数据保障信息条款。同时推动国务院制订专门行政法规指导涉税数据分析应用工作,明确涉税信息数据保存、报送、提供,以及税务机关依法采集的应用于税收管理的各种数据、资料、文件等信息使用规范,做到涉税数据分析处理有法可依。
2.与时俱进,重视数据分析人才的引进、培养。要像重视税收、法律等专业人才一样,重视对应用数学、统计学人才的引进。在招考时有针对性地招考具有相关资质人员,以增加数据分析人才的储备。同时在鼓励税务干部报考的五师中增加注册项目分析师,推动税务干部自学应用数学、统计学知识,积极报考相关资质,让人才兴税理念在数据分析领域得到有效的落实。
3.数据模型建设应当遵循集中建设、分散修正原则。首先,总局应以省局为单位,统一布置各省局分别实施不同行业数据模型建设,数据方面应尽可能提供全国性数据,没有全国性数据的可利用全省性数据,尽量缩小总体的方差,使获取的数据更具有代表性。其次,各省局应集中抽调人员组织开展行业数据模型建设,必要时可借助大学和科研单位提供支撑。第三,数据模型基本建成后,应组织各地进行试用,以验证数据模型的合理性。数据模型正式推出后,各地在具体使用中,允许各地依据自身经济发展水平行业和发展状况,对指标参数适当调节,使其更符合当地实际状况。
4.建立数据管理责任制,确保数据质量。要建立从采集、存储、分析、应用各环节环环相扣的质量管理制度。首先,要建立统一数据口径和标准,把好数据入口关,避免数据指标体系相互冲突。其次,必须明确各环节及岗位的工作责任和质量要求,每一环节或岗位都应对本环节或本岗位处理过的数据质量承担一定责任。第三,要加强数据审计的考核,加大考核奖惩力度,对审计出由人为因素造成的错误数据,要严格按照规定实施奖惩兑现。通过数据管理责任制为数据分析应用打下坚实基础,促进数据资源的有效利用。
六、税源专业化管理模式下数据分析系统的拓展与思考
转变观念,让数字说话
数据分析不仅是一个技术工具,更是一种全新的管理理念。税务机关在引入数据分析这一工具的同时,还需根据数据分析工作的要求对现有税收征管业务流程进行整合优化,形成无数据不说话、无风险不应对的管理思想,未经数据分析出风险点的,一律不得擅自对企业进行评估、稽查、评估,稽查也要尽可能围绕风险点去开展。
同时也要认识到数据分析不是万能的,尤其是在税源专业化改革的初期,由于数据质量、分析方法原因等,很有可能导致分析出的结果有不尽如人意,对此要有足够的心理准备,不能因为偶尔的失误而否定、怀疑数据分析的效果,要坚信信息管税的唯一出路在于数据管税。
强化数据分析,明确部门职能与定位
在江苏省地税的税源专业化改革当中,各级数据管理部门承担涉税数据信息的采集、加工、分析、提供和推送,为相关部门实施日常管理、纳税评估、税务检查提供依据;可以说它将是税源管理的神经中枢,是所有风险管理发起部门,也是应对结果的评价部门。它的职能应当进一步强化,地位应当进一步提高,各级税务部门应当在人力资源、管理资源等方面向该部门适当倾斜。同时数据管理工作是一项综合性、全局性工作,它贯穿于整个税收业务流程,涉及所有业务职能部门,为此各部门都要配合其工作,在数据部门的统一指导下做好职责范围内的数据应用工作。
加强第三方涉税信息来源的开拓
第三方是税务机关涉税数据来源的重要渠道,第三方涉税信息是验证税务机关征管业务数据的重要依据。各级税务机关要在现有法律法规框架下,依靠各级政府的大力支持,一是打破部门壁垒,制定完善社会综合治税办法。明确相关部门的职责义务,细化工作要求,提高信息采集的可靠性和及时性。二是积极搭建网络平台,为第三方信息应用提供技术支撑。充分利用网络资源,实现信息的自动传递和监控考核的自动处理。引进政府服务外包理念,积极培育引导民间专业涉税调查咨询机构,由其依据外包合同提供合法有效的第三方涉税信息服务,帮助税务机关提高税源监控水平。