审计过程中的信息收集、整理和分析

来源：刘铁刘明暄 2012-04-19

普通

　　审计人员在审计过程中，涉及被审计单位生产、经营活动过程中产生、获取、处理、存储、传输和使用的相关信息资源，对被审计单位信息资源收集、整理和分析，贯穿于审计的过程之中。笔者结合审计实践，从信息科学的角度，谈谈在审计过程中如何作好信息收集、整理和分析，供大家借鉴、参考。

　　一、信息科学理论在审计信息收集中的应用

　　审计信息收集是由审计人员对被审计单位信息进行收集，通过定性、定量的手段，进行深层次的加工，完成审计项目目标要求的信息收集。审计人员对被审计单位信息收集的整个工作流程，包括收集、整理、评价、测量和反馈五项内容。在对信息进行收集整理、重新组织后，使之由无序变为有序，以实现对信息价值进行评定，达到去粗取精、去伪存真的目标。

　　《科学技术信息系统标准与使用指南--术语标准》指出：“信息是物质存在的一种方式、形态或运动形态，也是事物的一种普遍属性。一般指数据、消息中所包含的意义，可以使消息中所描述事件中的不定性减少。”可见信息是整个客观物质世界运动时产生的伴生物，信息与人们的思维活动如影随行。

　　使人可感知的、能直接感知的信息只有一小部分，大多数信息，人们通过信息的载体加以感知。信息载体是人类社会生产、生活和管理过程中所涉及到的一切文件、资料、图表和数据等信息的总称。由于数据可以将信息进行转化和便于保存和处理，审计人员最习惯于将数据首选为被审计单位的信息的载体，通过对数据加工形成审计可用的信息产品。在对数据加工的过程中，信息科学、信息论以及信息技术自觉或不自觉地被审计人员加以应用，以解决审计业务活动中了解情况、发现问题，确定审计应对措施以解决审计目标要求与实际情况间的差距。

　　信息科学是研究信息的获取、存贮、变换、传递、处理、利用和控制的一般规律，以计算机等技术为主要研究工具，以扩展人类的信息功能为主要目标的一门新兴的综合性学科。信息科学研究内容包括：阐明信息的概念和本质（哲学信息论）；探讨信息的度量和变换（基本信息论）；研究信息的提取方法（识别信息论）；澄清信息的传递规律（通信理论）；探明信息的处理机制（智能理论）；探究信息的再生理论（决策理论）；阐明信息的调节原则（控制理论）；完善信息的组织理论（系统理论）。审计人员在审计中，应用信息科学理论，对被审计单位的数据要进行确认识别、掌握其计量和转换规则、提取方法、多重数据的筛选技术，掌握被审计单位的数据形成机理和调节原理等，对收集的数据加以转换，形成可用的审计信息，以完成对被审计单位相关信息的全面掌握。

　　信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。如克劳德·香农（Claude Elwood Shannon,1916-2001）的“信息熵”的原理和数学表达式。信息论中，熵是一个表明单一系统混沌程度的状态量，被用来衡量一个随机变量出现的期望值。它代表了信号在被接收之前，传输过程中损失的信息量，称为信息熵。信息熵也称“自信息的平均信息量”。信息熵是用于度量信息量的一个概念。信息熵也可以说是系统有序化程度的一个度量，一个系统越是有序，产生高信息度的信息熵则低。反之，低信息度的信息熵则高，系统越是无序。具体面言，凡是导致随机事件集合的肯定性，组织性，法则性或有序性等增加或减少的活动过程，都可以用信息熵的改变量这个统一的标尺来度量。信息熵与“信息平均信息量”的区别在于信息熵面对的是整个信源，它描述的是信源的每一个输出信号平均的信息量。而“信息平均信息量”，只是针对特定的信息而言的。此信息中不包含信源所有可能的输出信号。

　　审计人员对被审计单位的管理信息系统数据进行分析、提取、筛选后，形成可用的审计信息集合。由于被审计单位的信息的混沌程度不同，可能在相关数据整理后，同一类审计事项可形成多重信息，这就要求审计人员对信息集合进行归纳、整理、分析，得出被审计单位的不同类、款、项的管理信息。每项信息其“信息平均信息量”构成对该项信息失真度的判断。信息失真度的判断的条件基于审计人员的职业水平和审计信息的收集方法，它决定了审计抽样的规模大小。

　　通常在审计过程中，审计人员首先关注被审计单位管理信息中会计信息系统的清晰程度。会计信息反映了被审计单位的价值运动及其属性的一种客观表达,包含相互关联,互为制约的“数据输入,系统转换,信息输出”三个有机过程，它是整个会计行为系统的核心部分。会计信息反映了被审计单位在过去特定时间内所发生的资金的取得，分配与使用的信息。实质是各种利益关系的反映。通过会计信息，可了解被审计单位过去一特定时间内的经济活动；控制目前的经济活动；预测未来的经济活动。

　　对会计信息真实性、会计信息失真程度的关注，要求审计人员运用“信息熵”的原理对会计信息产生的信息源进行判断。如果审计目标单一，被审计单位业务领域单一，被审计单位管理信息系统越健全、有序，会计信息越清晰，信息的冗余度越低，则可信度就高，即信息熵低，采样量就低。如果审计目标多元，一个被审计单位的业务领域宽泛且相互交插，供应、生产环节、客户体系庞杂，被审计单位管理信息系统交叉，会计信息产生的信息源包含着多个符号消息，冗余度高，审计人员需要通过收集多渠道的信息，对信息熵进行估算，对数据初步裁减过滤，生成信息熵集合，计算输出函数，估计信息的失真度，决定抽查的规模和重点。实现用真实的信息消除不确定性的东西。

　　二、信息整理是审计中的重要一环

　　被审计单位整个生产经营和管理活动的信息系统中包括：生产管理、财务会计、物资供应、销售管理、劳动工资和人事管理等子系统。在以往审计过程中，审计人员通过纸张、胶卷、胶片、磁带等载体感知审计信息。目前，这些审计信息的有形载体随着计算机在数据管理领域的普遍应用，被审计单位生产经营和管理活动的系统信息以数据库方式存在，其特点之一是信息以一定的数据模型，通过描述数据本身的特点和描述数据之间的联系，审计人员可方便地开发和使用被审计单位的数据库，从中获取实现审计目标的信息。审计信息是根据审计目标的要求从被审计单位数据库中取得，并根据要求决定取舍。国内外已经开发建设了成千上万个数据库，但其共同特点是一个长期存储在计算机内的、有组织的、有共享的、统一管理的数据集合。一般而言，审计人员首先接触的是被审计单位财务会计信息系统。财务会计信息所描述的内容，实质是用货币表现出来的经济活动。审计人员为证实被审计单位的某一项经济活动的真实、合法、效益，要通过对取得的被审计单位的会计信息加以整理，信息整理是审计中的重要一环。信息整理分以下三个步骤：

　　第一步是取得数据。审计信息的取得一般从抽取相应数据库中的数据开始。审计人员可从被审计单位不同的管理信息子系统中，针对某一审计关注的问题进行数据采集，形成关联的审计信息。如审计目标要求审计某单位的“原材料采购”的真实、合规、合法性。审计人员应从被审计单位财务会计数据库中抽取一定时间内的结算凭证如：付款或交定金、入库单，发票，合同的复印件、退货业务等；从被审计单位物资供应数据库中抽取相应的供应商、采购合同、询价和方案对比、采购计划，采购员、入原材料库、入库凭证、合格证、质量检验等对应数据；从生产管理数据库中抽取产生需求、用量、标准、废品率、报废处理等数据。

　　第二步是对取得数据进行数据加工形成信息链。对同一事项在不同管理信息子系统中的数据进行加工，将初始的、零乱的和孤立的数据进行整理，形成信息集合。通过对信息的归类和链接，构成信息间的相互连续、映对的审计信息。同时，对相互连续、映对的审计信息进行分类和排序，便于存储、检索、传递和使用。对形成的审计信息通过筛选、对比和判别，在多条原始信息中，识别真假信息和真伪信息。

　　第三步是将满足审计目标需要的信息，构建其经济活动的完整信息图像，即形成该项经济活动的资金流、物流、相关方面活动的路线图。整理后的审计信息，形成相互联系、相互对应、相互切换的信息集合，从中判断被审计单位的经济活动是真实存在，还是虚拟作假。

　　三、对信息分析和分析手段是审计风险评估的基础

　　审计信息分析是审计人员根据审计目标的需要，对相关信息进行深层次的思维加工和分析研究。它侧重于对整理后的信息集合进行重组后的分析。它既目标和任务相连，又与研究对象有关，又是审计风险评估的基础。

　　审计人员通过信息整理得到的被审计单位经济活动的多项信息资源后，通过对信息对再整理，根据审计目标要求，对重新整合后的信息进行分析。此时的分析，往往是集成多种方法来实现的。如统计学习方法、机器学习方法、不确定性理论、可视化技术和数据库技术。但比较和分析，是最常用的方法。通过整理后的被审计单位信息集合，分类、分角度、分层次回答了审计关注的问题。审计人员可将相关联的信息结合被审计单位的经济活动，对各个事物的内部矛盾的各个方面进行比较，就可以把握事物间的内在联系，认识事物的本质，认识不同事物间的差异，找出问题、确定目标、拟定方案并作出选择。在实际工作中，比较和分析可以是定性的，也可以是定量的，或者是两者间的结合。定性分析方法一般不涉及到变量关系，主要依靠人类的逻辑思维功能来分析问题；定量分析方法肯定要涉及到变量关系，主要是依据数学函数形式来进行计算求解，如回归分析法、时间序列法等。由于信息分析问题的复杂性，很多问题的解决既涉及到定性分析，也涉及到定量分析，因此定性分析和定量分析方法相结合的运用越来越普遍。审计信息分析的内容是经过审计人员整理后的信息，在具备可利用的审计信息后，存在大量不相容的信息，将不相容信息问题解题，以往是通过人脑“出点子、想办法”的思维活动解决，它强调人脑从原始信息中获取创造性信息的能力。

　　随着信息开发的可拓方法的发展，可拓学在人工智能等相关领域的应用，如信息开发的可拓方法。应用计算机模拟人脑解决不相容问题。可拓方法包括信息开发的发散性方法、蕴含性方法、可扩性方法、共轭性方法、相关性方法等。它们源于物元的可拓性，即物元的发散性、蕴含性、可扩性、共轭性和相关性。其理论基础是物元可拓性理论可以支持以信息和知识的内在联系为基础的知识表示。例如用蕴含性方法开发利用信息的作用主要表现在如下几个方面：开发事物的“因果关系”信息，使人们不仅能“知其然”，还能“知其所以然”，其依据是“原因结果”的蕴含性；开发事物的“手段-目标”信息，使人们可以利用目的变通的方法解决不相容问题，其依据是“手段目标”的蕴含性；挖掘事物变化的传导效应或传导信息，其依据是“主动变换传导变换”的蕴含性；开发事物的“局部-整体”信息，分析事物的层次结构关系或种属关系，其依据是“整体局部”的蕴含性；由表及里，由外及内，透过信息的表面涵义，获取信息的深层含义，获取信息背后的信息，从而为人们认识分析事物的本质奠定基础。

　　审计人员进行信息分类、分析、开发时，无论采取何种信息开发方法，都要围绕审计目标进行。同时信息分析终究也解决不了审计项目中的所有问题，它只能给审计人员在规定的时间内，对被审计单位信息做出相对全面的掌握，因此对信息分析和分析手段是审计风险评估的基础。

　　根据审计风险=固有风险×控制风险×检查风险三个要素构成原理。审计人员可进行控制和管理的审计风险要素中，检查风险是唯一可以控制的。审计人员对检查风险实现最大限度的控制，是通过对审计信息的收集、整理和分析实现的。

　　以前在审计风险评估工作中，多数是靠审计人员的经验来加工信息，即使需要的少数运算也只局限于简单的算术运算和简单的统计加工。目前，审计人员在审计实践中总结和积累了审计风险评估模型，通过计算机辅助审计手段，对取得的信息数据进行计算，从而得出审计风险数值。计算机数据处理系统一般备有三个库，即数据库、模型库和方法库。审计人员收集、整理和分析后形成的审计信息，构成了数据库必要的信息，其信息不仅仅反馈出的审计关注的各类信息的计数和数据频数统计，而且也为实现计算机辅助审计提供了计算模型的各种因素间的定量或定性的相互关系，成为设计审计模型库的基础。审计人员可通过以往审计风险评估数学计算方法（例如回归分析方法、趋势外推方法、博弈方法等），逐步从模型估计转移到模型选择上来，通过收集、整理和分析后形成的审计信息，把模型的结构也作为搜索过程的一部分，通过信息分析和分析手段实现对检查风险的控制，根据审计目标要求决定审计实质性测试和抽查的规模和数量。

　　总之，审计人员在审计过程中作好信息收集、整理和分析中，对调查和掌握被审计单位其相关情况、评估被审计单位存在重要问题的可能性、控制审计风险、确定审计应对措施等方面都非常有效，有助于完成审计目标任务。

　　主要参考资料：

　　1．《科学技术信息系统标准与使用指南--术语标准》全国文献工作标准化技术委员编。

　　2．《可拓集合的分类性质和信息开发的可拓方法》何斌，张应利。

【我要纠错】责任编辑：zoe