一种财务审计询证系统技术方案

技术编号:19692144 阅读:30 留言:0更新日期:2018-12-08 11:15
本发明专利技术公开了一种财务审计询证系统,包括数据层、基础层、应用层;所述数据层负责包括对所述财务审计询证系统的相关数据进行数据仓储、数据清洗、信息检索、支持基础层模型训练的数据脱敏服务中的至少一种处理;所述基础层包括定向爬虫模块、信息抽取模块、模板系统模块、印刷文本OCR模块、印章识别比对模块、推理引擎模块中的至少一者;所述应用层在基础层和数据层之上构筑的以实现具体业务;所述具体业务包括背调子系统、询证函自动生成、运单自动填写与追踪、回函自动确认与分类中的至少一者。本发明专利技术的财务审计询证系统可以提高工作效率,节约人力成本,同时具备灵活性、可拓展性等特点。

【技术实现步骤摘要】
一种财务审计询证系统
本专利技术涉及财务审计领域,具体涉及一种财务审计询证系统。
技术介绍
按照审计法,企业在经营时需要按照要求进行各种年度审计、专项审计等,审计机构为具有相应资质的第三方专业机构。其中在针对上市公司的财务审计中,为了做到公平、公正,及对股东负责,需要对企业的收入、支出等进行逐笔确认。具体操作过程包括如下4个步骤:(1)审计机构对需要询征的内容向客户(被审计单位)索取被询征方(被审计单位的客户或供应商)的企业信息;(2)审计机构审核、确认被询征方信息;(3)生成询征函并寄给被询征方;(4)收到被询征方寄回的询征函并进行处理(查看结果,情况属实或不属实,并把文件做电子化处理存档,一般为扫描);以上流程各环节目前全部为人工方式进行处理,工作量较大,所以这也是上市公司审计所需时间较久的原因之一。其中以上流程需要人工处理的原因如下:在第1步中被审计单位所提供的信息不可能是不正确信息,即被审计单位有可能提供虚假的信息给审计机构(有可能存在多家企业联合欺骗审计机构的情况),所以审计机构需要先核对信息的真实性。在最后收到被询征方寄回的询征函时,除了查看结果外(结果只有两种,情况属实及不属实,一般为两列,直接在相应列内盖章,不属实的还另外说明原因),也要对询征函的内容进行再次校对,是否为当初寄出的文件内容(以防止出现被询征方虽然盖章在情况属实列,却篡改了询征函的内容的情况)。
技术实现思路
本专利技术的目的在于克服现有技术不足,提出一种财务审计询证系统。本专利技术采用如下技术方案:一种财务审计询证系统,包括数据层、基础层、应用层;所述数据层用于存储和管理系统所需的数据;所述基础层用于提供系统所需的通用基础功能和模块;所述应用层用于向用户提供面对面的服务;所述数据层与所述基础层连接;所述应用层与所述数据层和所述基础层连接;所述数据层负责包括对所述财务审计询证系统的相关数据进行数据仓储、数据清洗、信息检索、支持基础层模型训练的数据脱敏服务中的至少一种处理;所述基础层包括定向爬虫模块、信息抽取模块、模板系统模块、印刷文本OCR模块、印章识别比对模块、推理引擎模块中的至少一者;所述应用层在所述基础层和所述数据层之上构筑的以实现具体业务;所述具体业务包括背调子系统、询证函自动生成、运单自动填写与追踪、回函自动确认与分类中的至少一者;所述数据脱敏服务用于实现对函证的敏感隐私数据进行可靠保护;所述定向爬虫模块用于精准地获取目标网站的信息;所述信息抽取模块用于提取被征询方信息,所述被征询方信息包含以下一种或几种:被询证方的单位名称、地址、联系人、联系方式;所述模板系统模块为询证函自动生成提供模板文件;所述印刷文本OCR模块用于对回函的印刷文本进行汉字识别;所述印章识别比对模块用于对被征询方回函的印章检测与印章内容识别;所述推理引擎模块用于负责整个所述财务审计询证系统工作流的控制和各模块的智能调度;所述背调子系统用于辅助调查被询证方的信息是否属实;所述询证函自动生成用于自动生成询证函;所述运单自动填写与追踪用于自动填写运单相关信息以及追踪运单;所述回函自动确认与分类用于对被征询方回函的自动确认及其分类。进一步的,为了方便系统扩展或与其他系统(平台或应用),本专利技术所述财务审计询证系统还包括接口层,所述接口层用于与其他平台或应用进行对接,而预留的。例如可以通过接口层实现在微信上使用函证辅助系统的部分功能,或者实现函证辅助系统与现有的Excel插件配合使用。进一步的,以上所述财务审计询证系统的所述数据层的数据脱敏服务是对函证涉及的商业敏感信息通过脱敏规则进行数据的变形;所述脱敏规则进行数据的变形包含以下一种或几种操作:信息切割、信息打散、抽样选取。本专利技术的所述数据脱敏指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。函证主要涉及商业相关信息,本专利技术主要通过将信息切割、打散的形式,使得系统开发人员无法根据脱敏后的数据,完整复原出原始的商业相关信息。例如,对于询证函的扫描图像,脱敏过程将每张原始扫描图像切割成若干份,然后再随机抽样选取部分切割后的图像,用于模型训练及系统开发。进一步的,以上所述财务审计询证系统的所述基础层的所述定向爬虫模块用于精准地获取目标网站的信息;所述定向爬虫模块包括引擎、下载器、下载中间件、爬虫中间件、调度器以及至少一爬虫;所述爬虫为负责对某个数据源的页面进行解析,并从中分离出目标信息的程序。定向爬虫是网络爬虫中的一种,用于精准地获取目标网站的信息。进一步的,所述定向爬虫模块包括:引擎、下载器、下载中间件、爬虫中间件、调度器和具体的定向爬虫。“爬虫”应理解为负责对某个数据源的页面进行解析,并从中分离出目标信息的程序。它属于“定向爬虫模块”的一部分。所述定向爬虫模块包含有许多的“爬虫”,每个“爬虫”只负责一个数据源,而整个“定向爬虫模块”则负责对这些“爬虫”的管理和调度。需要说明的是,本专利技术的财务审计询证系统的所述背调子系统和所述运单自动填写与追踪都需要借助所述基础层的定向爬虫模块实现与目标站点的全自动交互。进一步的,以上所述财务审计询证系统的所述基础层的所述信息抽取模块用于提取被征询方信息,所述信息抽取包含命名实体识别和实体关系抽取两项任务;所述信息抽取模块从网络中采用实体命名识别技术提取被询证方信息,所述网络包含以下一种或几种:被询证方公司官网、工商网站、招聘网站。其中,所述实体命名识别技术为深度神经网络模型,所述深度神经网络模型为双向长短时记忆神经网络和条件随机场混合模型。进一步的,所述深度神经网络模型构造包含依次关联的嵌入层、双向LSTM层、CRF层;所述嵌入层根据预训练好的字向量,将输入文本中的每个字由独热编码,映射为低维稠密的字向量;所述双向LSTM层结合上下文信息,自动提取句子特征;所述CRF层,使用Viterbi动态规划算法来求解最优路径,进行句子级的序列标注;所述深度神经网络模型还根据所述序列标注的结果从原始文本中截取相应字符串得到所需的结构化信息。进一步的,以上所述财务审计询证系统的所述基础层的所述模板系统模块包含至少一种模板文件,不同类别的询证业务对应不同的模板文件;所述模板文件包含固定的文本和待替换的变量;所述待替换的变量以点位符的形式保存在模板文件中。进一步的,以上所述财务审计询证系统的应用层的背调子系统通过定向爬虫的技术,分别以待查实的公司名称、地址、联系方式作为检索词,在通用搜索引擎和/或垂直网站上进行搜索,然后将检索结果与被审计单位提供的被询证方的信息进行比对,将比对的结果以可视化的形式直观地展示给审计人员。进一步的,以上所述财务审计询证系统的应用层的所述运单自动填写与追踪包括运单自动填写功能和运单追踪功能;所述运单自动填写功能为通过模拟浏览器的技术,所述财务审计询证系统在计算机内存中自动启动一个无头浏览器,然后通过Javascript脚本读入运单相关信息,再通过Javascript脚本自动填写到运单中;所述运单追踪功能为所述财务审计询证系统采用定向爬虫的技术从快递公司网站定时抓取相关运单的信息,以实时追踪运单信息;所述运单信息包含以下一种或几种:运单历史投递的轨迹、当前投递的情况、运单所处的位置、负责的快递人员及联系方式。进一步的,以上所述财务审计询证系统本文档来自技高网...

【技术保护点】
1.一种财务审计询证系统,其特征在于,所述系统包括数据层、基础层、应用层;所述数据层用于存储和管理系统所需的数据;所述基础层用于提供系统所需的通用基础功能和模块;所述应用层用于向用户提供面对面的服务;所述数据层与所述基础层连接;所述应用层与所述数据层和所述基础层连接;所述数据层负责包括对所述财务审计询证系统的相关数据进行数据仓储、数据清洗、信息检索、支持基础层模型训练的数据脱敏服务中的至少一种处理;所述基础层包括定向爬虫模块、信息抽取模块、模板系统模块、印刷文本OCR模块、印章识别比对模块、推理引擎模块中的至少一者;所述应用层在所述基础层和所述数据层之上构筑的以实现具体业务;所述具体业务包括背调子系统、询证函自动生成、运单自动填写与追踪、回函自动确认与分类中的至少一者;所述数据脱敏服务用于实现对函证的敏感隐私数据进行可靠保护;所述定向爬虫模块用于精准地获取目标网站的信息;所述信息抽取模块用于提取被征询方信息,所述被征询方信息包含以下一种或几种:被询证方的单位名称、地址、联系人、联系方式;所述模板系统模块为询证函自动生成提供模板文件;所述印刷文本OCR模块用于对回函的印刷文本进行汉字识别;所述印章识别比对模块用于对被征询方回函的印章检测与印章内容识别;所述推理引擎模块用于负责整个所述财务审计询证系统工作流的控制和各模块的智能调度;所述背调子系统用于辅助调查被询证方的信息是否属实;所述询证函自动生成用于自动生成询证函;所述运单自动填写与追踪用于自动填写运单相关信息以及追踪运单;所述回函自动确认与分类用于对被征询方回函的自动确认及其分类。...

【技术特征摘要】
1.一种财务审计询证系统,其特征在于,所述系统包括数据层、基础层、应用层;所述数据层用于存储和管理系统所需的数据;所述基础层用于提供系统所需的通用基础功能和模块;所述应用层用于向用户提供面对面的服务;所述数据层与所述基础层连接;所述应用层与所述数据层和所述基础层连接;所述数据层负责包括对所述财务审计询证系统的相关数据进行数据仓储、数据清洗、信息检索、支持基础层模型训练的数据脱敏服务中的至少一种处理;所述基础层包括定向爬虫模块、信息抽取模块、模板系统模块、印刷文本OCR模块、印章识别比对模块、推理引擎模块中的至少一者;所述应用层在所述基础层和所述数据层之上构筑的以实现具体业务;所述具体业务包括背调子系统、询证函自动生成、运单自动填写与追踪、回函自动确认与分类中的至少一者;所述数据脱敏服务用于实现对函证的敏感隐私数据进行可靠保护;所述定向爬虫模块用于精准地获取目标网站的信息;所述信息抽取模块用于提取被征询方信息,所述被征询方信息包含以下一种或几种:被询证方的单位名称、地址、联系人、联系方式;所述模板系统模块为询证函自动生成提供模板文件;所述印刷文本OCR模块用于对回函的印刷文本进行汉字识别;所述印章识别比对模块用于对被征询方回函的印章检测与印章内容识别;所述推理引擎模块用于负责整个所述财务审计询证系统工作流的控制和各模块的智能调度;所述背调子系统用于辅助调查被询证方的信息是否属实;所述询证函自动生成用于自动生成询证函;所述运单自动填写与追踪用于自动填写运单相关信息以及追踪运单;所述回函自动确认与分类用于对被征询方回函的自动确认及其分类。2.根据权利要求1所述的财务审计询证系统,其特征在于,所述财务审计询证系统还包括接口层,所述接口层用于与其他平台或应用进行对接。3.根据权利要求1所述的财务审计询证系统,其特征在于,所述数据脱敏服务是对函证涉及的商业敏感信息通过脱敏规则进行数据的变形;所述脱敏规则进行数据的变形包含以下一种或几种操作:信息切割、信息打散、抽样选取。4.根据权利要求1所述的财务审计询证系统,其特征在于,所述定向爬虫模块用于精准地获取目标网站的信息;所述定向爬虫模块包括引擎、下载器、下载中间件、爬虫中间件、调度器以及至少一爬虫;所述爬虫为负责对某个数据源的页面进行解析,并从中分离出目标信息的程序;所述信息抽取模块用于提取被征询方信息,所述信息抽取包含命名实体识别和实体关系抽取两项任务;所述信息抽取模块从网络中采用实体命名识别技术提取被询证方信息,所述网络包含以下一种或几种:被询证方公司官网、工商网站、招聘网站;所述模板系统模块包含至少一种模板文件,不同类别...

【专利技术属性】
技术研发人员:蔡振华肖龙源谭玉坤李稀敏刘晓葳
申请(专利权)人:厦门快商通信息技术有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1