财务数据的可视化方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26891343 阅读:14 留言:0更新日期:2020-12-29 16:09
本发明专利技术公开了财务数据的可视化方法、装置、计算机设备及存储介质,所述方法包括:获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据;通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体;将所述指财务标实体存储于结构化数据库中;响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表。本发明专利技术通过通过对原始财务数据文件中的非结构化数据提取得到财务指标实体,然后将所述指财务标实体存储于结构化数据库中,最后生成所述非结构化数据对应的可视化数据图表,实现了对非结构化的财务数据进行可视化展现,节省了人力,提高了效率。

【技术实现步骤摘要】
财务数据的可视化方法、装置、计算机设备及存储介质
本专利技术涉及数据可视化领域,尤其涉及一种财务数据的可视化方法、装置、计算机设备及存储介质。
技术介绍
财务报告中包括财务数据,是反映企业财务状况、经营成果和现金流量等有关会计信息,财务报告中包含了资产负债表、现金流量表和利润表等表格信息,同时也包含员工构成等非表格信息。财务报告作为企业对外提供的总结性书面文件,不仅向财务报告使用者提供企业的财务状况、经营信息和现金流量等会计信息,同时还反映了企业管理层受托责任的履行情况,有助于财务报告使用者做出经济决策。目前,对于同业分析主要依赖于公开的财报及研报数据,往往需要专业的人员手动整合有效信息,对于银行、企业来说要花费大量的人力成本进行收集和整理,且很大程度上依赖于操作者的业务经验,而现有的财务数据处理工具,也仅对结构化数据进行处理,无法合并非结构化信息进行处理和检索,同时对于可视化展现也较为局限。
技术实现思路
有鉴于此,本专利技术提出一种财务数据的可视化方法、装置、计算机设备及存储介质,用于解决现有技术不能对非结构化的财务数据进行可视化展现的问题。首先,为实现上述目的,本专利技术提出一种财务数据的可视化方法,所述方法包括:获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据;通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体;将所述指财务标实体存储于结构化数据库中;响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表。优选的,所述获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据还包括:将所述原始财务数据文件转换成预设格式类型文件;通过正则表达式提取所述预设格式类型文件中的时间信息以得到第一关键字;通过匹配预设的关键字词库构造词典提取所述预设格式类型文件以得到第二关键字。优选的,所述通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体包括:解析所述预设格式类型文件以将所述非结构化文本输出为段落文本;通过预设语料标注格式标注所述段落文本以训练得到自然语言处理模型;通过所述自然语言处理模型提取所述段落文本得到正文财务指标实体。优选的,所述通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体包括还包括:解析所述预设格式类型文件以将所述非结构化文本输出为表格文本;获取所述表格文本中首行首列中数字字符的比例;将数字字符比例小于预设值的表项提取为指标名称列以得到表格财务指标实体。优选的,所述将所述指财务标实体存储于结构化数据库中还包括:将所述第一关键字、第二关键字、正文财务指标实体和表格财务指标实体进行倒排索引后存储于所述结构化数据库中。优选的,所述响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表包括:通过所述第一关键字和第二关键字对所述结构化数据库进行二次过滤;对所述正文财务指标实体和表格财务指标实体分别设置权重值;根据所述权重值生成所述非结构化数据对应的可视化数据图表。优选的,所述响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表之后还包括:将根据所述非结构化数据对应的可视化数据图表上传至区块链中。为实现上述目的,本专利技术还提供一种财务数据的可视化装置,所述装置包括:获取模块,用于获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据;提取模块,用于通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体;存储模块,用于将所述指财务标实体存储于结构化数据库中;生成模块,用于响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表。为实现上述目的,本专利技术还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。为实现上述目的,本专利技术还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。相较于传统技术,本专利技术实施例的财务数据的可视化方法、装置、计算机设备及存储介质,通过对原始财务数据文件中的非结构化数据提取得到财务指标实体,然后将所述指财务标实体存储于结构化数据库中,最后生成所述非结构化数据对应的可视化数据图表,实现了对非结构化的财务数据进行可视化展现,节省了人力,提高了效率。附图说明图1为本专利技术实施例的应用环境示意图;图2为本专利技术实施例一的财务数据的可视化方法的流程示意图;图3为图2中获取待处理的原始财务数据文件之后的流程示意图;图4为图2中通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体流程示意图一;图5为图2中通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体流程示意图二;图6为图2中生成所述非结构化数据对应的可视化数据图表流程示意图;图7为本专利技术计算机设备之实施例三的数据的可视化装置结构示意图;图8为本专利技术计算机设备之实施例四的硬件结构示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。请参阅图1,示出了本专利技术实施例的实施环境示意图。该实施环境包括:用户端10和服务端12。用户端10是具有网络访问功能的电子设备,该设备可以是智能手机、平板电脑或者个人计算机等。其中,用户端10安装有可以访问服务端12的程序11,用户在程序11通过账号和密码登录访问服务端12后,即可对服务端12执行特定操作和输入。服务端12是一台服务器、若干服务器构称的服务器集群或者云计算中心。服务端12中存储了程序13,程序13包括前端模块和后端模块,前端模块和后端模块可通过接口互相调用,用户在程序11通过账号和密码登录或者通过账号和密码登录访问服务本文档来自技高网...

【技术保护点】
1.一种财务数据的可视化方法,其特征在于,所述方法包括:/n获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据;/n通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体;/n将所述指财务标实体存储于结构化数据库中;/n响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表。/n

【技术特征摘要】
1.一种财务数据的可视化方法,其特征在于,所述方法包括:
获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据;
通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体;
将所述指财务标实体存储于结构化数据库中;
响应于用户在所述结构化数据库中的查询请求,生成所述非结构化数据对应的可视化数据图表。


2.如权利要求1所述的财务数据的可视化方法,其特征在于,所述获取待处理的原始财务数据文件,所述原始财务数据文件中包括非结构化数据还包括:
将所述原始财务数据文件转换成预设格式类型文件;
通过正则表达式提取所述预设格式类型文件中的时间信息以得到第一关键字;
通过匹配预设的关键字词库构造词典提取所述预设格式类型文件以得到第二关键字。


3.如权利要求1或2所述的财务数据的可视化方法,其特征在于,所述通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体包括:
解析所述预设格式类型文件以将所述非结构化文本输出为段落文本;
通过预设语料标注格式标注所述段落文本以训练得到自然语言处理模型;
通过所述自然语言处理模型提取所述段落文本得到正文财务指标实体。


4.如权利要求3所述的财务数据的可视化方法,其特征在于,所述通过预设语料标注格式提取所述非结构化数据中的非结构化文本得到财务指标实体包括还包括:
解析所述预设格式类型文件以将所述非结构化文本输出为表格文本;
获取所述表格文本中首行首列中数字字符的比例;
将数字字符比例小于预设值的表项提取为指标名称列以得到表格财务指标实体。


5.如权利要求4所述的财务数据的可视化方法,其特征在于,所述将所述指财务标实体...

【专利技术属性】
技术研发人员:周威赵云松杨镭齐婧含
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1