System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于技术情报数据的企业评估报告生成方法及装置制造方法及图纸_技高网

基于技术情报数据的企业评估报告生成方法及装置制造方法及图纸

技术编号:41396747 阅读:7 留言:0更新日期:2024-05-20 19:20
本申请公开一种基于技术情报数据的企业评估报告生成方法及装置、存储介质、电子设备,涉及互联网技术领域,该方法中,获取目标企业的技术情报数据,其中包括:文本类数据、图片类数据、视频类数据和音频类数据;通过识别图片类数据和音频类数据,获得图像文本数据和音频文本数据,然后对文本类数据、视频文本数据和音频文本数据的拼接文本数据,聚合其中关联相同内容属性的数据内容,分别获得对应的聚合结果,并基于各聚合结果,得到待整合数据,其中内容属性包括:专利属性、论文属性、产品属性、新闻属性、行业属性;再采用预训练的报告生成模型,将待整合数据按照预设的报告内容标签进行内容整合处理,生成目标企业的企业评估报告。

【技术实现步骤摘要】

本申请涉及互联网,尤其涉及一种基于技术情报数据的企业评估报告生成方法及装置、存储介质、电子设备。


技术介绍

1、目前,金融机构在为企业提供融资、贷款、参保等金融业务之前,通常会基于企业的企业征信信息,实现对于企业的评估,从而为后续企业的融资、贷款、参保等金融业务,提供有力依据。

2、然而,在实际应用中,随科技发展衍生出对于融资、贷款、参保等金融业务具有更大的需求的中小型企业。虽然这些中小型企业掌握一些高新技术,但是,相较开设时间更长、开设规模更大的传统大型企业来说,其仍处于发展初期,相应地,中小型企业的企业征信信息也相对更少,导致基于少量的企业征信信息,难以实现对相应中小型企业的客观评估,从而难以满足中小型企业开展金融业务的需求。


技术实现思路

1、本申请提供一种基于技术情报数据的企业评估报告方法及装置、存储介质、电子设备,用以基于技术情报数据,自动生成相应的企业评估报告,以实现对于中小型企业的客观评估,从而满足中小型企业开展金融业务的需求。

2、第一方面,本申请提供了一种基于技术情报数据的企业评估报告生成方法,包括:

3、获取目标企业的技术情报数据;其中,所述技术情报数据的数据类型包括:文本类数据、图片类数据、视频类数据和音频类数据;

4、基于图像识别技术,分别针对所述图片类数据、所述视频类数据中的文本数据进行识别,获得图像文本数据;以及,基于音频识别技术,将所述音频类数据转换为音频文本数据;

5、针对所述文本类数据、所述图像文本数据和所述音频文本数据的拼接文本数据,聚合所述拼接文本数据中关联相同内容属性的数据内容,分别获得对应的聚合结果,并基于各聚合结果,得到待整合数据;其中,所述内容属性包括:企业属性、专利属性、论文属性、产品属性、新闻属性、行业属性;

6、采用预训练的报告生成模型,将所述待整合数据按照预设的报告内容标签进行内容整合处理,生成所述目标企业的企业评估报告;其中,所述报告内容标签是针对不同内容类别而设置的。

7、第二方面,本申请提供了一种基于技术情报数据的企业评估报告生成装置,包括:

8、获取单元,获取目标企业的技术情报数据;其中,所述技术情报数据的数据类型包括:文本类数据、图片类数据、视频类数据和音频类数据;

9、处理单元,基于图像识别技术,分别针对所述图片类数据、所述视频类数据中的文本数据进行识别,获得图像文本数据;以及,基于音频识别技术,将所述音频类数据转换为音频文本数据;

10、聚合单元,针对所述文本类数据、所述图像文本数据和所述音频文本数据的拼接文本数据,聚合所述拼接文本数据中关联相同内容属性的数据内容,分别获得对应的聚合结果,并基于各聚合结果,得到待整合数据;其中,所述内容属性包括:企业属性、专利属性、论文属性、产品属性、新闻属性、行业属性;

11、生成单元,采用预训练的报告生成模型,将所述待整合数据按照预设的报告内容标签进行内容整合处理,生成所述目标企业的企业评估报告;其中,所述报告内容标签是针对不同内容类别而设置的。

12、可选地,所述聚合单元用于基于各聚合结果,得到待整合数据,具体用于:针对各聚合结果,分别执行以下操作:采用预设的属性指示符,标识一个聚合结果中的各种内容属性的数据内容,并分别提取相应数据内容中的关键词;将处理后的所述各聚合结果进行内容拼接,得到对应的待整合数据。

13、可选地,所述聚合单元用于分别提取相应数据内容中的关键词,具体用于:针对每个数据内容,分别执行分词处理,获得相应的分词序列;分别对获得的每个分词序列,执行如下处理:确定一个分词序列中的各不相同的候选分词,分别获得每个候选分词在相应数据内容中所属句子的候选数目;分别基于获得的各个候选数目与所述相应数据内容的句子总数之间的差值,获得所述每个候选分词的出现频率;选取满足预设概率条件的出现频率对应的候选分词,作为相应数据内容中的关键词。

14、可选地,所述聚合单元用于将处理后的所述各聚合结果进行内容拼接,得到对应的待整合数据,具体用于:针对各聚合结果,分别执行以下操作:将所述各种内容属性的数据内容和对应的关键词,添加到内容树模板中,获得所述一个聚合结果对应的候选内容树;其中,所述候选内容树包含候选根节点及其直属的一级候选子节点、非直属的二级候选子节点,所述候选根节点表征所述一个聚合结果,每个一级候选子节点表征一种内容属性的一个关键词,每个二级候选子节点表征一个关键词所在的数据内容;对获得的各候选内容树进行合并,生成目标内容树,作为待整合数据;其中,在所述目标内容树中,目标根节点表征所述技术情报数据,所述目标根节点直属的每个一级目标子节点表征一个聚合结果。

15、可选地,所述聚合单元用于采用预训练的报告生成模型,将所述待整合数据按照预设的报告内容标签进行内容整合处理,生成所述目标企业的企业评估报告,具体用于:获取预设的标签词库;其中,所述标签词库中的每个标签表征:企业是否满足金融业务要求的评估维度;基于所述待整合数据中的各个关键词,从所述标签词库中选取匹配的标签,作为报告内容标签;将所述报告内容标签添加到预设的候选提示模板中,获得相应的目标提示模板,并将所述目标提示模板拼接在所述待整合数据的尾部,获得目标文本数据;其中,所述候选提示模板为:提示生成所述企业评估报告的提示语模板;将所述目标文本数据输入预训练的报告生成模型中,基于目标文本数据的内部关联关系,对所述目标文本数据进行推理处理,获得所述目标企业的企业评估报告。

16、可选地,所述处理单元用于基于图像识别技术,分别针对所述图片类数据、所述视频类数据中的文本数据进行识别,获得图像文本数据,具体用于:针对所述图片类数据、所述视频类数据中的每张图像,分别执行如下操作:将一张图像转换为高斯热力图,在所述高斯热力图中,筛选满足预设文本像素范围的像素点;参考筛选的各个像素点在所述高斯热力图中的相对位置,确定所述一张图像中的文本区域;针对所述文本区域中的文本进行文本识别,获得图像文本数据。

17、可选地,所述视频类数据还包括字幕信息;则所述处理单元在用于针对所述图片类数据、所述视频类数据中的每张图像,分别执行如下操作之前,还用于:针对视频类数据中的每个视频,分别提取所述每个视频中的字幕信息;将提取的字幕信息,均作为图像文本数据。

18、第三方面,本申请提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任意一种基于技术情报数据的企业评估报告生成方法。

19、第四方面,本申请提供了一种计算机存储介质,所述计算机可读存储介质内存储有计算机程序指令,所述计算机程序指令被处理器执行上述第一方面中任意一种基于技术情报数据的企业评估报告生成方法。

20、本申请有益效果如下:

21、本申请实施例中,提供一种基于技术情报数据的企业评估报告生成方法及装本文档来自技高网...

【技术保护点】

1.一种基于技术情报数据的企业评估报告生成方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于各聚合结果,得到待整合数据,包括:

3.如权利要求2所述的方法,其特征在于,所述分别提取相应数据内容中的关键词,包括:

4.如权利要求2所述的方法,其特征在于,所述将处理后的所述各聚合结果进行内容拼接,得到对应的待整合数据,包括:

5.如权利要求2所述的方法,其特征在于,所述采用预训练的报告生成模型,将所述待整合数据按照预设的报告内容标签进行内容整合处理,生成所述目标企业的企业评估报告,包括:

6.如权利要求1~5任一项所述的方法,其特征在于,所述基于图像识别技术,分别针对所述图片类数据、所述视频类数据中的文本数据进行识别,获得图像文本数据,包括:

7.如权利要求6所述的方法,其特征在于,所述视频类数据还包括字幕信息;则在所述针对所述图片类数据、所述视频类数据中的每张图像,分别执行如下操作之前,还包括:

8.一种基于技术情报数据的企业评估报告生成装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,

10.一种计算机存储介质,其上存储有计算机程序指令,其特征在于,

...

【技术特征摘要】

1.一种基于技术情报数据的企业评估报告生成方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于各聚合结果,得到待整合数据,包括:

3.如权利要求2所述的方法,其特征在于,所述分别提取相应数据内容中的关键词,包括:

4.如权利要求2所述的方法,其特征在于,所述将处理后的所述各聚合结果进行内容拼接,得到对应的待整合数据,包括:

5.如权利要求2所述的方法,其特征在于,所述采用预训练的报告生成模型,将所述待整合数据按照预设的报告内容标签进行内容整合处理,生成所述目标企业的企业评估报告,包括:

6.如权利要...

【专利技术属性】
技术研发人员:张学和王元地
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1