System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及自然语言处理、语言生成、文本生成等。
技术介绍
1、信息抽取和生成信息报告是利用技术手段,从大量信息中提取有用的信息,并以易于理解和应用的方式呈现给用户,信息抽取和生成信息报告的自动化过程可以大大提高工作效率,也可以帮助监测特定领域的动态,从中提取出关键信息。
2、因此,如何准确、全面的抽取信息数据中的信息,避免繁琐的流程,提高信息报告的生成效率和精度,已经成为重要的研究方向之一。
技术实现思路
1、本公开提供了一种信息报告的生成方法及其装置。
2、根据本公开的一方面,提供了一种信息报告的生成方法,该方法包括:
3、获取多条信息数据,并获取任一条信息数据的第一标题;
4、对多条信息数据进行分割处理,获取多条候选文本;
5、对多条第一标题进行聚类,获取聚类后的第二标题,并基于预设目标策略对第二标题进行筛选,获取第三标题;
6、将第三标题和多条候选文本进行相似度匹配,从多条候选文本中确定多条目标文本,并基于多条目标文本生成信息报告。
7、本公开实施例中,适用于信息发现及信息报告生成的场景,对多条信息数据进行分割处理,获取多条候选文本,对多条第一标题进行聚类,获取聚类后的第二标题,基于预设目标策略对第二标题进行筛选,获取第三标题,可以准确、全面的抽取信息数据中的信息;将第三标题和多条候选文本进行相似度匹配,从多条候选文本中确定多条目标文本,可以提高信息报告的生成效率,基于多条目
8、根据本公开的另一方面,提供了一种信息报告的生成装置,包括:
9、第一获取模块,用于获取多条信息数据,并获取任一条信息数据的第一标题;
10、第二获取模块,用于对多条信息数据进行分割处理,获取多条候选文本;
11、第三获取模块,用于对多条第一标题进行聚类,获取聚类后的第二标题,并基于预设目标策略对第二标题进行筛选,获取第三标题;
12、生成模块,用于将第三标题和多条候选文本进行相似度匹配,从多条候选文本中确定多条目标文本,并基于多条目标文本生成信息报告。
13、根据本公开的另一方面,提供了一种电子设备,包括至少一个处理器,以及
14、与至少一个处理器通信连接的存储器;其中,
15、存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开第一个方面实施例的信息报告的生成方法。
16、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据本公开第一个方面实施例的信息报告的生成方法。
17、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开第一个方面实施例的信息报告的生成方法的步骤。
18、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种信息报告的生成方法,其中,包括:
2.根据权利要求1所述的方法,其中,所述基于预设目标策略对所述第二标题进行筛选,获取第三标题,包括:
3.根据权利要求1所述的方法,其中,所述将所述第三标题和多条所述候选文本进行相似度匹配,从多条所述候选文本中确定多条目标文本,包括:
4.根据权利要求3所述的方法,其中,所述基于多条所述目标文本生成信息报告,包括:
5.根据权利要求1-4任一项所述的方法,其中,所述获取多条信息数据,包括:
6.根据权利要求1-4任一项所述的方法,其中,所述获取任一条信息数据的第一标题,包括:
7.根据权利要求1-4任一项所述的方法,其中,所述获取多条信息数据之后,还包括:
8.根据权利要求1所述的方法,其中,所述对多条所述信息数据进行分割处理,获取多条候选文本,包括:
9.根据权利要求1所述的方法,其中,所述对多条所述信息数据进行分割处理,获取多条候选文本,包括:
10.根据权利要求9所述的方法,其中,还包括:
11.根据权利要求8-1
12.一种信息报告的生成装置,其中,包括:
13.根据权利要求12所述的装置,其中,所述第三获取模块,还用于:
14.根据权利要求12所述的装置,其中,所述生成模块,还用于:
15.根据权利要求14所述的装置,其中,所述生成模块,还用于:
16.根据权利要求12-15任一项所述的装置,其中,所述第一获取模块,还用于:
17.根据权利要求12-15任一项所述的装置,其中,所述第一获取模块,还用于:
18.根据权利要求12-15任一项所述的装置,其中,所述第一获取模块,还用于:
19.根据权利要求12所述的装置,其中,所述第二获取模块,还用于:
20.根据权利要求12所述的装置,其中,所述第二获取模块,还用于:
21.根据权利要求20所述的装置,其中,所述第二获取模块,还用于:
22.根据权利要求19-21任一项所述的装置,其中,所述预设分隔符包括句号、问号、感叹号、换行符中的一种或几种。
23.一种电子设备,包括:
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述方法的步骤。
...【技术特征摘要】
1.一种信息报告的生成方法,其中,包括:
2.根据权利要求1所述的方法,其中,所述基于预设目标策略对所述第二标题进行筛选,获取第三标题,包括:
3.根据权利要求1所述的方法,其中,所述将所述第三标题和多条所述候选文本进行相似度匹配,从多条所述候选文本中确定多条目标文本,包括:
4.根据权利要求3所述的方法,其中,所述基于多条所述目标文本生成信息报告,包括:
5.根据权利要求1-4任一项所述的方法,其中,所述获取多条信息数据,包括:
6.根据权利要求1-4任一项所述的方法,其中,所述获取任一条信息数据的第一标题,包括:
7.根据权利要求1-4任一项所述的方法,其中,所述获取多条信息数据之后,还包括:
8.根据权利要求1所述的方法,其中,所述对多条所述信息数据进行分割处理,获取多条候选文本,包括:
9.根据权利要求1所述的方法,其中,所述对多条所述信息数据进行分割处理,获取多条候选文本,包括:
10.根据权利要求9所述的方法,其中,还包括:
11.根据权利要求8-10任一项所述的方法,其中,所述预设分隔符包括句号、问号、感叹号、换行符号中的一种或几种。
12.一种信息报告的生成装置,其中,包括:
13.根据权利...
【专利技术属性】
技术研发人员:高亨德,石东升,李瑞锋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。