System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于人工智能,具体涉及一种基于多模型的文件分析方法、装置、设备及介质。
技术介绍
1、文件分析是基于用户提问对文件的内容进行分析和整理的过程,旨在帮助用户更加迅速地理解和掌握文件中的信息,为用户的实际工作提供指导和帮助。随着社会的发展,线上文件信息的数量呈现爆炸式增长,如何高效且准确地进行文件分析逐渐成为了热点话题。
2、现有技术中,文件分析往往采用已有的大语言模型根据用户的查询内容对当前接收到的文件进行文本识别和文本处理,或者专门训练针对某一文本类型的大语言模型,通过该模型进行文件的文本分析。然而,现有技术都是通过单一模型对待分析文件直接进行分析,并且其训练语料往往是文本形式,无法对需要进行图片解读的文件进行处理,也无法结合上下文对文件进行准确分析,存在分析结果全面性和准确性不足的问题,同时由于不同用户对分析结果的偏好不同,利用现有技术无法实现针对不同用户的个性化文件分析。
技术实现思路
1、本申请实施例的目的是提供一种基于多模型的文件分析方法、装置、设备及介质,解决了利用现有技术进行文件分析时存在的分析结果全面性不足、准确性不足以及无法个性化分析的问题,通过基于第一预设模型对待分析文件进行文本抽取,将查询内容、历史聊天记录和文本内容整合为文件背景信息,通过客户端选择的第二预设模型结合文件背景信息进行文件分析,可以提高文件分析结果的全面性、准确性以及个性化程度。
2、第一方面,本申请实施例提供了一种基于多模型的文件分析方法,所述方法包括:
4、接收所述客户端的模型选择指令,根据所述模型选择指令确定所述客户端选择的第二预设模型;
5、将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果。
6、可选的,在获取预先存储的所述待分析文件的历史聊天记录和文本内容之前,所述方法还包括:
7、接收待分析文件,将所述待分析文件输入至第一预设模型,以基于所述第一预设模型抽取所述待分析文件中的文本内容。
8、可选的,所述整合所述查询内容、所述历史聊天记录和所述文本内容得到所述待分析文件的文件背景信息,包括:
9、根据预设关键词词性分别识别所述查询内容中的查询关键词、所述历史聊天记录中的记录关键词和所述文本内容中的文本关键词;
10、计算所述查询关键词与所述记录关键词之间的第一相似度,以及计算所述查询关键词与所述文本关键词之间的第二相似度;
11、基于预设相似度阈值、所述第一相似度和所述第二相似度对所述历史聊天记录和所述文本内容进行筛选得到记录背景信息和文本背景信息;
12、根据预设提示语句构造规则确定所述待分析文件的背景信息结构,根据所述背景信息结构整合所述查询内容、所述记录背景信息和所述文本背景信息得到所述待分析文件的文件背景信息。
13、可选的,在接收所述客户端的模型选择指令之前,所述方法还包括:
14、识别所述历史聊天记录中解答语句的模型标识,统计各所述模型标识的出现概率,所述模型标识为至少两个预设模型的标识;
15、根据所述出现概率对所述至少两个预设模型进行使用热度排序,根据使用热度排序结果确定所述预设模型的模型展示优先级;
16、基于所述模型展示优先级向所述客户端展示所述至少两个预设模型,以用于所述客户端进行模型选择。
17、可选的,在将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果之后,所述方法还包括:
18、接收所述客户端对所述待分析文件分析结果的满意度反馈信息,根据所述满意度反馈信息确定所述第二预设模型的待调整参数;
19、识别符合所述待调整参数的目标预设模型,基于所述目标预设模型更新所述模型展示优先级,以用于所述客户端重新进行模型选择。
20、可选的,所述将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果,包括:
21、识别所述待分析文件中的图片标识,基于所述图片标识查找所述文件背景信息中的图片描述信息;
22、将所述图片描述信息和所述待分析文件输入至所述第二预设模型,以用于所述第二预设模型基于所述图片描述信息对所述待分析文件中的图片进行分析得到图片分析结果。
23、可选的,在将所述图片描述信息和所述待分析文件输入至所述第二预设模型,以用于所述第二预设模型基于所述图片描述信息对所述待分析文件中的图片进行分析得到图片分析结果之后,所述方法还包括:
24、接收所述客户端对所述图片分析结果的准确度评价信息,根据所述准确度评价信息确定所述图片分析结果中的分析缺失项;
25、根据所述分析缺失项对所述查询内容、所述历史聊天记录和所述文本内容进行重新整合,得到所述待分析文件的文件背景更新信息;
26、将所述文件背景更新信息和所述待分析文件重新输入至所述第二预设模型,以用于所述第二预设模型基于所述文件背景更新信息对所述待分析文件中的图片进行重新分析得到图片分析更新结果。
27、第二方面,本申请实施例提供了一种基于多模型的文件分析装置,所述装置包括:
28、文本内容获取模块,用于在接收到客户端发送的查询内容以及对应的待分析文件的情况下,获取预先存储的所述待分析文件的历史聊天记录和文本内容;
29、文件背景整合模块,用于整合所述查询内容、所述历史聊天记录和所述文本内容得到所述待分析文件的文件背景信息,所述查询内容包括文本查询和图片查询,所述文本内容为基于第一预设模型对所述待分析文件进行文本抽取得到的;
30、模型选择模块,用于接收所述客户端的模型选择指令,根据所述模型选择指令确定所述客户端选择的第二预设模型;
31、文件分析模块,用于将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型分析所述待分析文件。
32、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
33、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
34、第五方面,本申请实施例本文档来自技高网...
【技术保护点】
1.一种基于多模型的文件分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,在获取预先存储的所述待分析文件的历史聊天记录和文本内容之前,所述方法还包括:
3.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,所述整合所述查询内容、所述历史聊天记录和所述文本内容得到所述待分析文件的文件背景信息,包括:
4.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,在接收所述客户端的模型选择指令之前,所述方法还包括:
5.根据权利要求4所述的基于多模型的文件分析方法,其特征在于,在将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果之后,所述方法还包括:
6.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,所述将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果,包括:
7.根据权利要求6所述的基于多模型的
8.一种基于多模型的文件分析装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7中任一项所述的一种基于多模型的文件分析方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7中任一项所述的一种基于多模型的文件分析方法的步骤。
...【技术特征摘要】
1.一种基于多模型的文件分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,在获取预先存储的所述待分析文件的历史聊天记录和文本内容之前,所述方法还包括:
3.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,所述整合所述查询内容、所述历史聊天记录和所述文本内容得到所述待分析文件的文件背景信息,包括:
4.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,在接收所述客户端的模型选择指令之前,所述方法还包括:
5.根据权利要求4所述的基于多模型的文件分析方法,其特征在于,在将所述文件背景信息和所述待分析文件输入至所述第二预设模型,以基于所述第二预设模型对所述待分析文件进行文件分析得到文件分析结果之后,所述方法还包括:
6.根据权利要求1所述的基于多模型的文件分析方法,其特征在于,所述将所述文件背景信息和所...
【专利技术属性】
技术研发人员:王传鹏,关凯萍,陈秋声,卢炬康,朱鹏钢,
申请(专利权)人:广州三七极耀网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。