System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大模型的人机交互方法、装置及介质制造方法及图纸_技高网

一种基于大模型的人机交互方法、装置及介质制造方法及图纸

技术编号:41288792 阅读:22 留言:0更新日期:2024-05-11 09:37
本发明专利技术公开了一种基于大模型的人机交互方法、装置及介质,应用于工业产线上的人机问答系统,所述方法包括:获取用户输入的问题,在场景问答模式下,采用大模型对问题的文本进行结构化解析,得到问题的问题类型;其中,问题类型包括步骤类型、物体属性类型、物体定义类型、验证类型以及其他类型;根据问题类型以及用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于大模型,输出问题对应的回答;其中,当问题类型为其他类型时,先采用大模型对问题进行回答,再输出与知识库相关的引导信息以及推荐信息。本发明专利技术能够针对不同类别的问题提供更加精确和专业的回答,实现了全面的互动式问答,提高了系统的效率,增强了用户体验。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种基于大模型的人机交互方法、装置及介质


技术介绍

1、随着智能技术的迅速发展,工业产线上的人机问答系统越来越智能化,其能够增强操作员的决策能力、提升效率,同时还能提供实时的技术支持。现有的问答系统通常通过结合本地知识库和网络搜索技术来构建知识库,在本地知识库无法回答的情况下,从互联网上的知识库中进行搜索。在工业产线的应用背景下,目前工业相关知识库的构建存在着知识高度专业化、技术更新快、多语言和跨文化等问题,并且,现有的问答系统对于一些复杂句子、非正式表达以及书面错误等内容的处理效果差,在人机交互时无法正确理解、分析与合成信息,且在提供实时教学和技术支持时的精确性与专业性差。


技术实现思路

1、为解决以上技术问题,本专利技术提供了一种基于大模型的人机交互方法、装置及介质,通过引入大模型技术、结合视觉信息以及对问题类型进行精细分类,能够针对不同类别的问题提供更加精确和专业的回答,实现了全面的互动式问答,提高了系统的效率,增强了用户体验。

2、本专利技术实施例提供了一种基于大模型的人机交互方法,包括:

3、获取用户输入的问题,并判断系统知识库中是否有所述问题的匹配信息;若是,则根据所述匹配信息输出对应的回答;若否,则进入场景问答模式;

4、在所述场景问答模式下,采用大模型对所述问题的文本进行结构化解析,得到所述问题的问题类型;其中,所述问题类型包括步骤类型、物体属性类型、物体定义类型、验证类型以及其他类型;

>5、根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答;其中,当所述问题类型为其他类型时,先采用所述大模型对所述问题进行回答,再输出与所述知识库相关的引导信息以及推荐信息。

6、作为上述方案的改进,所述知识库包括本地知识库以及外部知识库;其中,所述本地知识库包括场景专用知识库、大模型提示库以及所述系统知识库;所述场景专用知识库包括视觉知识库以及行为知识库。

7、作为上述方案的改进,所述获取用户输入的问题,并判断系统知识库中是否有所述问题的匹配信息,具体包括:

8、获取所述用户输入的问题;

9、对所述问题的文本进行预处理,得到第一解析信息;

10、对所述第一解析信息进行实体识别以及关键词提取,得到第二解析信息;

11、将所述第二解析信息转换为向量形式,得到第三解析信息;

12、将所述第三解析信息与所述系统知识库中的信息进行匹配,并判断所述系统知识库中是否有所述问题的匹配信息。

13、作为上述方案的改进,在所述进入场景问答模式后,所述方法还包括:

14、根据历史问答信息判断所述用户是否已选择场景;

15、若所述用户未选择场景,则输出场景选择的引导信息,以使所述用户选择场景;

16、若所述用户已选择场景,则将所述用户选择的场景作为当前问题的应用场景。

17、作为上述方案的改进,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

18、当所述问题类型为所述步骤类型时,根据所述用户选择的场景,获取所述行为知识库中的信息以及所述大模型提示库中与所述问题相关的提示信息;

19、获取所述摄像头采集的第一视觉信息;

20、将所述提示信息以及所述第一视觉信息输入所述大模型,得到所述第一视觉信息对应的第一文本描述信息;

21、将所述第一文本描述信息与所述行为知识库中的信息进行匹配,确定所述用户当前的操作步骤,并输出所述问题对应的回答。

22、作为上述方案的改进,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

23、当所述问题类型为所述物体属性类型或所述物体定义类型时,根据所述用户选择的场景,获取所述视觉知识库中的物体信息;

24、若所述问题类型为所述物体属性类型,则采用所述大模型从所述问题的文本中提取物体关键词;若所述问题类型为所述物体定义类型,则获取所述摄像头采集的第二视觉信息,采用所述大模型将所述第二视觉信息转换为第二文本描述信息,并从所述第二文本描述信息中提取与所述问题相关的物体关键词;

25、将所述物体关键词与所述视觉知识库中的物体信息进行匹配,并根据匹配结果输出所述问题对应的回答。

26、作为上述方案的改进,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

27、当所述问题类型为所述验证类型时,根据所述用户选择的场景,获取所述行为知识库中的信息;

28、获取所述摄像头采集的第三视觉信息;其中,所述第三视觉信息为根据所述用户的操作频率分段保存的视频;

29、对所述视频进行关键帧提取,并将得到的关键帧输入所述大模型,得到每一所述关键帧对应的第三文本描述信息;

30、将所述第三文本描述信息与所述行为知识库中的信息进行匹配,确定用户操作的正确性,并输出所述问题对应的回答。

31、作为上述方案的改进,所述方法还包括:

32、获取专业人员上传的工业规范视频;

33、提取所述工业规范视频的关键帧,并采用所述大模型对所述关键帧进行行为识别,得到所述关键帧对应的行为描述;

34、输出所述行为描述,以使所述专业人员判断所述行为描述是否符合规范;

35、获取所述专业人员的判断结果,若所述行为描述不符合所述规范,则返回所述提取所述工业规范视频的关键帧的步骤;若所述行为描述符合所述规范,则将所述行为描述更新到所述场景专用知识库中。

36、本专利技术实施例还提供了一种基于大模型的人机交互装置,应用于工业产线上的人机问答系统,包括:

37、问题获取模块,用于获取用户输入的问题,并判断系统知识库中是否有所述问题的匹配信息;若是,则根据所述匹配信息输出对应的回答;若否,则进入场景问答模式;

38、问题分类模块,用于在所述场景问答模式下,采用大模型对所述问题的文本进行结构化解析,得到所述问题的问题类型;其中,所述问题类型包括步骤类型、物体属性类型、物体定义类型、验证类型以及其他类型;

39、回答输出模块,用于根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答;其中,当所述问题类型为其他类型时,先采用所述大模型对所述问题进行回答,再输出与所述知识库相关的引导信息以及推荐信息。

40、本专利技术实施例还提供了一种终端设备,包括处理器和存储器,所述存储器中存储有计算本文档来自技高网...

【技术保护点】

1.一种基于大模型的人机交互方法,应用于工业产线上的人机问答系统,其特征在于,包括:

2.如权利要求1所述的基于大模型的人机交互方法,其特征在于,所述知识库包括本地知识库以及外部知识库;其中,所述本地知识库包括场景专用知识库、大模型提示库以及所述系统知识库;所述场景专用知识库包括视觉知识库以及行为知识库。

3.如权利要求1所述的基于大模型的人机交互方法,其特征在于,所述获取用户输入的问题,并判断系统知识库中是否有所述问题的匹配信息,具体包括:

4.如权利要求1所述的基于大模型的人机交互方法,其特征在于,在所述进入场景问答模式后,所述方法还包括:

5.如权利要求2所述的基于大模型的人机交互方法,其特征在于,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

6.如权利要求2所述的基于大模型的人机交互方法,其特征在于,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

7.如权利要求2所述的基于大模型的人机交互方法,其特征在于,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

8.如权利要求2所述的基于大模型的人机交互方法,其特征在于,所述方法还包括:

9.一种基于大模型的人机交互装置,应用于工业产线上的人机问答系统,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其中,所述计算机可读存储介质所在设备执行所述计算机程序时,实现如权利要求1至8中任意一项所述的基于大模型的人机交互方法。

...

【技术特征摘要】

1.一种基于大模型的人机交互方法,应用于工业产线上的人机问答系统,其特征在于,包括:

2.如权利要求1所述的基于大模型的人机交互方法,其特征在于,所述知识库包括本地知识库以及外部知识库;其中,所述本地知识库包括场景专用知识库、大模型提示库以及所述系统知识库;所述场景专用知识库包括视觉知识库以及行为知识库。

3.如权利要求1所述的基于大模型的人机交互方法,其特征在于,所述获取用户输入的问题,并判断系统知识库中是否有所述问题的匹配信息,具体包括:

4.如权利要求1所述的基于大模型的人机交互方法,其特征在于,在所述进入场景问答模式后,所述方法还包括:

5.如权利要求2所述的基于大模型的人机交互方法,其特征在于,所述根据所述问题类型以及所述用户选择的场景,获取摄像头采集的视觉信息以及预先构建的知识库,并基于所述大模型,输出所述问题对应的回答,具体包括:

6....

【专利技术属性】
技术研发人员:谢雪梅张鹏卢之毅柯昌文兰宁
申请(专利权)人:西安电子科技大学广州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1