一种基于大语言模型的对话系统意图识别方法及工具技术方案

技术编号:39248569 阅读:14 留言:0更新日期:2023-10-30 12:00
本发明专利技术公开一种基于大语言模型的对话系统意图识别方法及工具,涉及意图识别技术领域。意图识别方法包括:S1、根据需求,定义意图;S2、接收用户输入的信息;S3、根据定义的意图设计prompt,将接收信息和设计的prompt输入大语言模型,大语言模型对用户意图进行识别;S4、大语言模型根据意图识别结果调用对话系统中相应的意图模块,被调用的意图模块对意图进行处理,生成答案展示给用户。本发明专利技术能够提供更准确、更灵活、更全面的意图理解能力,提升对话系统的交互性能和用户体验。统的交互性能和用户体验。统的交互性能和用户体验。

【技术实现步骤摘要】
一种基于大语言模型的对话系统意图识别方法及工具


[0001]本专利技术涉及意图识别
,具体的说是一种基于大语言模型的对话系统意图识别方法及工具。

技术介绍

[0002]意图识别是指在自然语言处理中的一个任务,旨在理解和识别用户在对话或文本中表达的意图或目标。它是一种文本分类任务,通过分析用户的输入文本,将其归类到预定义的意图类别中。在对话系统或聊天机器人中,意图识别是理解用户意图的关键步骤。通过识别用户的意图,对话系统可以根据用户的需求做出相应的回应、采取适当的行动或提供相关的信息。例如,在一个预订餐厅的对话系统中,用户可能会输入类似于"我想预订一张四人桌,明天晚上7点"的文本。意图识别的任务就是将这个文本识别为"预订餐厅"的意图类别,从而对话系统可以根据这个意图进行后续的处理和响应。意图识别通常基于机器学习和自然语言处理技术。它涉及训练一个模型,使其能够从输入文本中提取特征并进行意图分类。这个模型可以使用传统的机器学习算法,如朴素贝叶斯分类器、支持向量机等,也可以使用基于神经网络的方法,如循环神经网络(RNN)、卷积神经网络(CNN)或最近广泛应用的预训练语言模型(BERT)等。
[0003]大语言模型如GPT、ChatGLM、文心一言等在自然语言处理任务中展现出强大的理解能力和推理能力,能够通过学习大规模语言数据,捕捉到丰富的语义和语境信息,这使得它们能够更好地理解上下文,并在对话或文本中识别出复杂的语义关联。大模型具备处理多样化文本的能力,它们可以处理不同领域、不同风格和不同长度的文本,并具备适应性,从而在各种语言任务中表现出色。大模型在理解语义和推理方面表现出色,能够从给定的文本中推断出隐含的信息、关系和逻辑,进而进行推理和推断,解决复杂的问题。大模型具有强大的泛化能力,可以再面对未见过的样本或领域时仍然表现出良好的性能。他们通过学习大量的语言知识和模式,能够更好地推广到新情境中,实现跨领域和跨任务的应用。
[0004]在进行意图识别时,现有的方法有:

基于规则的方法:这种方法使用预先定义的规则和模式匹配来识别意图。开发者需要手动设计和编写规则,其中包括关键词、短语或正则表达式等。这种方法适用于简单的意图和明确的规则,但难以应对复杂的语义关联和多样性。

统计机器学习方法:这种方法使用监督学习算法,如朴素贝叶斯分类器、支持向量机(SVM)或决策树等,从标记好的训练数据中学习意图分类模型。特征提取通常涉及词袋模型、n

gram特征等。这种方法需要足够的标注数据,并且对特征工程和模型选择有一定要求。

序列模型方法:这种方法基于序列建模,如循环神经网络(RNN)或长短期记忆(LSTM)等,能够捕捉输入文本的序列信息。通过将输入文本表示为时间步序列,并使用RNN或LSTM进行训练,从而对意图进行分类。这种方法可以处理较长的文本序列,更好地捕捉上下文信息。

预训练语言模型方法:使用预训练的语言模型(如BERT)微调到特定的意图识别任务上,利用大规模的无监督数据和语言知识,能够提供语义理解和上下文理解能力。
[0005]上述意图识别方法有很多优点,如简单高效、可解释性强、领域适应性好等,但是
也有不足,如:

依赖人工设计:传统意图识别方法需要人工设计规则和特征,对领域专家的知识和经验依赖较高。这限制了其在大规模和复杂任务上的应用能力,且需要手动更新和维护规则。

通用性差:传统意图识别方法通常缺乏对语义和上下文的深入理解能力,难以处理复杂的语义关联和多样性。这使得传统方法在处理语义复杂的对话和跨领域任务时表现不佳。

对数据和标注的依赖:传统方法对于标注数据的依赖性较高,需要有足够量且高质量的标注数据进行模型训练和性能优化。获取和标注大规模数据可能会带来一定的成本和困难。

缺乏泛化能力:由于传统方法通常基于固定的规则或特征,其泛化能力相对有限。当遇到新领域、新任务或用户表达方式的变化时,传统方法可能需要重新设计和调整规则,增加了系统的开发和维护成本。

技术实现思路

[0006]本专利技术针对传统意图识别方法在简单任务和特定领域中具有一定的优势,但在处理复杂语义和泛化能力方面的不足,提供一种基于大语言模型的对话系统意图识别方法及工具。
[0007]第一方面,本专利技术提供一种基于大语言模型的对话系统意图识别方法,解决上述技术问题采用的技术方案如下:
[0008]一种基于大语言模型的对话系统意图识别方法,包括如下步骤:
[0009]S1、根据需求,定义意图;
[0010]S2、接收用户输入的信息;
[0011]S3、根据定义的意图设计prompt,将接收信息和设计的prompt输入大语言模型,大语言模型对用户意图进行识别;
[0012]S4、大语言模型根据意图识别结果调用对话系统中相应的意图模块,被调用的意图模块对意图进行处理,生成答案展示给用户。
[0013]可选的,执行步骤S1,根据需求定义意图时,定义内容包括:具体意图、与具体意图相关的参数;
[0014]在定义意图发生参数缺失现象时,需要进一步定义相关操作继续询问用户,直至参数满足为止。
[0015]可选的,执行步骤S2,用户通过语音转文本或者直接文本输入的方式向对话系统输入表达意图的信息。
[0016]可选的,执行步骤S3,大语言模型对用户意图进行识别后,输出json信息到对话系统中被调用的意图模块;
[0017]被调用的意图模块对意图进行处理,生成答案,随后将答案以文本、图表或视频形式展示给用户。
[0018]优选的,大语言模型采用chatgpt、chatglm、文心一言中的一种。
[0019]第二方面,本专利技术提供一种基于大语言模型的对话系统意图识别工具,解决上述技术问题采用的技术方案如下:
[0020]一种基于大语言模型的对话系统意图识别工具,其包括:
[0021]定义模块,用于根据需求定义意图;
[0022]信息获取模块,用于获取用户输入的表示意图的信息;
[0023]设计模块,用于根据定义的意图设计prompt;
[0024]意图识别模块,用于将接收信息和设计的prompt输入大语言模型,利用大语言模型对用户意图进行识别;
[0025]调用处理模块,用于根据大语言模型的意图识别结果调用对话系统中相应的意图模块,被调用的意图模块对意图进行处理,生成答案;
[0026]展示模块,用于将意图模块生成的答案展示给用户。
[0027]可选的,通过定义模块定义意图时,定义内容包括:具体意图、与具体意图相关的参数;
[0028]通过定义模块定义意图后,发生参数缺失现象时,需要进一步通过定义模块定义相关操作继续询问,用户直至参数满足为止。
[0029]可选的,信息获取模块获取用户输入的语音信息并转为文本信息,或者本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大语言模型的对话系统意图识别方法,其特征在于,包括如下步骤:S1、根据需求,定义意图;S2、接收用户输入的信息;S3、根据定义的意图设计prompt,将接收信息和设计的prompt输入大语言模型,大语言模型对用户意图进行识别;S4、大语言模型根据意图识别结果调用对话系统中相应的意图模块,被调用的意图模块对意图进行处理,生成答案展示给用户。2.根据权利要求1所述的一种基于大语言模型的对话系统意图识别方法,其特征在于,执行步骤S1,根据需求定义意图时,定义内容包括:具体意图、与具体意图相关的参数;在定义意图发生参数缺失现象时,需要进一步定义相关操作继续询问用户,直至参数满足为止。3.根据权利要求1所述的一种基于大语言模型的对话系统意图识别方法,其特征在于,执行步骤S2,用户通过语音转文本或者直接文本输入的方式向对话系统输入表达意图的信息。4.根据权利要求1所述的一种基于大语言模型的对话系统意图识别方法,其特征在于,执行步骤S3,大语言模型对用户意图进行识别后,输出json信息到对话系统中被调用的意图模块;被调用的意图模块对意图进行处理,生成答案,随后将答案以文本、图表或视频形式展示给用户。5.根据权利要求1所述的一种基于大语言模型的对话系统意图识别方法,其特征在于,所述大语言模型采用chatgpt、chatglm、文心一言中的一种。6.一种基于大语言模型的对话系统意图识别工具,其特征在于,其包括:定义模块,用于根据需求定义意图;信息获取模块,...

【专利技术属性】
技术研发人员:李志芸冯落落李晓瑜李沛尹青山
申请(专利权)人:山东新一代信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1