信息处理方法、装置、机器人及存储介质制造方法及图纸

技术编号:39400368 阅读:11 留言:0更新日期:2023-11-19 15:53
本申请实施例公开了一种信息处理方法、装置、机器人及存储介质。所述方法包括:获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息;获取所述待识别信息对应的提示信息;将所述待识别信息和所述提示信息输入到目标预训练模型中,获取所述目标预训练模型输出的所述待识别信息对应的输出结果。通过上述方法,可以根据待识别信息构造可行的提示信息,然后通过目标预训练模型获得机器人可以理解的输出结果,完成人机交互,从而实现机器人的智能大脑。人的智能大脑。人的智能大脑。

【技术实现步骤摘要】
信息处理方法、装置、机器人及存储介质


[0001]本申请属于机器人
,具体涉及一种信息处理方法、装置、机器人及存储介质。

技术介绍

[0002]随着现代科技和计算机技术的不断发展,人们在与机器的信息交流中,不再拘泥人类对机器的键盘操作了,而是需要一种更加方便,自然的交互方式,而语言是人类最重要并且最有效的信息源,实现人机之间的语言交互让机器人听得懂人的话也是人类梦寐以求的事情。

技术实现思路

[0003]鉴于上述问题,本申请提出了一种信息处理方法、装置、机器人以及存储介质,以实现改善上述问题。
[0004]第一方面,本申请实施例提供了一种信息处理方法,应用于机器人,所述方法包括:获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息;获取所述待识别信息对应的提示信息;将所述待识别信息和所述提示信息输入到目标预训练模型中,获取所述目标预训练模型输出的所述待识别信息对应的输出结果。
[0005]第二方面,本申请实施例提供了一种信息处理装置,运行于机器人,所述装置包括:第一信息获取单元,用于获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息;第二信息获取单元,用于获取所述待识别信息对应的提示信息;结果输出单元,用于将所述待识别信息和所述提示信息输入到目标预训练模型中,获取所述目标预训练模型输出的所述待识别信息对应的输出结果。
[0006]第三方面,本申请实施例提供了一种机器人,包括一个或多个处理器以及存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
[0007]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述的方法。
[0008]本申请实施例提供了一种信息处理方法、装置、机器人及存储介质。获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息,获取待识别信息对应的提示信息,将待识别信息和提示信息输入到目标预训练模型中,获取目标预训练模型输出的待识别信息对应的输出结果。通过上述方法,可以根据待识别信息构造可行的提示信息,然后通过目标预训练模型获得机器人可以理解的输出结果,完成人机交互,从而实现机器人的智能大脑。
附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1示出了本申请一实施例提出的一种信息处理方法的流程图;
[0011]图2示出了本申请另一实施例提出的一种信息处理方法的流程图;
[0012]图3示出了本申请另一实施例中的transformer模型的框架图;
[0013]图4示出了本申请另一实施例中的ChatGPT模型的架构图;
[0014]图5示出了本申请另一实施例中GLM模型的预训练过程的示意图;
[0015]图6示出了本申请实施例提出的一种信息处理装置的结构框图;
[0016]图7示出了本申请实施例提出的一种信息处理装置的结构框图;
[0017]图8示出了本申请实施例中的用于执行根据本申请实施例的信息处理方法的机器人的结构框图;
[0018]图9示出了本申请实施例中的用于保存或者携带实现根据本申请实施例的信息处理方法的程序代码的存储单元。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]随着智能机器人在室内家庭场景中的应用,对其智能化理解的要求越来越高,例如智能家居控制、家庭助手、家庭娱乐、家庭安防等,使得预训练大模型成为重要组成部分,从而实现对特定场景的上下文理解,充分理解人类的思想,使机器人构成智能大脑。
[0021]现有的预训练自然语言大模型框架主要可以分为以下几类,一类是自回归模型(AutoRegressive,AR),按照顺序逐个预测下一个单词,主要以GPT(Generative Pre

trained Transformer,生成式预训练转换器)为主,优点是生成流畅的文本,缺点是在专业领域无法给出正确回答,需要给出足够的prompt才能给出可能正确的回答;一类是自编码器模型(AutoEncoding,AE),将输入文本编码成一个潜在表示,然后再解码生成输出,主要以BERT(Bidirectional Encoder Representations from Transformers,基于转换器的双向编码器)为主,优点是生成速度较快,缺点是生成的文本可能存在一些不连贯或不自然的问题;一类是自监督学习模型,使用大量未标记的数据进行预训练,然后在具体任务上进行微调,主要以MASS(Masked Sequence

toSequence Pretraining,掩码序列到序列预训练)、BART(Bidirectional and Auto

Regressive Transformers,双向和自回归转换器)为主,这样的模型能够学习丰富的语言表示,但在某些特定任务上可能需要更多的标记数据来进行微调。
[0022]在上述方法中,大部分的预训练模型是基于通用语料库进行训练的。然而,这些模型往往无法充分理解特定领域或场景中的上下文信息。在室内家庭场景中,人们经常使用特定的词汇、习惯用语和特定领域的知识,因此需要一种针对室内家庭环境的预训练模型。
[0023]因此,专利技术人提出了本申请中的信息处理方法、装置、机器人以及存储介质。获取
待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息,获取待识别信息对应的提示信息,将待识别信息和提示信息输入到目标预训练模型中,获取目标预训练模型输出的待识别信息对应的输出结果。通过上述方法,可以根据待识别信息构造可行的提示信息,然后通过目标预训练模型获得机器人可以理解的输出结果,完成人机交互,从而实现机器人的智能大脑。
[0024]下面将结合附图具体描述本申请的各实施例。
[0025]请参阅图1,本申请实施例提供的一种信息处理方法,应用于机器人,所述方法包括:
[0026]步骤S110:获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息。
[0027]在本申请实施例中,待识别信息为用户输入的需要通过目标预训练模型进行意图识别的信息。其中,待识别信息可以为文本信息、语音信息或图像信息,在此不做具体限定。预设室内家庭场景指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,应用于机器人,所述方法包括:获取待识别信息,其中,所述待识别信息为预设室内家庭场景下输入的信息;获取所述待识别信息对应的提示信息;将所述待识别信息和所述提示信息输入到目标预训练模型中,获取所述目标预训练模型输出的所述待识别信息对应的输出结果。2.根据权利要求1所述的方法,其特征在于,所述将所述待识别信息和所述提示信息输入到目标预训练模型中,获取所述目标预训练模型输出的所述待识别信息对应的输出结果之后还包括:控制所述机器人执行与所述输出结果对应的操作。3.根据权利要求1所述的方法,其特征在于,所述获取待识别信息,包括:通过语音输入方式,获取所述待识别信息;或者,通过文本输入方式,获取所述待识别信息。4.根据权利要求1所述的方法,其特征在于,所述提示信息为第一预设格式的提示信息或第二预设格式的提示信息,其中,所述第一预设格式的提示信息用于指示将所述待识别信息进行任务分解;所述第二预设格式的提示信息用于指示将所述待识别信息进行任务分解以及与视觉自然语言模型进行接入,以提升所述目标预训练模型对于空间位置关系的输出。5.根据权利要求1所述的方法,其特征在于,所述获取待识别信息之前还包括:获取训练数据集,所述训练数据集包括用于表征室内家庭场景中的交互的多种语料数据;将所述训练数据集输入到多个待训练模型中,对所述多个待训练模型进行训练,直至满足训练结束条件,得到多个预训练模型,其中,所述多个待训练模型为大语言模型;从所述多个预训练...

【专利技术属性】
技术研发人员:吴若溪
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1