本发明专利技术提供了一种冰箱管理语料的标注方法、装置及存储介质。所述标注方法包括:获取用于冰箱管理的初始词条集合;根据所述初始词条集合中各词条匹配对应的槽位信息;将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息;根据所述槽位信息从所述初始词条集合提取关键词条;将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料;建立所述推荐语料的标签信息与所述初始词条集合的关联,以实现对所述初始词条集合的标注。本发明专利技术提供的上述冰箱管理语料的标注方法提升了语料标注的准确度,提高了语料标注效率,且避免了因标注人员的理解不同而影响语料标注质量。质量。质量。
【技术实现步骤摘要】
冰箱管理语料的标注方法、装置及可读存储介质
[0001]本专利技术涉及信息处理
,具体涉及一种冰箱管理语料的标注方法、装置及可读存储介质。
技术介绍
[0002]冰箱作为一种家用电器,已经离不开人们的日常生活中。传统的用户与冰箱的交互基本都是通过按键、旋钮或者触摸开关等方式实现,其现在已经无法满足用户日益繁多的使用场景。随着冰箱智能化的发展,智能冰箱能够通过语音识别功能与用户进行一些简单的语音交互,更好地理解用户的意图。
[0003]现有智能冰箱与用户的交互过程中,一般将用户输入的语音数据与冰箱系统内存储的语料数据比对,识别用户的意图,进而实现语音交互功能。因此需要在冰箱系统建立一个存储有大量语料数据的数据库。
[0004]现有语料数据库中语料数据的标注处理一般由专职语料标注人员对初始语料进行标注,然后将标注完成的语料数据添加至数据库。但是由于数据库中需要数量众多的语料数据,而标注人员的认知水平和操作习惯等常常会造成对初始语料的理解不同,从而导致语料数据的标注质量有所差异,标注效率较低。
技术实现思路
[0005]本专利技术提供了一种冰箱管理语料的标注方法、装置及可读存储介质,以提高语料标注的效率和准确度。
[0006]为实现上述专利技术目的之一,本专利技术一实施例提供了一种冰箱管理语料的标注方法,其包括:
[0007]获取用于冰箱管理的初始词条集合;
[0008]根据所述初始词条集合中各词条匹配对应的槽位信息;
[0009]将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息;
[0010]根据所述槽位信息从所述初始词条集合中提取关键词条;
[0011]将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料;
[0012]建立所述初始词条集合与所述推荐语料的标签信息的关联,以实现对所述初始词条集合的标注。
[0013]作为上述技术的进一步改进,上述步骤“将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息”具体包括:
[0014]根据所述槽位信息提取所述初始词条集合中的实体词条;
[0015]将所述实体词条和与所述实体词条对应的槽位信息输入分析模型,得到与所述实体词条对应的属性信息。
[0016]作为上述技术的进一步改进,所述槽位信息包括用于冰箱管理的行为信息;上述步骤“根据所述槽位信息从所述初始词条集合中提取关键词条”具体设置为:根据所述行为信息从所述初始词条集合中提取关键词条。
[0017]作为上述技术的进一步改进,上述步骤“将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料”具体包括:
[0018]将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到第一语料集合;
[0019]判断所述第一语料集合中的语料数据是否满足第一预设条件;
[0020]若所述第一语料集合中的语料数据满足第一预设条件,将所述第一语料集合中的语料数据确定为所述初始词条集合的推荐语料。
[0021]其中,所述第一预设条件设置为相似度大于或者等于预设的相似度阈值和/或相似度排在前M,M大于等于1且为整数。
[0022]进一步地,所述槽位信息是使用多组初始语料数据通过机器学习得出的;所述语料库是上述多组初始语料数据组成的语料训练集。
[0023]作为上述技术的进一步改进,所述冰箱管理语料的标注方法还包括:
[0024]在上述步骤“获取用于冰箱管理的初始词条集合”之前的步骤:获取用于冰箱管理的初始语料,对所述初始语料分词处理,得到初始词条集合;
[0025]在上述步骤“建立所述推荐语料的标签信息与所述初始词条集合的关联,以实现对所述初始词条集合的标注”之后的步骤:控制所述初始语料、与所述初始词条集合关联的标签信息添加至所述语料库。
[0026]本专利技术还提供了一种冰箱管理语料的标注装置,其包括:
[0027]获取模块,获取用于冰箱管理的初始词条集合;
[0028]特征提取模块,用于根据所述初始词条集合中各词条匹配对应的槽位信息;将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息;根据所述槽位信息从所述初始词条集合中提取关键词条;
[0029]标注模块,用于将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料;建立所述初始词条集合与所述推荐语料的标签信息的关联,以实现对所述初始词条集合的标注。
[0030]本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行上述冰箱管理语料的标注方法。
[0031]与现有技术相比,本专利技术的有益效果在于:本专利技术提供的冰箱管理语料的标注方法通过根据所述初始词条集合中各词条匹配对应的槽位信息;将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息;根据所述槽位信息从所述初始词条集合中提取关键词条;将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料;建立所述初始词条集合与所述推荐语料的标签信息的关联,以实现对所述初始词条集合的标注。从而能够提升语料标注的准确度,避免因标注人员的理解不同影响语料标注质量,提高语料标注效率。
附图说明
[0032]图1是本专利技术一实施例提供的冰箱管理语料的标注方法的流程示意图;
[0033]图2是图1中所示步骤“将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料”的流程示意图;
[0034]图3是本专利技术一实施例提供的冰箱管理语料的标注装置的结构示意图。
具体实施方式
[0035]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0036]本专利技术一实施例提供了一种冰箱管理语料的标注方法,如图1所示,其包括如下步骤:
[0037]S10,获取用于冰箱管理的初始词条集合;
[0038]具体地,在本专利技术一实施例中,在上述步骤S10“获取用于冰箱管理的初始词条集合”之前还包括步骤:获取用于冰箱管理的初始语料,对所述初始语料分词处理,得到初始词条集合。
[0039]其中,所述初始语料为技术人员收集的有关冰箱管理的语料,对所述初始语料进行分词处理,得到初始词条集合,再通过标注等操作将所述初始语料标注分类后存储至计算机存储介质内,使得所述初始语料作为冰箱人机交互阶段的对照数据。在上述标注方法中,通过对所述初始语料进行分词处理能够使得控制系统能够更清晰地理解所述初始语料的意图本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种冰箱管理语料的标注方法,其特征在于,包括如下步骤:获取用于冰箱管理的初始词条集合;根据所述初始词条集合中各词条匹配对应的槽位信息;将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息;根据所述槽位信息从所述初始词条集合中提取关键词条;将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料;建立所述初始词条集合与所述推荐语料的标签信息的关联,以实现对所述初始词条集合的标注。2.根据权利要求1所述冰箱管理语料的标注方法,其特征在于,上述步骤“将所述词条和与所述词条对应的槽位信息输入分析模型,得到与所述词条匹配的属性信息”具体包括:根据所述槽位信息从所述初始词条集合中提取实体词条;将所述实体词条和与所述实体词条对应的槽位信息输入分析模型,得到与所述实体词条对应的属性信息。3.根据权利要求1所述冰箱管理语料的标注方法,其特征在于,所述槽位信息包括用于冰箱管理的行为信息;上述步骤“根据所述槽位信息从所述初始词条集合中提取关键词条”具体设置为:根据所述行为信息从所述初始词条集合中提取关键词条。4.根据权利要求1所述冰箱管理语料的标注方法,其特征在于,上述步骤“将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到最相似的推荐语料”具体包括:将所述关键词条和所述属性信息与语料库中的语料数据进行相似度匹配,得到第一语料集合;判断所述第一语料集合中的语料数据是否满足第一预设条件;若所述第一语料集合中的语料数据满足第一预设条件,将所述第一语料集合中的语料数据确定为所述初始词条集合的推荐语料。5.根据权利要求4所述冰箱管理语料的标注方法,其特征...
【专利技术属性】
技术研发人员:李敏,曾谁飞,刘卫强,孔令磊,张景瑞,
申请(专利权)人:海尔智家股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。