System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种显示设备及未登录词的确定方法技术_技高网

一种显示设备及未登录词的确定方法技术

技术编号:42330184 阅读:4 留言:0更新日期:2024-08-14 16:07
本申请提供一种显示设备及未登录词的确定方法,方法包括:获取用户日志数据,以及对用户日志数据执行分词处理,得到候选词;计算候选词的第一得分和第二得分,根据第一阈值和第二阈值对第一得分和第二得分执行筛选,以保留第一有效得分和第二有效得分;将第一有效得分和第二有效得分输入到预设语言模型,以得到候选词的二分类值;二分类值为预设语言模型对候选词评估后得到的二分类结果值;根据第三阈值和二分类值确定用户日志数据中的未登录词。所述方法只保留预设语言模型有高置信度的未登录词识别结果,以提高未登录词识别的准确性,解决未登录词的确定准确率低的问题。

【技术实现步骤摘要】

本申请涉及显示设备,尤其涉及一种显示设备及未登录词的确定方法


技术介绍

1、显示设备不仅可以输出电影、电视、图片等各种媒资,还可以具备语音识别的功能。语音识别也可以称作自动语音识别(automatic speech recognition,asr),其目标是将包含在语音信号中的内容转换为计算机可读的输入,例如文本序列等。

2、语音识别产品功能的实现离不开语言模型的支持,语言模型负责将输入的语音信号转化为文本,并基于文本内容进行后续的处理和回应。为了实现高效的语音识别和准确的语义理解,语言模型依赖于一个庞大的词库表数据。该词库表可以包含语言模型能够识别的所有词汇和短语,是语言模型进行词汇匹配和语义分析的基础。然而,由于语言的复杂性和多样性,任何一个词库表都无法包含所有可能出现的词汇。在实际应用中,用户输入的语音信号中往往会包含一些未出现在词库表中的词,即“未登录词”,又可以称为新词。对于未登录词,传统的语言模型往往无法进行有效的识别和处理,导致语言模型识别准确率下降,用户体验差。

3、为了解决未登录词的问题,可以通过人工审核的方式对词库表进行补充。然而,一方面,人工审核需要耗费大量的人力资源和时间成本,尤其是在处理海量数据和实时更新方面,未登录词的识别效率较低、难以满足实际需求。另一方面,人工审核的主观性和不一致性可能导致词库表的质量参差不齐,影响语言模型识别的准确率。因此,对于未登录词的确定存在准确率低的问题。


技术实现思路

1、本申请一些实施例提供一种显示设备及及未登录词的确定方法,以解决未登录词的确定准确率低的问题。

2、第一方面,本申请一些实施例提供一种显示设备,包括:

3、显示器,被配置为显示用户界面;

4、控制器,被配置为:

5、获取用户日志数据,以及对所述用户日志数据执行分词处理,得到候选词;

6、计算所述候选词的第一得分和第二得分,所述第一得分用于表征所述候选词的邻近词的丰富程度得分,所述第二得分用于表征所述候选词的内部凝聚程度得分;

7、根据第一阈值和第二阈值对所述第一得分和所述第二得分执行筛选,以保留第一有效得分和第二有效得分;所述第一有效得分为分数高于所述第一阈值的第一得分,所述第二有效得分为分数高于所述第二阈值的第二得分;

8、将所述第一有效得分和所述第二有效得分输入到预设语言模型,以得到所述候选词的二分类值;所述二分类值为所述预设语言模型对所述候选词评估后得到的二分类结果值;

9、根据第三阈值和所述二分类值确定所述用户日志数据中的未登录词。

10、第二方面,本申请一些实施例提供一种未登录词的确定方法,可以应用于第一方面的显示设备,所述显示设备包括显示器和控制器,所述方法包括:

11、获取用户日志数据,以及对所述用户日志数据执行分词处理,得到候选词;

12、计算所述候选词的第一得分和第二得分,所述第一得分用于表征所述候选词的邻近词的丰富程度得分,所述第二得分用于表征所述候选词的内部凝聚程度得分;

13、根据第一阈值和第二阈值对所述第一得分和所述第二得分执行筛选,以保留第一有效得分和第二有效得分;所述第一有效得分为分数高于所述第一阈值的第一得分,所述第二有效得分为分数高于所述第二阈值的第二得分;

14、将所述第一有效得分和所述第二有效得分输入到预设语言模型,以得到所述候选词的二分类值;所述二分类值为所述预设语言模型对所述候选词评估后得到的二分类结果值;

15、根据第三阈值和所述二分类值确定所述用户日志数据中的未登录词。

16、由以上技术方案可知,本申请一些实施例提供一种显示设备及未登录词的确定方法,方法包括:获取用户日志数据,以及对用户日志数据执行分词处理,得到候选词;计算候选词的第一得分和第二得分,第一得分用于表征候选词的邻近词的丰富程度得分,第二得分用于表征候选词的内部凝聚程度得分;根据第一阈值和第二阈值对第一得分和第二得分执行筛选,以保留第一有效得分和第二有效得分;第一有效得分为分数高于第一阈值的第一得分,第二有效得分为分数高于第二阈值的第二得分;将第一有效得分和第二有效得分输入到预设语言模型,以得到候选词的二分类值;二分类值为预设语言模型对候选词评估后得到的二分类结果值;根据第三阈值和二分类值确定用户日志数据中的未登录词。所述方法只保留预设语言模型有高置信度的未登录词识别结果,以提高未登录词识别的准确性,解决未登录词的确定准确率低的问题。

本文档来自技高网...

【技术保护点】

1.一种显示设备,其特征在于,包括:

2.根据权利要求1所述的显示设备,其特征在于,所述控制器进一步被配置为:

3.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述用户日志数据执行分词处理,得到候选词,进一步被配置为:

4.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述用户日志数据执行分词处理,得到候选词,进一步被配置为:

5.根据权利要求1所述的显示设备,其特征在于,所述控制器执行计算所述候选词的第一得分,进一步被配置为:

6.根据权利要求1所述的显示设备,其特征在于,所述控制器执行计算所述候选词的第二得分,进一步被配置为:

7.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据第一阈值和第二阈值对所述第一得分和所述第二得分执行筛选,以保留第一有效得分和第二有效得分,进一步被配置为:

8.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据第三阈值和所述二分类值确定所述用户日志数据中的未登录词,进一步被配置为:

9.根据权利要求1所述的显示设备,其特征在于,所述控制器进一步被配置为:

10.一种未登录词的确定方法,应用于权利要求1-9任一项所述的显示设备,所述显示设备包括显示器和控制器,其特征在于,所述方法包括:

...

【技术特征摘要】

1.一种显示设备,其特征在于,包括:

2.根据权利要求1所述的显示设备,其特征在于,所述控制器进一步被配置为:

3.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述用户日志数据执行分词处理,得到候选词,进一步被配置为:

4.根据权利要求2所述的显示设备,其特征在于,所述控制器执行对所述用户日志数据执行分词处理,得到候选词,进一步被配置为:

5.根据权利要求1所述的显示设备,其特征在于,所述控制器执行计算所述候选词的第一得分,进一步被配置为:

6.根据权利要求1所述的显示设备,其特征在于,所述控制器执行计算所述候选词...

【专利技术属性】
技术研发人员:柳志德
申请(专利权)人:海信电子科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1