一种语音查询方法、装置、服务器和可读存储介质制造方法及图纸

技术编号:27468911 阅读:28 留言:0更新日期:2021-03-02 17:33
本发明专利技术实施例提供了一种语音查询方法、装置、服务器和可读存储介质,其中方法包括:获取待处理音频,对所述待处理音频进行语音识别,得到目标字符文本;将所述目标字符文本转换为第一拼音文本,根据字典和所述第一拼音文本,确定所述目标字符文本的目标关键词,所述字典中包含多个关键词以及与每个关键词对应的词组拼音;生成包含所述目标关键词的查询语句,在知识图谱中根据所述查询语句获取所述待处理音频的答案文本;输出所述答案文本,可以有效提高语义解析的准确率,进而提高了语音查询的有效性和准确性。的有效性和准确性。的有效性和准确性。

【技术实现步骤摘要】
一种语音查询方法、装置、服务器和可读存储介质


[0001]本专利技术涉及智能识别
,尤其涉及一种语音查询方法、装置、服务器和可读存储介质。

技术介绍

[0002]近年来,随着人工智能等技术的快速发展,人机交互的方式也发生了重大的改变。一些智能硬件产品的出现极大改变了人们的生活方式,而传统的界面点按式的交互方式已经无法满足日益丰富的应用需求,这意味着需要一种更加高效、快捷、便利的人机交互方式。其中,人机交互中涉及的语音交互的本质是人与机器的对话,机器识别语音,得到对应的文本,并确定该文本的正确含义,进而基于文本含义查询答案。但是目前语音识别技术尚未成熟,无法保证语音识别的准确性,导致查询到的答案准确率低下。

技术实现思路

[0003]本专利技术实施例提供了一种语音查询方法、装置、服务器和可读存储介质,可以有效提高语义解析的准确率,进而提高了语音查询的有效性和准确性。
[0004]本申请实施例一方面提供了一种语音查询方法,包括:
[0005]获取待处理音频,对所述待处理音频进行语音识别,得到目标字符文本;
[0006]将所述目标字符文本转换为第一拼音文本,根据字典和所述第一拼音文本,确定所述目标字符文本的目标关键词,所述字典中包含多个关键词以及与每个关键词对应的词组拼音;
[0007]生成包含所述目标关键词的查询语句,在知识图谱中根据所述查询语句获取所述待处理音频的答案文本;
[0008]输出所述答案文本。
[0009]本申请实施例一方面提供了一种语音查询装置,包括:
[0010]处理模块,用于获取待处理音频,对所述待处理音频进行语音识别,得到目标字符文本;
[0011]所述处理模块,还用于将所述目标字符文本转换为第一拼音文本,根据字典和所述第一拼音文本,确定所述目标字符文本的目标关键词,所述字典中包含多个关键词以及与每个关键词对应的词组拼音;
[0012]所述处理模块,还用于生成包含所述目标关键词的查询语句,在知识图谱中根据所述查询语句获取所述待处理音频的答案文本;
[0013]输出模块,用于输出所述答案文本。
[0014]本申请实施例一方面提供了一种服务器,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述所述的语音查询方法。
[0015]本申请实施例一方面提供了一种计算机可读存储介质,该计算机可读存储介质中
存储有程序指令,该程序指令被执行时,用于实现上述所述的语音查询方法。
[0016]本申请实施例一方面提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机指令被服务器的处理器执行时,执行上述所述的语音查询方法。
[0017]在本申请实施例中,服务器可对获取的待处理音频进行语音识别,得到目标字符文本。在进行语音识别时,由于语音识别错误率比较高,因此可将目标字符文本转换成目标拼音文本,然后根据字典和目标拼音文本来确定目标字符文本的目标关键词,这样可以有效提高语义解析的准确性。进而可以保证根据生成的包含目标关键词的查询语句,在知识图谱中查询的答案文本的准确性和有效性。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1a是本专利技术实施例提供的一种语义解析的流程示意图;
[0020]图1b是本专利技术实施例提供的一种语音查询系统的结构示意图;
[0021]图1c是本专利技术实施例提供的一种语音查询方法的流程示意图;
[0022]图1d是本专利技术实施例提供的一种语音查询界面的结构示意图;
[0023]图2是本专利技术实施例提供的一种语音查询方法的流程示意图;
[0024]图3是本专利技术实施例提供的在语音查询界面输出答案文本的示意图;
[0025]图4是本专利技术实施例提供的一种语音查询方法的流程示意图;
[0026]图5a是本专利技术实施例提供的输出提示信息的示意图;
[0027]图5b是本专利技术实施例提供的人物名称字典的示意图;
[0028]图5c是本专利技术实施例提供的输出查询意图的示意图;
[0029]图6是本专利技术实施例提供的一种语音查询装置的结构示意图;
[0030]图7是本专利技术实施例提供的一种服务器的结构示意图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0033]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层
面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0034]自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
[0035]本申请实施例提供的语音查询方法涉及人工智能的自然语音处理技术,可对获取到的待处理音频进行语音识别,得到初始字符文本,并对该初始字符文本进行语义解析,其中,对初始字符文本进行语义解析过程可参见图1a。在语义解析过程中,首先,可将初始字符文本进行数据清洗,得到目标字符文本,并将目标字符文本转拼音(即汉字转拼音),然后利用字典进行文本特征识别,得到目标关键词;在文本特征识别的过程中,还可采用近似匹本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音查询方法,其特征在于,包括:获取待处理音频,对所述待处理音频进行语音识别,得到目标字符文本;将所述目标字符文本转换为第一拼音文本,根据字典和所述第一拼音文本,确定所述目标字符文本的目标关键词,所述字典中包含多个关键词以及与每个关键词对应的词组拼音;生成包含所述目标关键词的查询语句,在知识图谱中根据所述查询语句获取所述待处理音频的答案文本;输出所述答案文本。2.根据权利要求1所述的方法,其特征在于,所述根据字典和所述第一拼音文本,确定所述目标字符文本的目标关键词,包括:将所述第一拼音文本划分为多个第一词组拼音;在所述字典中查找与任一第一词组拼音相同的第一匹配词组拼音,将所述第一匹配词组拼音对应的关键词作为第一初始关键词;若所述第一初始关键词的数量等于第一阈值,则将所述第一初始关键词作为目标关键词。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述第一初始关键词的数量小于第一阈值,则从拼音集合包含的多个参考拼音序列查找与所述第一拼音文本匹配的参考拼音序列,将查找到的参考拼音序列作为第二拼音文本;所述第二拼音文本与所述第一拼音文本之间的相似度大于相似阈值;将所述第二拼音文本划分为多个第二词组拼音;在所述字典中查找与任一第二词组拼音相同的第二匹配词组拼音,并将所述第二匹配词组拼音对应的关键词作为第二初始关键词;将所述第一初始关键词和所述第二初始关键词合并为目标关键词。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取字符拼音集合,所述字符拼音集合包括多个字符拼音;将所述字符拼音集合中的所述多个字符拼音组合成多个参考拼音序列,得到所述拼音集合;则所述从拼音集合包含的多个参考拼音序列查找与所述第一拼音文本匹配的参考拼音序列,包括:将所述第一拼音文本进行编码处理,得到拼音向量;对每个参考拼音序列分别进行编码处理,得到多个参考向量;计算所述拼音向量与各参考向量之间的余弦相似度;从所述多个参考拼音序列中,选择余弦相似度最大的参考向量对应的参考拼音序列作为第二拼音文本。5.根据权利要求2所述的方法,其特征在于,所述方法还...

【专利技术属性】
技术研发人员:何赛克徐辉郑晓龙曾大军
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1