【技术实现步骤摘要】
一种智能语音辅助搜索的方法
[0001]本专利技术涉及智能语音搜索
,具体为一种智能语音辅助搜索的方法。
技术介绍
[0002]随着智能设备、人机交互以及Al技术的发展,对语音搜索相关技术、特别是在速度和精准度方面的要求越来越严格,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,随着语音识别技术的不断发展,语音识别技术的应用范围也越来越广泛,随着语音识别准确度的提升,越来越多的用户习惯于采用语音索方式,从而避免进行键盘输入,简化搜索过程。
[0003]目前,随着智能终端技术的飞速发展,使用智能终端进行语音搜索的不同年龄和不同地区的人越来越多,老人和小孩的发音不够标准,同时不同地区的方言发音不一,造成语音识别经常出错,导致搜索空间膨胀,搜索结果和用户意图大相径庭、搜索速度慢等问题,极大的影响用户语音搜索体验,并且查询语句中会掺杂一些被识别错误的词句,从而影响了搜索引擎的准确率,为此我们提出了一种智能语音辅助搜索的方法。
技术实现思路
[0004]本专利技术的目的在于提供一种智能语音辅助搜索的方法,以解决上述
技术介绍
中提出了目前,随着智能终端技术的飞速发展,使用智能终端进行语音搜索的不同年龄和不同地区的人越来越多,老人和小孩的发音不够标准,同时不同地区的方言发音不一,极大的影响用户语音搜索体验,并且查询语句中会掺杂一些被识别错误的词句的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种智能语音辅助搜索的方法,包括:r/>[0006]采集用户语音数据,判断用户输入的语音信号;
[0007]智能语音数据,进行人工智能语音识别处理,将用户语音数据进行识别、转化为文本数据;
[0008]并对搜索文本进行类别分析,根据搜索文本类别以及查询意图对搜索文本进行进一步筛选;
[0009]根据筛选后的数据文本按资源的热度对初步搜索结果进行排序,得到最终语音搜索结果。
[0010]所述的语音数据,获取关键字集合中每个字的读音,并给读音集合中的每个读音建立对应的拼音资源索引,同时获取关键字集合中每个字的编码,并给字符编码集合中每个字符建立对应的字符资源索引。
[0011]根据所述的判断用户输入的语音信号,判断模块获取接收器接收的样本语音并提取所述样本语音的声学特征,然后对声学特征进行词法分析。
[0012]所述的智能语音数据包括:多轮搜索、智能纠错和童声识别,联系上下文语境,理解用户需求,满足多轮搜索需求。
[0013]所述的智能纠错,根据时效性热词进行同音字替换,也可实现多轮同音纠错。
[0014]所述的童声识别,精准识别语音输入中儿童的声纹,提供符合儿童特点的搜索结果,满足儿童搜索的趣味性和安全性。
[0015]所述的筛选数据文本,将样本语音转换成文本内容,按照本内容进行搜索得到搜索结果并对搜索结果进行筛选去除相关度不高的内容,并且根据搜索文本的搜索频率和匹配满意度,对搜索文本与搜索词之间的相似度进行修正。
[0016]所述的数据文本筛选后,将筛选后的搜索结果反馈给用户,并且记录用户搜索习惯和指令。
[0017]与现有技术相比,本专利技术的有益效果是:该智能语音辅助搜索的方法,通过接收的样本语音并提取所述样本语音的声学特征,然后对声学特征进行词法分析,联系上下文语境,理解用户需求,满足多轮搜索需求,精准识别语音输入中儿童的声纹,根据时效性热词进行同音字替换,也可实现多轮同音纠错,提供符合儿童特点的搜索结果,满足儿童搜索的趣味性和安全性,并且根据搜索文本的搜索频率和匹配满意度,对搜索文本与搜索词之间的相似度进行修正,避免查询语句中会掺杂一些被识别错误的词句,提高搜索引擎的准确率。
附图说明
[0018]图1为本专利技术实施例提供的一种智能语音辅助搜索的方法流程图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]实施例一:
[0021]请参阅图1,本专利技术提供一种技术方案:一种智能语音辅助搜索的方法,包括:
[0022]采集用户语音数据,判断用户输入的语音信号;
[0023]智能语音数据,进行人工智能语音识别处理,将用户语音数据进行识别、转化为文本数据;
[0024]并对搜索文本进行类别分析,根据搜索文本类别以及查询意图对搜索文本进行进一步筛选;
[0025]根据筛选后的数据文本按资源的热度对初步搜索结果进行排序,得到最终语音搜索结果。
[0026]所述的语音数据,获取关键字集合中每个字的读音,并给读音集合中的每个读音建立对应的拼音资源索引,同时获取关键字集合中每个字的编码,并给字符编码集合中每个字符建立对应的字符资源索引。
[0027]根据所述的判断用户输入的语音信号,判断模块获取接收器接收的样本语音并提取所述样本语音的声学特征,然后对声学特征进行词法分析。
[0028]所述的智能语音数据包括:多轮搜索、智能纠错和童声识别,联系上下文语境,理
解用户需求,满足多轮搜索需求。
[0029]所述的智能纠错,根据时效性热词进行同音字替换,也可实现多轮同音纠错。
[0030]所述的童声识别,精准识别语音输入中儿童的声纹,提供符合儿童特点的搜索结果,满足儿童搜索的趣味性和安全性。
[0031]所述的筛选数据文本,将样本语音转换成文本内容,按照本内容进行搜索得到搜索结果并对搜索结果进行筛选去除相关度不高的内容,并且根据搜索文本的搜索频率和匹配满意度,对搜索文本与搜索词之间的相似度进行修正。
[0032]所述的数据文本筛选后,将筛选后的搜索结果反馈给用户,并且记录用户搜索习惯和指令。
[0033]通过接收的样本语音并提取所述样本语音的声学特征,然后对声学特征进行词法分析,联系上下文语境,理解用户需求,满足多轮搜索需求,精准识别语音输入中儿童的声纹,根据时效性热词进行同音字替换,也可实现多轮同音纠错,提供符合儿童特点的搜索结果,满足儿童搜索的趣味性和安全性,能够有效识别用户输入的语音信号是否为童声,并对儿童语音搜索者进行搜索文本的屏蔽动作,避免儿童浏览到充斥着不健康内容的网页,识别语音信号得到搜索词,通过从历史搜索记录中匹配与搜索词相似的搜索文本,能够提高对口语化的语音信号匹配搜索内容时的准确度;根据搜索文本类别以及查询意图对搜索文本进行进一步筛选。
[0034]实施例二:
[0035]请参阅图1,本专利技术提供一种技术方案:一种智能语音辅助搜索的方法,包括:
[0036]采集用户语音数据,判断用户输入的语音信号;
[0037]智能语音数据,进行人工智能语音识别处理,将用户语音数据进行识别、本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种智能语音辅助搜索的方法,其特征在于:包括:采集用户语音数据,判断用户输入的语音信号;智能语音数据,进行人工智能语音识别处理,将用户语音数据进行识别、转化为文本数据;并对搜索文本进行类别分析,根据搜索文本类别以及查询意图对搜索文本进行进一步筛选;根据筛选后的数据文本按资源的热度对初步搜索结果进行排序,得到最终语音搜索结果。2.根据权利要求1所述的一种智能语音辅助搜索的方法,其特征在于:所述的语音数据,获取关键字集合中每个字的读音,并给读音集合中的每个读音建立对应的拼音资源索引,同时获取关键字集合中每个字的编码,并给字符编码集合中每个字符建立对应的字符资源索引。3.根据权利要求1所述的一种智能语音辅助搜索的方法,其特征在于:根据所述的判断用户输入的语音信号,判断模块获取接收器接收的样本语音并提取所述样本语音的声学特征,然后对声学特征进行词法分析。4.根据权利要求1所述的一种智能语音辅助搜索的方法,其特征在于...
【专利技术属性】
技术研发人员:毛新华,王晨旭,张洪岭,马龙,张鹏,车玲,
申请(专利权)人:合肥中科云数科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。