一种信息查询方法、装置、设备和存储介质制造方法及图纸

技术编号：27226490 阅读：18 留言：0更新日期：2021-02-04 11:49

本公开实施例公开了一种查询方法、装置、设备和存储介质，其中，所述方法包括：基于预先采集的数据构建语料库，并统计语料库中的每个词的词频；获取用户输入的语音查询指令，并对语音查询指令进行用户意图识别，得到用户意图对应的文字对象；根据文字对象的拼音和声调，在语料库中进行检索，得到至少一个检索结果；读取每个检索结果对应的词频，并根据词频对至少一个检索结果进行排序；根据排序结果显示所述至少一个检索结果，以供用户选择；响应于用户对某一检索结果的触发操作，导航到下一级页面进行信息查询。本发明专利技术实施例实现了通过语音即可查询文字的目的，而且同时将相同发音的文字按照词频大小顺序展示给用户选择，提升了查询效率。询效率。询效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种信息查询方法、装置、设备和存储介质

[0001]本公开实施例涉及计算机
，尤其涉及一种信息查询方法、装置、设备和存储介质。

技术介绍

[0002]日常生活中很容易遇到一些不熟悉的词语，或者忘记怎么书写的词语，通常利用字典通过手动输入进行查询。然而在汉语中，有很多的字都存在一字多音、或者多意思的状态，当用户需要询问某一个多音或多意思字怎么书写的时候，通常字典可查询的字或词较多，使得无法快速准确的识别出用户需求的目标文字，识别效率低。
[0003]公开内容
[0004]本公开实施例提供一种信息查询方法、装置、设备和存储介质，以达到快速准确的识别出用户需求文字的目的。
[0005]第一方面，本公开实施例提供了一种信息查询方法，该方法包括：
[0006]基于预先采集的数据构建语料库，并统计所述语料库中的每个词的词频；
[0007]获取用户输入的语音查询指令，并对所述语音查询指令进行用户意图识别，得到所述用户意图对应的文字对象；
[0008]根据所述文字对象的拼音和声调，在所述语料库中进行检索，得到至少一个检索结果，其中所述检索结果为与所述文字对象具有相同发音的词；
[0009]读取每个检索结果对应的词频，并根据所述词频对所述至少一个检索结果进行排序；
[0010]根据排序结果显示所述至少一个检索结果，以供用户选择；
[0011]响应于用户对某一检索结果的触发操作，导航到下一级页面进行信息查询。
[0012]第二方面，本公开实施例还提供了...

【技术保护点】

【技术特征摘要】
1.一种信息查询方法，其特征在于，包括：基于预先采集的数据构建语料库，并统计所述语料库中的每个词的词频；获取用户输入的语音查询指令，并对所述语音查询指令进行用户意图识别，得到所述用户意图对应的文字对象；根据所述文字对象的拼音和声调，在所述语料库中进行检索，得到至少一个检索结果，其中所述检索结果为与所述文字对象具有相同发音的词；读取每个检索结果对应的词频，并根据所述词频对所述至少一个检索结果进行排序；根据排序结果显示所述至少一个检索结果，以供用户选择；响应于用户对某一检索结果的触发操作，导航到下一级页面进行信息查询。2.根据权利要求1所述的方法，其特征在于，基于预先采集的数据构建语料库，并统计所述语料库中每个词的词频，包括：对采集到的数据进行分词处理，去除其中包括的停用词或无意义词，得到语料库；基于TF-IDF算法进行词频统计，并将词频统计结果以数据列表的形式保存在语料库中。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：将排在第一位的检索结果进行高亮显示。4.根据权利要求1所述的方法，其特征在于，对所述用户语音查询指令进行用户意图识别，得到所述用户意图对应的文字对象，包括：对用户的语音查询指令进行识别，得到所述语音查询指令对应的文字信息；将所述文字信息与预先存储的意图列表进行匹配，以确定用户意图以及用户意图对应的文字对象。5.一种信息查询装置，其特征在于，所述装置包括：构建模块，用于基于预先采集的数据构建语料库，并统计所述语料库中的每个词的词频；获取识别模块，用于获取用户输入的语音查询指令，并对所述语音查询指令进行用户意图识别，得到所...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人