当前位置: 首页 > 专利查询>谷晓佳专利>正文

中英文相关词汇获取方法及装置制造方法及图纸

技术编号:22218926 阅读:31 留言:0更新日期:2019-09-30 01:16
本发明专利技术实施例公开了一种中英文相关词汇获取方法及装置,所述方法包括:获取用户输入的待检索词汇或者图片;将待检索词汇或者图片,输入至预设词汇库神经网络模型,输出待检索词汇或者图片的识别结果,其中,预设词汇库神经网络模型包括两个部分;根据待检索词汇或者图片的识别结果,从预设词库中查找出待检索词汇的相关词汇,其中,预设词典数据库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。本发明专利技术实施例公开的中英文相关词汇获取方法及装置,利用词汇库神经网络模型对词进行查询,支持图片关于词汇的检索,进而能够提高查词的效率,还能展示出单词之间的相关性,便于使用者到更大的范围内认知词汇。

Methods and Devices for Acquisition of Chinese and English Related Vocabulary

【技术实现步骤摘要】
中英文相关词汇获取方法及装置
本专利技术实施例涉及计算机
,具体涉及一种中英文相关词汇获取方法及装置。
技术介绍
大多情况下,人们常常使用的词典包括新华字典、汉语词典、同义词典、反义词典等,其中现代汉语词典是包括字、词、词组、熟词、成语等词汇的工具书。网上字典:也叫网络字典,网上词典等。以收录字词、百科知识以及各种人物等类似于百科全书的网上查询工具。和普通的字典相比,它涉及的范围更广泛,领域更广阔,不受行业等因素的限制。网上字典大全因其方便实用快捷从而使其成为网友使用最多的工具字典。目前,很多字典网站提供的功能多为以查询指定单词为核心,进一步进行短语、相关文章等信息的展示。但是,这样的展示方式具有比较大的限定性,较少展示出单词之间的相关性。因此,提出查询单词时,同时展示出相关单词的查询列表,包括包含单词词素的所有单词、形近词、近义词、同义词、反义词、上义词、下义词、关键词等。同理,查询中文词汇时,采用类似上述方式查询。
技术实现思路
为此,本专利技术实施例提供一种中英文相关词汇获取方法及装置,以解决现有技术中由于仅能查询核心单词而导致的无法扩展词汇的问题。为了实现上述目的,本专利技术实施例提供如下技术方案:根据本专利技术实施例的第一方面提供一种中英文相关词汇获取方法,包括:获取用户输入的待检索词汇或者图片;将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到的;根据所述待检索词汇或者图片的识别结果,从预设词库中查找出所述待检索词汇的相关词汇,其中,所述预设词库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。进一步地,获取所述预设词汇库神经网络模型的具体步骤如下:获取若干个文字或者实物样本的图片,以及每一文字或者实物样本的识别结果标记;提取每一图片样本的特征;利用所有的图片样本的特征,以及每一图片样本的识别结果标记,对目标检测神经网络进行训练,得到所述预设目标检测神经网络模型;解析字典中词汇关联;根据词汇关联形成不同词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇;进而形成词汇库神经网络模型。进一步地,所述待检索词汇为中文或英文文字信息,包括单个或多个词汇以及段落文字、文章等;所述图片包括文字图片或者实物图片,其中,文字图片包括中文或英文文字。进一步地,所述相关词汇包括同义词、反义词、近义词、上义词、下义词和关键词。进一步地,当图片为文字图片时,所述特征为文字的最小词单位,所述最小词单位为偏旁部首、其余部分或英文字母;当图片为实物字图片时,所述特征为实物各个组成部分。根据本专利技术实施例的第二方面提供一种中英文相关词汇获取装置,包括:获取模块,用于获取用户输入的待检索词汇或者图片;识别模块,用于将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到的;查找模块,用于根据所述待检索词汇或者图片的识别结果,从预设词库中查找出所述待检索词汇的相关词汇,其中,所述预设词库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。进一步地,所述装置还包括训练模块,用于:获取若干个文字或者实物样本的图片,以及每一文字或者实物样本的识别结果标记;提取每一图片样本的特征;利用所有的图片样本的特征,以及每一图片样本的识别结果标记,对目标检测神经网络进行训练,得到所述预设目标检测神经网络模型;解析字典中词汇关联;根据词汇关联形成不同词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇;进而形成词汇库神经网络模型。进一步地,所述待检索词汇为中文或英文文字信息,包括单个或多个词汇以及段落文字、文章等;所述图片包括文字图片或者实物图片,其中,文字图片包括中文或英文文字。再一方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器,以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述方法的步骤。又一方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现上述方法的步骤。本专利技术实施例具有如下优点:本专利技术实施例公开的中英文相关词汇获取方法及装置,利用词汇库神经网络模型对词进行查询,不仅能够提高查词的效率,还能展示出单词之间的相关性,便于使用者到更大的范围内认知词汇。附图说明为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本专利技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本专利技术所能产生的功效及所能达成的目的下,均应仍落在本专利技术所揭示的
技术实现思路
得能涵盖的范围内。图1为本专利技术实施例提供的一种中英文相关词汇获取方法示意图;图2为本专利技术实施例提供的词汇组的示意图;图3为本专利技术实施例提供的一种中英文相关词汇获取装置示意图;图4为本专利技术实施例提供的电子设备的结构示意图。具体实施方式以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的一种中英文相关词汇获取方法示意图,如图1所示,本专利技术实施例提供一种中英文相关词汇获取方法,其执行主体为中英文相关词汇获取装置,该方法包括:步骤S101、获取用户输入的待检索词汇或者图片;步骤S102、将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到的;步骤S103、根据所述待检索词汇或者图片的识别结果,从预设词库中查找出所述待检索词汇的相关词汇,其中,所述预设词库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。具体来说,本专利技术实施例涉及的中英文相关词汇获取装置包括获取模块、识别模块和查找模块。首先,通过获取模块获取用户输入的待检索词汇或者图片。然后,通过识别模块将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到本文档来自技高网
...

【技术保护点】
1.一种中英文相关词汇获取方法,其特征在于,包括:获取用户输入的待检索词汇或者图片;将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到的;根据所述待检索词汇或者图片的识别结果,从预设词库中查找出所述待检索词汇的相关词汇,其中,所述预设词库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。

【技术特征摘要】
1.一种中英文相关词汇获取方法,其特征在于,包括:获取用户输入的待检索词汇或者图片;将所述待检索词汇或者图片,输入至预设词汇库神经网络模型,输出所述待检索词汇或者图片的识别结果,其中,所述预设词汇库神经网络模型包括两个部分,一部分是词库,另一部分是采用若干个图片样本对预设目标检测神经网络进行训练之后得到的;根据所述待检索词汇或者图片的识别结果,从预设词库中查找出所述待检索词汇的相关词汇,其中,所述预设词库中预先存储有若干个词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇。2.根据权利要求1所述的中英文相关词汇获取方法,其特征在于,获取所述预设词汇库神经网络模型的具体步骤如下:获取若干个文字或者实物样本的图片,以及每一文字或者实物样本的识别结果标记;提取每一图片样本的特征;利用所有的图片样本的特征,以及每一图片样本的识别结果标记,对目标检测神经网络进行训练,得到所述预设目标检测神经网络模型;解析字典中词汇关联;根据词汇关联形成不同词汇组,每一词汇组包含了一个元词汇,以及与该元词汇对应的相关词汇;进而形成词汇库神经网络模型。3.根据权利要求1所述的中英文相关词汇获取方法,其特征在于,所述待检索词汇为中文或英文文字信息,包括单个或多个词汇以及段落文字、文章等;所述图片包括文字图片或者实物图片,其中,文字图片包括中文或英文文字。4.根据权利要求1所述的中英文相关词汇获取方法,其特征在于,所述相关词汇包括同义词、反义词、近义词、上义词、下义词和关键词。5.根据权利要求2所述的中英文相关词汇获取方法,其特征在于,当图片为文字图片时,所述特征为文字的最小词单位,所述最小词单位为偏旁部首、其余部分或英文字母;当图片为实物字图片时,所述特征为实物各个组成部分。6.一种中英文相关词汇获取...

【专利技术属性】
技术研发人员:谷晓佳
申请(专利权)人:谷晓佳
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1