数据搜索方法及装置制造方法及图纸

技术编号:24169005 阅读:20 留言:0更新日期:2020-05-16 02:20
本发明专利技术公开了一种数据搜索方法及装置,其中方法包括:获取自然语言输入信息;根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。本发明专利技术可以在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度。

Data search method and device

【技术实现步骤摘要】
数据搜索方法及装置
本专利技术涉及计算机
,尤其涉及数据搜索方法及装置。
技术介绍
搜索引擎为用户提供了一个快速查找信息系统中海量数据资源的渠道。在数据搜索过程中,大多数用户并不能十分准确地用自然语言表达自己的搜索意图,从而无法进行精准搜索,甚至根本就搜索不到用户真正需要查找的信息。为了提高搜索的准确率,现有技术中通常对用户输入的自然语言信息进行人工分析,实现数据搜索,但是这种方式耗费大量人力物力,数据搜索效率低,影响用户满意度。
技术实现思路
本专利技术实施例提供一种数据搜索方法,用以搜索数据资源,在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度,该方法包括:获取自然语言输入信息;根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。本专利技术实施例提供一种数据搜索装置,用以搜索数据资源,在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度,该装置包括:信息获取模块,用于获取自然语言输入信息;数据确定模块,用于根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;类型确定模块,用于根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;数据搜索模块,用于根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据搜索方法。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据搜索方法。相对于现有技术中通过对用户输入的自然语言信息进行人工分析实现数据搜索的方案而言,本专利技术实施例通过获取自然语言输入信息;根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。本专利技术实施例无需进行人工分析,通过确定的自然语言输入信息对应的搜索意图数据和预先建立的匹配模型,可以确定搜索意图类型,进而根据自然语言输入信息和对应的搜索意图类型,对数据进行搜索,利用自然语言处理方法锁定用户的搜索意图,从而有效减小了搜索难度,在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1为本专利技术实施例中数据搜索方法示意图;图2为本专利技术实施例中数据搜索装置结构图;图3为本专利技术具体实施例中数据搜索流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。首先,对本申请实施例中涉及的名词进行介绍:自然语言处理:即实现人机间自然语言通信,或实现自然语言理解和自然语言生成,是研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法,研制能有效地实现自然语言通信的计算机系统。全文检索:是一种新的信息检索技术能够支持对超大文本、语音、图像、活动影像等非结构化信息数据进行综合管理的复合技术。全文数据库:是全文检索系统的主要构成部分,将一个完整的信息员的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。智能搜索引擎:具有信息服务的智能化、人性化特征,允许采用自然语言进行信息的检索,根据用户请求,结合人工智能技术从可以获得的网络资源中检索出对用户最优价值的信息的新一代搜索引擎。图数据库:以节点和关系为基本元素用图来存储数据,是最接近高性能的一种用于存储数据的数据结构之一。词向量:Word嵌入式自然语言处理中的一组语言建模和特征学习的技术的统称,其中来自词汇表的单词和短语被映射到实数的向量。语料库:指经过科学取样和加工的大规模电子文本库。为了搜索数据资源,在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度,本专利技术实施例提供一种数据搜索方法,如图1所示,该方法可以包括:步骤101、获取自然语言输入信息;步骤102、根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;步骤103、根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;步骤104、根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。由图1所示可以得知,本专利技术实施例通过获取自然语言输入信息;根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。本专利技术实施例无需进行人工分析,通过确定的自然语言输入信息对应的搜索意图数据和预先建立的匹配模型,可以确定搜索意图类型,进而根据自然语言输入信息和对应的搜索意图类型,对数据进行搜索,利用自然语言处理方法锁定用户的搜索意图,从而有效减小了搜索难度,在保证搜索准确率的同时提高搜索效率,节省人力物力,提升用户满意度。具体实施时,获取自然语言输入信息之后,根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据。专利技术人发现,目前在银行风险管理应用中的数据搜索还处在传统阶段,需要经过大量的手工操作,耗费较高的时间和精力。因此,需要机器真正理解用户的搜索意图,检索出意图背后的答案,提供一站式智能化、人性化、简单化的智能搜索引擎。如客户风险信息的智能化搜索,根据本文档来自技高网...

【技术保护点】
1.一种数据搜索方法,其特征在于,包括:/n获取自然语言输入信息;/n根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;/n根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;/n根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。/n

【技术特征摘要】
1.一种数据搜索方法,其特征在于,包括:
获取自然语言输入信息;
根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据;
根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,其中所述匹配模型根据自然语言历史输入信息预先建立,所述搜索意图类型包括:列表清单类型,属性值类型或对象信息类型;
根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索。


2.如权利要求1所述的数据搜索方法,其特征在于,根据所述自然语言输入信息,确定所述自然语言输入信息对应的搜索意图数据,包括:
对所述自然语言输入信息进行语义分析处理;
根据所述自然语言输入信息的处理结果,确定所述自然语言输入信息对应的搜索意图数据。


3.如权利要求2所述的数据搜索方法,其特征在于,所述语义分析处理包括:中文分词处理,同义词识别处理,纠错处理,语料训练及深度学习处理,句法分析处理,依存关系分析处理,段落摘要提取处理,联想预测处理其中之一或任意组合。


4.如权利要求1所述的数据搜索方法,其特征在于,根据所述搜索意图数据和预先建立的匹配模型,确定所述自然语言输入信息对应的搜索意图类型,包括:
计算所述搜索意图数据和预先建立的匹配模型的相关性;
根据相关性计算结果确定所述自然语言输入信息对应的搜索意图类型。


5.如权利要求1所述的数据搜索方法,其特征在于,根据所述自然语言输入信息和对应的搜索意图类型,对数据进行搜索,包括:
根据所述自然语言输入信息对应的搜索意图类型,从所述自然语言输入信息中提取关键字;
根据所述关键字,生成数据搜索语句;
根据所述数据搜索语句,对数据进行搜索。


6.如权利要求5所述的数据搜索方法,其特征在于,根据所述自然语言输入信息对应的搜索意图类型,从所述自然语言输入信息中提取关键字,包括:
若所述自然语言输入信息对应的搜索意图类型为列表清单类型,从所述自然语言输入信息中提取属性关键字,对象关键字和逻辑关键字;
若所述自然语言输入信息对应的搜索意图类型为属性值类型,从所述自然语言输入信息中提取属性关键字和对象关键字;
若所述自然语言输入信息对应的搜索意图类型为对象信息类型,从所述自然语言输入信息中提取对象关键字。


7.一种数据搜索装置,其特征在于,包括:
信息获取模块,用于获取自然语言输入信...

【专利技术属性】
技术研发人员:董旭姜楠
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1