一种自然语言匹配方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38846569 阅读:11 留言:0更新日期:2023-09-17 09:57
本发明专利技术涉及自然语言处理技术领域,公开了一种自然语言匹配方法、装置、计算机设备及存储介质,该方法包括:获取待匹配语句;将待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配;若全语句规则匹配失败并且有序规则匹配失败的情况下,对待匹配语句进行语义内容的算法匹配,以确定是否存在与待匹配语句语义相近的语料;若语义内容的算法匹配失败的情况下,对待匹配语句进行变元规则匹配,得到匹配结果;其中,变元规则匹配用于将待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。通过制定匹配规则,采用多种规则匹配结合的方式,可以使用户语料匹配的更精准,更全面,进而可以提高语义识别的准确率。义识别的准确率。义识别的准确率。

【技术实现步骤摘要】
一种自然语言匹配方法、装置、计算机设备及存储介质


[0001]本专利技术涉及自然语言处理
,具体涉及一种自然语言匹配方法、装置、计算机设备及存储介质。

技术介绍

[0002]自然语言处理是人工智能领域的一项重要技术,随着自然语言处理技术的发展,基于通用信息的语言识别与语义匹配技术渐渐提高。语义匹配一般可理解为判断用户输入的自然语言和语义之间是否匹配的过程,是根据用户输入的自然语言,通过分析语义或语境等,将其与预设的模式、规则或语义表示进行匹配,从而理解用户意图。
[0003]而专利技术人发现,目前的语义匹配技术中,匹配规则都比较单一,且不够完善,导致语义识别准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种自然语言匹配方法、装置、计算机设备及存储介质,以解决目前自然语言匹配准确率较低的问题。
[0005]第一方面,本专利技术提供了一种自然语言匹配方法,包括:获取待匹配语句;将待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配,其中,语料库中预先定义有通过匹配规则将预设语料分词构成的规则语句与语义内容之间的对应关系,全语句规则匹配用于匹配与待匹配语句完全相同的语句,有序规则匹配用于匹配与待匹配语句结构语序相同并且关键词相同的语句;若全语句规则匹配失败并且有序规则匹配失败的情况下,对待匹配语句进行语义内容的算法匹配,以确定是否存在与待匹配语句语义相近的语料;若语义内容的算法匹配失败的情况下,对待匹配语句进行变元规则匹配,得到匹配结果;其中,变元规则匹配用于将待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。
[0006]在一种可选实施方式中,通过以下步骤设置语料库,包括:建立预设自然语言库,自然语言库用于匹配待匹配语句中的语料分词;建立匹配规则表,匹配规则表包括:全语句匹配规则与有序匹配规则;将预设自然语言库中的至少一个预设语料分词与匹配规则表中的匹配规则组合,获得匹配组;将匹配组与匹配组之间通过预设的组合规则进行组合,获得多个规则语句,用于构成语料库。
[0007]在一种可选实施方式中,设置语料库,包括:生成与规则语句对应的语义内容、语义节点以及所属话题;根据规则语句、与规则语句对应的语义内容、语义节点以及所属话题,构成语料
库。
[0008]在一种可选实施方式中,预设自然语言库,包括:归属语料表,包括:预设语料分词以及与预设语料分词对应的所属类别;平行语料表,包括:预设语料分词以及与预设语料分词对应的常用词;代词替换表,包括:预设语料代词、与预设语料代词对应的替换词,以及与替换词对应的替换优先值。
[0009]在一种可选实施方式中,将待匹配语句与预先设置的语料库进行全语句规则匹配,包括:当匹配规则为全语句第一匹配规则时,待匹配语句中的语料分词需包含匹配组中全部的预设语料分词;当匹配规则为全语句第二匹配规则时,待匹配语句中的语料分词需包含匹配组中任意一个预设语料分词;当匹配规则为全语句第三匹配规则时,待匹配语句中的语料分词需不包含匹配组中全部的预设语料分词;当匹配规则为全语句第四匹配规则时,待匹配语句中的语料分词需不包含匹配组中任意一个预设语料分词;当匹配规则为全语句第五匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词完全相同;当匹配规则为全语句第六匹配规则时,待匹配语句中的语料分词需与匹配组中的任意一个预设语料分词完全相同。
[0010]在一种可选实施方式中,将待匹配语句与预先设置的语料库进行有序规则匹配,包括:当匹配规则为有序第一匹配规则时,待匹配语句中的语料分词需包含匹配组中任意一个预设语料分词;当匹配规则为有序第二匹配规则时,待匹配语句中的语料分词需不包含匹配组中任意一个预设语料分词;当匹配规则为有序第三匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在归属关系;当匹配规则为有序第四匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在平行关系;当匹配规则为有序第四匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在变元关系;当匹配规则为有序第五匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的不存在归属关系;当匹配规则为有序第六匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在不平行关系;当匹配规则为有序第七匹配规则时,待匹配语句中的语料分词需与匹配组中的预设语料分词的存在填充关系。
[0011]第二方面,本专利技术提供了一种自然语言匹配装置,该装置包括:
获取模块,用于获取待匹配语句;规则匹配模块,用于将待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配,其中,语料库中预先定义有通过匹配规则将预设语料分词构成的规则语句与语义内容之间的对应关系,全语句规则匹配用于匹配与待匹配语句完全相同的语句,有序规则匹配用于匹配与待匹配语句结构语序相同并且关键词相同的语句;算法匹配模块,用于若全语句规则匹配失败并且有序规则匹配失败的情况下,对待匹配语句进行语义内容的算法匹配,以确定是否存在与待匹配语句语义相近的语料;变元匹配模块,用于若语义内容的算法匹配失败的情况下,对待匹配语句进行变元规则匹配,得到匹配结果;其中,变元规则匹配用于将待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。
[0012]第三方面,本专利技术提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的自然语言匹配方法。
[0013]第四方面,本专利技术提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的自然语言匹配方法。
[0014]本专利技术实施例中,通过制定匹配规则,通过全语句规则匹配,有序规则匹配、算法匹配、变元规则匹配结合的实现方式,可以使用户语料匹配的更精准,更全面,进而可以提高语义识别的准确率。
附图说明
[0015]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是根据本专利技术实施例的一种自然语言匹配方法的流程示意图;图2是根据本专利技术实施例的自然语言匹配流程的示意图;图3是根据本专利技术实施例的自然语言匹配装置的结构框图;图4是本专利技术实施例的计算机设备的硬件结构示意图。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自然语言匹配方法,其特征在于,所述方法包括:获取待匹配语句;将所述待匹配语句与预先设置的语料库进行全语句规则匹配或者有序规则匹配,其中,所述语料库中预先定义有通过匹配规则将预设语料分词构成的规则语句与语义内容之间的对应关系,全语句规则匹配用于匹配与所述待匹配语句完全相同的语句,有序规则匹配用于匹配与所述待匹配语句结构语序相同并且关键词相同的语句;若全语句规则匹配失败并且有序规则匹配失败的情况下,对所述待匹配语句进行语义内容的算法匹配,以确定是否存在与所述待匹配语句语义相近的语料;若语义内容的算法匹配失败的情况下,对所述待匹配语句进行变元规则匹配,得到匹配结果;其中,所述变元规则匹配用于将所述待匹配语句中同属性或者相同归属分类替换为已知变元属性的情况下进行语句匹配。2.根据权利要求1所述的方法,其特征在于,通过以下步骤设置所述语料库,包括:建立预设自然语言库,所述自然语言库用于匹配所述待匹配语句中的语料分词;建立匹配规则表,所述匹配规则表包括:全语句匹配规则与有序匹配规则;将所述预设自然语言库中的至少一个预设语料分词与所述匹配规则表中的匹配规则组合,获得匹配组;将所述匹配组与所述匹配组之间通过预设的组合规则进行组合,获得多个所述规则语句,用于构成所述语料库。3.根据权利要求2所述的方法,其特征在于,所述设置所述语料库,包括:生成与所述规则语句对应的语义内容、语义节点以及所属话题;根据所述规则语句、与所述规则语句对应的语义内容、语义节点以及所属话题,构成所述语料库。4.根据权利要求2所述的方法,其特征在于,所述预设自然语言库,包括:归属语料表,包括:所述预设语料分词以及与所述预设语料分词对应的所属类别;平行语料表,包括:所述预设语料分词以及与所述预设语料分词对应的常用词;代词替换表,包括:预设语料代词、与所述预设语料代词对应的替换词,以及与替换词对应的替换优先值。5.根据权利要求2所述的方法,其特征在于,所述将所述待匹配语句与预先设置的语料库进行全语句规则匹配,包括:当所述匹配规则为全语句第一匹配规则时,所述待匹配语句中的语料分词需包含所述匹配组中全部的所述预设语料分词;当所述匹配规则为全语句第二匹配规则时,所述待匹配语句中的语料分词需包含所述匹配组中任意一个所述预设语料分词;当所述匹配规则为全语句第三匹配规则时,所述待匹配语句中的语料分词需不包含所述匹配组中全部的所述预设语料分词;当所述匹配规则为全语句第四匹配规则时,所述待匹配语句中的语料分词需不包含所述匹配组中任意一个所述预设语料分词;当所述匹配规则为全语句第五匹配规则时,所述待匹配语句中的语料分词需与所述匹配组中的所述预设语料分词完全相同;
当所述匹配规则为全语...

【专利技术属性】
技术研发人员:陆书杰孔燕喻佳佳李梦瑶王鹏
申请(专利权)人:杭州北冥星火科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1