【技术实现步骤摘要】
一种文本匹配方法、电子设备及存储介质
[0001]本专利技术涉及文本匹配领域,特别是涉及一种文本匹配方法、电子设备及存储介质。
技术介绍
[0002]随着网络技术的快速发展,用户对问题的应答文本获取的要求越来越高,在追求获取实效的同时,还要求应答文本获取的准确性。通常情况下,用户获取应答文本的方式为:在终端设备上相关的应用程序搜索框内直接输入问题,应用程序内部的语言处模型则根据与用户输入的问题,生成对应于用户问题文本的应答文本;而目前根据用户输入的问题文本所生成的应答文本准确性较低。
技术实现思路
[0003]针对上述技术问题,本专利技术采用的技术方案为:
[0004]根据本申请的第一方面,提供了一种文本匹配方法,所述方法应用于预设的文本检索模型,文本检索模型包括预设的属于预设领域的文本库和第一文本匹配模块,第一文本匹配模块包括d个文本排序子模型和一个文本召回子模型,文本排序子模型能够根据用户输入的问题文本与文本库中各文本之间的相对置信度对文本库中各文本进行排序,文本召回子模型能够确定输入至文本召回子模型的各文本与问题文本之间的绝对置信度;所述方法包括以下步骤:
[0005]S100,获取目标用户输入的问题文本A;
[0006]S200,将A输入至第一文本匹配模块,以通过各文本排序子模型均匹配出f个匹配文本,进而得到匹配文本列表集H=(H1,H2,
…
,H
c
,
…
,H
d
),c=1,2,
… />,d;其中,H
c
为第c个文本匹配模块输出的匹配文本列表;H
c
=(H
c,1
,H
c2
,
…
,H
c,e
,
…
,H
c,f
),e=1,2,
…
,f;其中,H
c,e
为H
c
内的第e个匹配文本;
[0007]S300,将H输入至文本召回子模型,以使所述文本召回子模型确定H内各匹配文本的绝对置信度,得到H对应的匹配文本绝对置信度列表TH=(TH1,TH2,
…
,TH
x
,
…
,TH
y
),x=1,2,
…
,y;其中,TH
x
为TH内第x个匹配文本的匹配文本绝对置信度,y为TH内匹配文本绝对置信度的数量;y=d
×
f;
[0008]S400,根据TH,获取与A匹配各匹配文本作为第一目标文本,以得到的第一目标文本集B1=(B11,B12,
…
,B1
p
,
…
,B1
q
),p=1,2,
…
,q;其中,B1
p
为与A匹配的第p个第一目标文本,q为B1中第一目标文本的数量;ηB1
p
≥η0,ηB1
p
为B1
p
的绝对置信度,η0为预设的绝对置信度阈值。
[0009]根据本申请的另一方面,还提供了一种非瞬时性计算机可读存储介质,存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现上述文本匹配方法。
[0010]根据本申请的另一方面,还提供了一种电子设备,包括处理器和上述非瞬时性计算机可读存储介质。
[0011]本专利技术至少具有以下有益效果:
[0012]本专利技术的文本匹配方法,预设的文本检索模型中各文本排序子模型分别根据问题文本均输出f个匹配文本,得到各文本排序子模型对应的匹配文本列表;文本召回子模型则会对各文本排序子模型输出的各匹配文本进行绝对置信度的排序,将绝对置信度大于预设的绝对置信度阈值的匹配文本作为与问题文本匹配的第一目标文本;由于绝对置信度能够衡量问题文本与匹配文本之间的匹配度,因此,绝对置信度较高的匹配文本可判定为问题文本对应的应答文本,从而确保输出问题文本对应的第一目标文本的准确性。
[0013]进一步的,由于各文本排序子模型根据问题文本对文本库中的各文本进行排序时,所依据的问题文本以及文本库中的文本的维度不同,从而使得任意两个匹配文本列表内的各匹配文本不完全相同,相较于单个文本排序子模型,多个文本排序子模型输出的匹配文本,提高了对问题文本对应的应答文本的覆盖率;各文本排序子模型根据问题文本对文本库中的各文本进行排序时,是根据文本库中各文本的相对置信度进行排序,使得每个文本排序子模型在其对应的维度下均能输出f个匹配文本;由此,能够确保输入至文本召回子模型的匹配文本的数量以及类型较多,进一步提高输出问题文本对应的第一目标文本的准确性。
附图说明
[0014]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为本专利技术实施例提供的文本匹配方法的流程图。
具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0017]需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其他方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其他结构及/或功能性实施此设备及/或实践此方法。
[0018]下面将参照图1所述的应答信息确定方法的流程图,对一种文本匹配方法进行介绍。
[0019]所述方法应用于预设的文本检索模型,文本检索模型包括预设的属于预设领域的文本库和第一文本匹配模块,第一文本匹配模块包括d个文本排序子模型和一个文本召回
子模型,文本排序子模型能够根据用户输入的问题文本与文本库中各文本之间的相对置信度对文本库中各文本进行排序,文本召回子模型能够确定输入至文本召回子模型的各文本与问题文本之间的绝对置信度。
[0020]本实施例中,预设的文本检索模型包括预设的预设领域的文本库,即语料库;例如,民航领域内的文本库,该文本库中的各文本均为与民航相关的文本,包含有各航司发布的公告以及用户输入的历史问题文本对应的历史应答文本;预设的文本检索模型还包括第一文本匹配模块,第一文本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,所述方法应用于预设的文本检索模型,文本检索模型包括预设的属于预设领域的文本库和第一文本匹配模块,第一文本匹配模块包括d个文本排序子模型和一个文本召回子模型,文本排序子模型能够根据用户输入的问题文本与文本库中各文本之间的相对置信度对文本库中各文本进行排序,文本召回子模型能够确定输入至文本召回子模型的各文本与问题文本之间的绝对置信度;所述方法包括以下步骤:S100,获取目标用户输入的问题文本A;S200,将A输入至第一文本匹配模块,以通过各文本排序子模型均匹配出f个匹配文本,进而得到匹配文本列表集H=(H1,H2,
…
,H
c
,
…
,H
d
),c=1,2,
…
,d;其中,H
c
为第c个文本匹配模块输出的匹配文本列表;H
c
=(H
c,1
,H
c,2
,
…
,H
c,e
,
…
,H
c,f
),e=1,2,
…
,f;其中,H
c,e
为H
c
内的第e个匹配文本;S300,将H输入至文本召回子模型,以使所述文本召回子模型确定H内各匹配文本的绝对置信度,得到H对应的匹配文本绝对置信度列表TH=(TH1,TH2,
…
,TH
x
,
…
,TH
y
),x=1,2,
…
,y;其中,TH
x
为TH内第x个匹配文本的匹配文本绝对置信度,y为TH内匹配文本绝对置信度的数量;y=d
×
f;S400,根据TH,获取与A匹配的各匹配文本作为第一目标文本,以得到的第一目标文本集B1=(B11,B12,
…
,B1
p
,
…
,B1
q
),p=1,2,
…
,q;其中,B1
p
为与A匹配的第p个第一目标文本,q为B1中第一目标文本的数量;ηB1
p
≥η0,ηB1
p
为B1
p
的绝对置信度,η0为预设的绝对置信度阈值。2.根据权利要求1所述的文本匹配方法,其特征在于,f通过以下步骤确定:S210,获取预设的滑动时间窗口W内每个第一目标文本集内第一目标文本的数量,以得到当前W内的第一目标文本集内第一目标文本数量集S=(S1,S2,
…
,S
u
,
…
,S
v
),u=1,2,
…
,v;其中,S
u
为当前W内的第u个第一目标文本集内第一目标文本数量;v为当前W内第一目标文本集的数量;W的结束时间为当前时间;S220,根据S,确定其中,α为预设比例系数,α>1...
【专利技术属性】
技术研发人员:李斯蕊,姜炜,刘丰,张丽颖,何凯,谭智隆,
申请(专利权)人:中航信移动科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。