【技术实现步骤摘要】
意图识别方法、装置、可读介质及电子设备
本公开涉及检索
,具体地,涉及一种意图识别方法、装置、可读介质及电子设备。
技术介绍
在检索领域,用户想要进行信息查询时,通常输入一个或多个检索词来进行查询。其中,不同的检索词可能表征不同的意图,同一个检索词也可能表征多种不同的意图。相关技术中,在对用户的检索意图进行识别时,并未考虑检索词表征不同意图的情况,因此无法准确识别出用户的检索意图,使得意图识别的结果不够准确,从而无法提供满足用户检索需求的检索结果。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种意图识别方法,所述方法包括:获取检索信息,所述检索信息包括至少一个检索词;针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;根据所述目标概率,识别所述检索信息对应的目标意图。第二方面,本公开提供一种意图识别装置,所述装置包括:获取模块,被配置成用于获取检索信息,所述检索信息包括至少一个检索词;目标概率确定模块,被配置成用于针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;识别模块,被配置成用于根据所述目标概率,识别所述检索信息对应的目标意图。第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第 ...
【技术保护点】
1.一种意图识别方法,其特征在于,所述方法包括:/n获取检索信息,所述检索信息包括至少一个检索词;/n针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;/n根据所述目标概率,识别所述检索信息对应的目标意图。/n
【技术特征摘要】
1.一种意图识别方法,其特征在于,所述方法包括:
获取检索信息,所述检索信息包括至少一个检索词;
针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;
根据所述目标概率,识别所述检索信息对应的目标意图。
2.根据权利要求1所述的方法,其特征在于,所述检索信息包括多个所述检索词;
所述分别确定该检索词在所述检索信息中属于每一预设主题的目标概率,包括:
遍历每一所述预设主题,并将当前遍历到的所述预设主题作为目标预设主题;
将该检索词作为第一检索词,该检索词外的其他每一所述检索词分别作为第二检索词;
获取所述第一检索词属于所述目标预设主题的第一概率;
针对每一所述第二检索词,获取所述第一检索词和该第二检索词同时属于所述目标预设主题的第二概率,以及所述第一检索词和该第二检索词中其中一个属于所述目标预设主题且另一个属于其他预设主题的第三概率,并分别获取该第二检索词属于每一所述预设主题的第四概率;
根据所述第一概率、所述第二概率、所述第三概率和所述第四概率,确定所述第一检索词在所述检索信息中属于所述目标预设主题的目标概率。
3.根据权利要求2所述的方法,其特征在于,通过如下公式确定检索词在检索信息中属于预设主题的目标概率:
其中,Fx表示第x个预设主题,Wy表示第y个检索词,Q表示检索信息,P(Fx|Wy|Q)表示第y个检索词在检索信息中属于第x个预设主题的目标概率,P(Fx|Wy)表示第y个检索词属于第x个预设主题的概率,Fi表示第i个预设主题,Wj表示第j个检索词,P(Fi|Wj)表示第j个检索词属于第i个预设主题的概率,P(bothinFx|Wj,Wy)表示第j个检索词和第y个检索词同时属于第x个预设主题的概率,P(onlyoneinFx|Wj,Wy)表示第j个检索词和第y个检索词中其中一个属于第x个预设主题且另一个属于其他预设主题的概率,m表示预设主题的个数,n表示检索词的个数。
4.根据权利要求2所述的方法,其特征在于,所述检索信息为针对媒体文件的检索信息,所述媒体文件具有在每一所述预设主题下的主题内容;
所述检索词属于目标预设主题的概率是通过如下方式确定的:
针对每一所述预设主题,获取所述检索词包括在该预设主题的主题内容中的媒体文件的第一使用量,并确定该第一使用量之和;
根据所述检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,以及所述第一使用量之和,确定所述检索词属于所述目标预设主题的概率。
5.根据权利要求4所述的方法,其特征在于,通过如下公式,确定所述检索词属于所述目标预设主题的概率:
其中,Ft表示所述目标预设主题,W表示检索词,P(Ft|W)表示该检索词属于所述目标预设主题的概率,count(WinFt)表示该检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,Fi表示第i个预设主题,count(WinFi)表示该检索词包括在第i个预设主题的主题内容中的媒体文件的第一使用量,m表示预设主题的个数。
6.根据权利要求2所述的方法,其特征在于,所述检索信息为针对媒体文件的检索信息,所述媒体文件具有在每一所述预设主题下的主题内容;
所述第一检索词和所述第二检索词同时属于所述目标预设主题的所述第二概率是通过如下方式确定的:
针对每一所述预设主题,获取所述第一检索词和所述第二检索词同时包括在该预设主题的主题内容中的媒体文件的第二使用量,并确定该第二使用量之和;
获取所述第一检索词和所述第二检索词包括在不同预设主题的主题内容中的媒体文件的第三使用量;
根据所述第一检索词和所述第二检索词同时包括在所述目标预设主题的主题内容中的媒体文件的第二使用量、所述第二使用量之和、以及所述第三使用量,确定所述第二概率。
7.根据权利要求6所述的方法...
【专利技术属性】
技术研发人员:王鑫宇,张永华,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。