本申请实施例提供一种获取文本对应的行为信息的方法和装置,包括:接收待识别文本;获取待识别文本所对应的多个语义向量,每个语义向量对应待识别文本经分词后得到的一个词语;根据多个语义向量和胶囊网络模型,得到多个行为向量,每个行为向量与一种行为信息相对应;根据多个行为向量,确定待识别文本所对应的至少一个行为信息。本申请通过胶囊网络模型对待识别文本进行学习,得到多个与行为信息对应的向量,可根据多个与行为信息对应的向量得到待识别文本所对应的一个或多个行为信息。
【技术实现步骤摘要】
获取文本对应的行为信息的方法和装置
本申请实施例涉及计算机技术,尤其涉及一种获取文本对应的行为信息的方法和装置。
技术介绍
随着机器学习和自然语言处理技术的快速发展,机器学习和自然语言处理技术也开始应用在法律领域,比如可通过机器学习和自然语言处理技术获取案件文本所对应的行为信息。其中,案件文本所对应的行为信息是指案件文本所描述的内容所涉及的行为的信息(比如行为的名称),案件文本所描述的内容所涉及的行为可为会对社会或自身带来一定的危害的行为。但是在实现本专利技术过程中,专利技术人发现目前的案件文本所对应的行为信息的方法,仅仅能获取到案件文本所对应的一种行为信息,因此在案件文本对应有多种行为信息的情况下,无法获取到案件文本对应的所有行为信息。
技术实现思路
本申请实施例提供一种获取文本对应的行为信息的方法和装置,可以获取到案件文本对应的所有行为信息。本申请实施例提供一种获取文本对应的行为信息的方法,包括:接收待识别文本;获取所述待识别文本所对应的多个语义向量,每个语义向量对应所述待识别文本经分词后得到的一个词语;根据所述多个语义向量和胶囊网络模型,得到多个行为向量,每个行为向量与一种行为信息相对应;根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息。本方案中通过胶囊网络模型对待识别文本进行学习,得到多个与行为信息对应的向量,可根据多个与行为信息对应的向量得到待识别文本所对应的一个或多个行为信息,即在待识别文本对应多个行为信息的情况下,可以获取到待识别文本所对应的多个行为信息。在一种可能的设计中,根据所述多个语义向量和胶囊网络模型,得到多个行为向量,包括:根据所述多个语义向量和所述胶囊网络模型,得到与行为相关的多个第一待处理向量;保留每个所述第一待处理向量中数值大小位于前q的q个分量,得到所述多个行为向量,q为大于1的整数。本方案中,保留每个所述第一待处理向量中数值大小位于前q的q个分量,得到所述多个行为向量,可以去除多个行为向量中的冗余信息,提高了根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息的效率。在一种可能的设计中,所述根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息,包括:获取所述多个行为向量的模;确定模大于预设阈值的行为向量所对应的行为信息为所述待识别文本所对应的至少一个行为信息。本方案提供了根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息的一种具体实现。在一种可能的设计中,在所述根据所述多个语义向量和胶囊网络模型,得到多个行为向量之前,还包括:获取多个训练文本;获取每个所述训练文本所对应的多个语义向量,得到多个训练样本,每个训练样本包括一个训练文本所对应的多个语义向量;获取每个所述训练样本的标签;所述标签包括多个行为预设向量和多个法条预设向量,每个行为预设向量与一种行为信息相对应,每个法条预设向量与一条法条相对应;根据每个训练样本的标签,采用胶囊网络算法对所述多个训练样本进行学习,得到所述胶囊网络模型。本方案可得到高精度的胶囊网络模型。在一种可能的设计中,所述根据每个训练样本的标签,采用胶囊网络算法对所述多个训练样本进行学习,得到所述胶囊网络模型,包括:对于第m次学习:采用动态路由算法,根据第m-1次学习得到的第一胶囊网络模型包括的模糊权值矩阵和第m次学习所使用的第一训练样本包括的多个语义向量,获取多个模糊语义向量;采用所述动态路由算法,根据所述多个模糊语义向量和所述第一胶囊网络模型包括的行为权值矩阵和法条权值矩阵,获取多个行为实际向量和多个法条实际向量;根据所述多个行为实际向量、所述多个法条实际向量、所述第一训练样本的标签和误差函数,更新所述第一胶囊网络模型,得到第二胶囊网络模型,所述第二胶囊网络模型为第m次学习得到的胶囊网络模型;其中,m=1,…,M,在m=M时,所述第二胶囊网络模型为所述胶囊网络模型。可选地,所述误差函数L为:L=Lc+αLa,其中,Lc为与行为相关的损失函数,La为与法条相关的误差函数。本方案中,在得到多个行为实际向量和多个法条实际向量之前先得到多个模糊语义向量作为中间层,而不直接根据副本语义向量得到的多个行为实际向量和多个法条实际向量,可提高得到的多个行为实际向量和多个法条实际向量的与相应的训练文本的相关度,进而使得最终得到的胶囊网络模型的精度较高。同时,训练样本的标签中不仅包括训练样本对应的多个行为预设向量还包括多个法条预设向量,且在训练过程中不仅得到了多个行为实际向量还得到了多个法条实际向量,因此,可以根据多个行为实际向量与多个行为预设向量之间的差距以及多个法条实际向量与法条预设向量之间的差距更新胶囊网络模型,即胶囊网络模型的更新过程还考虑了行为所对应的法条,可辅助对胶囊网络模型的更新,提高了胶囊网络模型的更新效率以及最终得到的胶囊网络模型的精度。在一种可能的设计中,所述获取多个模糊语义向量,包括:获取第m次学习所使用的第一训练样本包括的多个语义向量经模糊权值矩阵映射后得到的多个副本语义向量;根据所述多个副本语义向量和初始耦合矩阵,得到多个中间向量;根据所述多个副本语义向量和所述多个中间向量更新所述初始耦合矩阵,得到中间耦合矩阵;重复执行预设次数的根据所述多个副本语义向量和当前的中间耦合矩阵得到多个新的中间向量,以及根据副本语义向量、所述多个新的中间向量更新当前的中间耦合矩阵的操作,得到目标耦合矩阵;根据所述多个副本语义向量和目标耦合矩阵,得到多个目标向量;根据激活压缩函数,对每个目标向量进行激活压缩,得到所述多个模糊语义向量。本方案得到模糊语义向量的方法仅仅对所有迭代完成后最终得到的目标向量进行压缩激活,相对于传统的对每次迭代完成得到向量均进行压缩激活的方法,本实施例的方法可防止多次压缩造成最终得到的模糊语义向量发生变形(即不能得到能够正确表征训练文本的语义的多个模糊语义向量)的现象发生,提高了得到的模糊语义向量的精度,进而使得最终得到的胶囊网络模型的精度较高。在一种可能的设计中,所述获取多个行为实际向量和多个法条实际向量,包括:采用所述动态路由算法,根据所述多个模糊语义向量和和所述第一胶囊网络模型包括的行为权值矩阵和法条权值矩阵,获取多个行为预选向量和多个法条预选向量;保留每个所述行为预选向量中数值大小位于前q的q个分量,得到多个行为实际向量,以及保留每个所述法条预选向量中数值大小位于前q的q个分量,得到多个法条实际向量,q为大于1的整数。本方案可得到高精度的胶囊网络模型。第二方面,本申请实施例提供一种获取文本对应的行为信息的装置,包括:获取模块,用于接收待识别文本;处理模块,用于获取所述待识别文本所对应的多个语义向量,每个语义向量对应所述待识别文本经分词后得到的一个词语;所述处理模块,还用于根据所述多个语义向量和胶囊网络模型,得到多个行为向量,每个行为向量与一种行为信息相对应;所述处理模块,还用于根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息。在一种可能的设计中,所述处理模块在用于根据所述多个本文档来自技高网...
【技术保护点】
1.一种获取文本对应的行为信息的方法,其特征在于,包括:/n接收待识别文本;/n获取所述待识别文本所对应的多个语义向量,每个语义向量对应所述待识别文本经分词后得到的一个词语;/n根据所述多个语义向量和胶囊网络模型,得到多个行为向量,每个行为向量与一种行为信息相对应;/n根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息。/n
【技术特征摘要】
1.一种获取文本对应的行为信息的方法,其特征在于,包括:
接收待识别文本;
获取所述待识别文本所对应的多个语义向量,每个语义向量对应所述待识别文本经分词后得到的一个词语;
根据所述多个语义向量和胶囊网络模型,得到多个行为向量,每个行为向量与一种行为信息相对应;
根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息。
2.根据权利要求1所述的方法,其特征在于,根据所述多个语义向量和胶囊网络模型,得到多个行为向量,包括:
根据所述多个语义向量和所述胶囊网络模型,得到与行为相关的多个第一待处理向量;
保留每个所述第一待处理向量中数值大小位于前q的q个分量,得到所述多个行为向量,q为大于1的整数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多个行为向量,确定待识别文本所对应的至少一个行为信息,包括:
获取所述多个行为向量的模;
确定模大于预设阈值的行为向量所对应的行为信息为所述待识别文本所对应的至少一个行为信息。
4.根据权利要求1或2所述的方法,其特征在于,在所述根据所述多个语义向量和胶囊网络模型,得到多个行为向量之前,还包括:
获取多个训练文本;
获取每个训练文本所对应的多个语义向量,得到多个训练样本,每个训练文本包括一个训练样本所对应的多个语义向量;
获取每个所述训练样本的标签;所述标签包括多个行为预设向量和多个法条预设向量,每个行为预设向量与一种行为信息相对应,每个法条预设向量与一条法条相对应;
根据每个训练样本的标签,采用胶囊网络算法对所述多个训练样本进行学习,得到所述胶囊网络模型。
5.根据权利要求4所述的方法,其特征在于,所述根据每个训练样本的标签,采用胶囊网络算法对所述多个训练样本进行学习,得到所述胶囊网络模型,包括:
对于第m次学习:
采用动态路由算法,根据第m-1次学习得到的第一胶囊网络模型包括的模糊权值矩阵和第m次学习所使用的第一训练样本包括的多个语义向量,获取多个模糊语义向量;
采用所述动态路由算法,根据所述多个模糊语义向量和所述第一胶囊网络模型包括的行为权值矩阵和法条权值矩阵,获取多个行为实际向量和多个法条实际向量;
根据所述多个行为实际向量、所述多个法条实际向量、所述第一训练样本的标签和误差函数,更新所述第一胶囊网络模型,得到第二胶囊网络模型,所述第二胶囊网络模型为第m次学习得到的胶囊网络模型;其中,...
【专利技术属性】
技术研发人员:何从庆,朱翔宇,乐雨泉,刘兴东,
申请(专利权)人:京东数字科技控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。