获取文本对应的行为信息的方法和装置制造方法及图纸

技术编号：27877949 阅读：26 留言：0更新日期：2021-03-31 01:01

本申请实施例提供一种获取文本对应的行为信息的方法和装置，包括：接收待识别文本；获取待识别文本所对应的多个语义向量，每个语义向量对应待识别文本经分词后得到的一个词语；根据多个语义向量和胶囊网络模型，得到多个行为向量，每个行为向量与一种行为信息相对应；根据多个行为向量，确定待识别文本所对应的至少一个行为信息。本申请通过胶囊网络模型对待识别文本进行学习，得到多个与行为信息对应的向量，可根据多个与行为信息对应的向量得到待识别文本所对应的一个或多个行为信息。

全部详细技术资料下载

【技术实现步骤摘要】
获取文本对应的行为信息的方法和装置
本申请实施例涉及计算机技术，尤其涉及一种获取文本对应的行为信息的方法和装置。
技术介绍
随着机器学习和自然语言处理技术的快速发展，机器学习和自然语言处理技术也开始应用在法律领域，比如可通过机器学习和自然语言处理技术获取案件文本所对应的行为信息。其中，案件文本所对应的行为信息是指案件文本所描述的内容所涉及的行为的信息(比如行为的名称)，案件文本所描述的内容所涉及的行为可为会对社会或自身带来一定的危害的行为。但是在实现本专利技术过程中，专利技术人发现目前的案件文本所对应的行为信息的方法，仅仅能获取到案件文本所对应的一种行为信息，因此在案件文本对应有多种行为信息的情况下，无法获取到案件文本对应的所有行为信息。
技术实现思路
本申请实施例提供一种获取文本对应的行为信息的方法和装置，可以获取到案件文本对应的所有行为信息。本申请实施例提供一种获取文本对应的行为信息的方法，包括：接收待识别文本；获取所述待识别文本所对应的多个语义向量，每个语义向量对应所述待识别文本经分词后得到的一个词语；根据所述多个语义向量和胶囊网络模型，得到多个行为向量，每个行为向量与一种行为信息相对应；根据所述多个行为向量，确定待识别文本所对应的至少一个行为信息。本方案中通过胶囊网络模型对待识别文本进行学习，得到多个与行为信息对应的向量，可根据多个与行为信息对应的向量得到待识别文本所对应的一个或多个行为信息，即在待识别文本对应多个行为信息的情况下，可以获取到待识别文本所对应的多个行...

【技术保护点】
1.一种获取文本对应的行为信息的方法，其特征在于，包括：/n接收待识别文本；/n获取所述待识别文本所对应的多个语义向量，每个语义向量对应所述待识别文本经分词后得到的一个词语；/n根据所述多个语义向量和胶囊网络模型，得到多个行为向量，每个行为向量与一种行为信息相对应；/n根据所述多个行为向量，确定待识别文本所对应的至少一个行为信息。/n

【技术特征摘要】
1.一种获取文本对应的行为信息的方法，其特征在于，包括：
接收待识别文本；
获取所述待识别文本所对应的多个语义向量，每个语义向量对应所述待识别文本经分词后得到的一个词语；
根据所述多个语义向量和胶囊网络模型，得到多个行为向量，每个行为向量与一种行为信息相对应；
根据所述多个行为向量，确定待识别文本所对应的至少一个行为信息。

2.根据权利要求1所述的方法，其特征在于，根据所述多个语义向量和胶囊网络模型，得到多个行为向量，包括：
根据所述多个语义向量和所述胶囊网络模型，得到与行为相关的多个第一待处理向量；
保留每个所述第一待处理向量中数值大小位于前q的q个分量，得到所述多个行为向量，q为大于1的整数。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述多个行为向量，确定待识别文本所对应的至少一个行为信息，包括：
获取所述多个行为向量的模；
确定模大于预设阈值的行为向量所对应的行为信息为所述待识别文本所对应的至少一个行为信息。

4.根据权利要求1或2所述的方法，其特征在于，在所述根据所述多个语义向量和胶囊网络模型，得到多个行为向量之前，还包括：
获取多个训练文本；
获取每个训练文本所对应的多个语义向量，得到多个训练样本，每个训练文本包括一个训练样本所对应的多个语义向量；
获取每个所述训练样本的标签；所述标签包括多个行为预设向量和多个法条预设向量，每个行为预设向量与一种行为信息相对应，每个法条预设向量与一条法条相对应；
根据每个训练样本的标签，采用胶囊网络算法对所述多个训练样本进行学习，得到所述胶囊网络模型。

5.根据权利要求4所述的方法，其特征在于，所述根据每个训练样本的标签，采用胶囊网络算法对所述多个训练样本进行学习，得到所述胶囊网络模型，包括：
对于第m次学习：
采用动态路由算法，根据第m-1次学习得到的第一胶囊网络模型包括的模糊权值矩阵和第m次学习所使用的第一训练样本包括的多个语义向量，获取多个模糊语义向量；
采用所述动态路由算法，根据所述多个模糊语义向量和所述第一胶囊网络模型包括的行为权值矩阵和法条权值矩阵，获取多个行为实际向量和多个法条实际向量；
根据所述多个行为实际向量、所述多个法条实际向量、所述第一训练样本的标签和误差函数，更新所述第一胶囊网络模型，得到第二胶囊网络模型，所述第二胶囊网络模型为第m次学习得到的胶囊网络模型；其中，...

【专利技术属性】
技术研发人员：何从庆，朱翔宇，乐雨泉，刘兴东，
申请(专利权)人：京东数字科技控股有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人