一种实体状态模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:34525585 阅读:14 留言:0更新日期:2022-08-13 21:16
本申请提供了一种实体状态模型的训练方法、装置、设备及存储介质。该方法包括:基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征;对实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征;利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型。本申请利用各个实体的公开经营数据来实现实体状态预测模型的准确训练,在确保模型训练样本特征全面有效的基础上,进一步降低实体状态预测模型训练时的样本获取难度,确保实体状态预测模型训练时的样本便捷性,从而提高实体状态预测的高效准确性。确性。确性。

【技术实现步骤摘要】
一种实体状态模型的训练方法、装置、设备及存储介质


[0001]本申请实施例涉及数据处理
,具体涉及一种实体状态模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]在微小企业信贷领域,及时了解企业经营状态对于信贷资金方控制逾期风险、信贷损失和企业风险定价均有较大帮助。因此,为了确保各类企业信贷的可靠性,通常需要有效预测企业未来的经营状态。
[0003]目前,通常会通过各种渠道来各类企业的相关经营数据。然后,采用传统的机器学习算法,并结合专家对于企业经营风险的经验,或者采用深度学习算法,并结合各企业之间的实体关联图谱,对企业的相关经营数据进行关于风险分析的训练学习,从而构建相应的实体分类模型。进而,通过训练好的实体分类模型来预测企业的经营风险,以判断企业未来的经营状态。
[0004]但是,在实体分类模型训练阶段需要获取大量企业是否存在经营风险的真实标签数据,而企业内部的真实经营数据难以获取。并且,微小企业内部经营报表并不规范,使得难以依靠此类数据有效评估企业的经营情况。因此,所训练出的实体分类模型单纯预测企业经营风险,无法具体了解企业当前的经营状态,且对于企业经营风险预测的准确性偏低。

技术实现思路

[0005]本申请提供一种实体状态模型的训练方法、装置、设备及存储介质,利用各实体的公开经营数据实现实体状态预测模型的准确训练,降低实体状态预测模型训练时的样本获取难度,提高实体状态预测的高效准确性。
[0006]第一方面,本申请实施例提供了一种实体状态模型的训练方法,该方法包括:
[0007]基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征;
[0008]对所述实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征;
[0009]利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型。
[0010]第二方面,本申请实施例提供了一种实体状态模型的训练装置,该装置包括:
[0011]实体特征确定模块,用于基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征;
[0012]实体特征拼接模块,用于对所述实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征;
[0013]实体模型训练模块,用于利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型。
[0014]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
[0015]处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行本申请第一方面中提供的实体状态模型的训练方法。
[0016]第四方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行如本申请第一方面中提供的实体状态模型的训练方法。
[0017]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如本申请第一方面中提供的实体状态模型的训练方法。
[0018]本申请实施例提供的一种实体状态模型的训练方法、装置、设备及存储介质,基于实体训练集内每一实体的公开经营数据,来确定实体的数据统计特征、关键词表示特征和文本摘要表示特征,然后对实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征,进而利用实体训练集内每一实体的实体融合特征和实体状态标签,即可训练对应的实体状态预测模型,从而利用各个实体的公开经营数据内不同维度下的实体特征来实现实体状态预测模型的准确训练,在确保模型训练样本特征全面有效的基础上,进一步降低实体状态预测模型训练时的样本获取难度,确保实体状态预测模型训练时的样本便捷性,从而提高实体状态预测的高效准确性。而且,通过实体状态预测模型能够直接预测出各个实体的具体状态,而无需通过预测实体风险来判断具体的实体状态,极大提升了实体状态预测的直观可靠性。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本申请实施例示出的一种实体状态模型的训练方法的流程图;
[0021]图2为本申请实施例示出的另一种实体状态模型的训练方法的流程图;
[0022]图3为本申请实施例示出的实体训练集内每一实体特征分类的框架示意图;
[0023]图4为本申请实施例示出的实体特征的处理过程的原理示意图;
[0024]图5为本申请实施例示出的实体状态预测模型的训练过程的原理示意图;
[0025]图6为本申请实施例示出的一种实体状态模型的训练装置的原理框图;
[0026]图7是本申请实施例提供的电子设备的示意性框图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0029]考虑到通过各种渠道获取的实体内外部经营数据所训练的实体分类模型用于预测实体风险,存在预测结果较为单一,且模型训练时样本数据获取难度较大,难以有效预测实体经营情况而导致预测准确性偏低的问题,本申请实施例设计了一种新的实体状态预测模型的训练方案,所训练出的实体状态预测模型能够直接预测出各个实体当前所处的具体经营状态。通过实体训练集内每一实体的公开经营数据,即可从不同维度下全面确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征,然后利用各个实体在不同维度下的实体特征来实现实体状态预测模型的准确训练,从而在确保模型训练样本特征全面有效的基础上,进一步降低实体状态预测模型训练时的样本获取难度,确保实体状态预测模型训练时的样本便捷性,从而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体状态模型的训练方法,其特征在于,包括:基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征;对所述实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征;利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型。2.根据权利要求1所述的方法,其特征在于,所述基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征,包括:基于所述实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词信息和文本摘要信息;分别对所述实体训练集内每一实体的关键词信息和文本摘要信息进行序列表示学习,得到该实体的关键词表示特征和文本摘要表示特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词信息和文本摘要信息,包括:从所述实体训练集内每一实体的公开经营数据中,抽取出该实体的结构化数值数据和非结构化文本数据;对所述实体训练集内每一实体的结构化数值数据进行统计,得到该实体的数值统计特征;对所述实体训练集内每一实体的非结构化文本数据分别进行关键词提取和摘要提取,得到对应的关键词信息和文本摘要信息。4.根据权利要求2所述的方法,其特征在于,所述对所述实体训练集内每一实体的文本摘要信息进行序列表示学习,得到该实体的文本摘要表示特征,包括:针对所述实体训练集内每一实体,对该实体的每一文本摘要信息分别进行序列表示学习,得到该实体的多个初始摘要表示特征;对该实体的多个初始摘要表示特征进行按位叠加,得到该实体的文本摘要表示特征。5.根据权利要求1所述的方法,其特征在于,所述利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型,包括:利用所述实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的初始预测模型;利用实体测试集内的目标实体,对所述初始预测模型进行迭代优化,得到对应的实体状态预测模型。6.根据权利要求5所述的方法,其特征在于,所述利用实体测试集内的目标实体...

【专利技术属性】
技术研发人员:陈云蛟林熙东杨青
申请(专利权)人:度小满科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1