This specification provides an event detection method and device, computing device and storage medium, in which event detection methods include: acquiring event text, extracting at least two category fields from the event text; constructing a category field diagram of the event text, each node of the category field diagram represents a category field of the event text; and The preset embedding learning model embeds the nodes of the class field relationship graph to get the corresponding eigenvectors of each node; crosses the eigenvectors of each node to get the distance relationship characteristics of at least two class fields; and determines the corresponding events of the distance relationship characteristics of at least two class fields according to the pre-trained event detection model. Item Category Label.
【技术实现步骤摘要】
事件检测方法和装置、计算设备及存储介质
本说明书涉及风控
,特别涉及一种事件检测方法和装置、计算设备及存储介质。
技术介绍
在风险控制中,数据一般分为连续性数据和Category(类别)数据。连续性数据例如金额,是可以比较大小直接进行算术运算的数据类型;Category数据一般在风控中占据了95%以上,是描述风控事件信息的主要数据类型,这类数据不可以直接进行算术运算,也无法直接量化两个Category之间的关系,导致根据风控数据本身很难对风控事件的类型进行有效检测。说明书内容有鉴于此,本说明书实施例提供了一种事件检测方法和装置、计算设备及存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种事件检测方法,包括:获取事件文本,从所述事件文本中提取至少两个类别字段;构建所述事件文本的类别字段关系图,所述类别字段关系图的每个节点表征所述事件文本的一个类别字段;基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节点对应的特征向量;对所述每个节点对应的特征向量进行两两交叉得到所述至少两个类别字段的距离关系特征;根据预先训练的事件检测模型确定所述至少两个类别字段的距离关系特征对应的事件类别标签。根据本说明书实施例的第二方面,提供了一种事件检测装置,包括:第一获取器,被配置为获取事件文本,从所述事件文本中提取至少两个类别字段;第一构建器,被配置为构建所述事件文本的类别字段关系图,所述类别字段关系图的每个节点表征所述事件文本的一个类别字段;第一嵌入器,被配置为基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节 ...
【技术保护点】
1.一种事件检测方法,包括:获取事件文本,从所述事件文本中提取至少两个类别字段;构建所述事件文本的类别字段关系图,所述类别字段关系图的每个节点表征所述事件文本的一个类别字段;基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节点对应的特征向量;对所述每个节点对应的特征向量进行两两交叉得到所述至少两个类别字段的距离关系特征;根据预先训练的事件检测模型确定所述至少两个类别字段的距离关系特征对应的事件类别标签。
【技术特征摘要】
1.一种事件检测方法,包括:获取事件文本,从所述事件文本中提取至少两个类别字段;构建所述事件文本的类别字段关系图,所述类别字段关系图的每个节点表征所述事件文本的一个类别字段;基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节点对应的特征向量;对所述每个节点对应的特征向量进行两两交叉得到所述至少两个类别字段的距离关系特征;根据预先训练的事件检测模型确定所述至少两个类别字段的距离关系特征对应的事件类别标签。2.根据权利要求1所述的方法,其中在所述对所述每个节点对应的特征向量进行两两交叉得到所述至少两个类别字段的距离关系特征步骤之后还包括:通过预先训练的事件检测模型确定所述至少两个类别字段的距离关系特征的重要程度。3.根据权利要求1所述的方法,其中所述嵌入学习模型通过以下步骤获得:获取第一训练样本集,所述第一训练样本集包括由历史事件文本的类别字段构成的词表;基于所述第一训练样本集进行word2vet训练得到嵌入学习模型。4.根据权利要求3所述的方法,其中还包括:根据单个或批量事件文本的类别字段对所述第一训练样本集进行定期或不定期地更新。5.根据权利要求1所述的方法,其中所述从所述事件文本中提取至少两个类别字段包括:根据预设关键词表中的每个关键词对所述事件文本进行检索,判断所述事件文本中是否包含有对应的关键词;将所述事件文本中包含的关键词作为所述事件文本的类别字段。6.根据权利要求5所述的方法,其中在所述根据预设关键词表中的每个关键词对所述事件文本进行检索之前还包括:将从历史事件文本中提取的类别字段作为关键词构建预设关键词表。7.根据权利要求1所述的方法,其中所述基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节点对应的特征向量包括:采用随机游走算法对所述类别字段关系图中每个节点的结构信息进行序列采样,生成节点序列;根据预设的嵌入学习模型将所述节点序列中的每个节点的结构信息嵌入映射为向量化形式,得到每个节点的向量特征。8.根据权利要求7所述的方法,其中所述采用随机游走算法对所述类别字段关系图中每个节点的结构信息进行序列采样,生成节点序列包括:采用随机游走算法根据设定的随机游走的序列长度和每个节点的游走次数,获取所述类别字段关系图中每个节点的结构信息;根据每个节点的结构信息生成节点序列。9.根据权利要求1所述的方法,其中所述事件检测模型通过以下方式得到:获取第二训练样本集,所述第二训练样本集包括多个历史事件文本以及每个所述历史事件文本对应的事件类型标签;从每个所述历史事件文本中提取至少两个类别字段;构建每个所述历史事件文本的类别字段关系图,所述类别字段关系图的每个节点表征一个所述类别字段;基于预设的嵌入学习模型对所述类别字段关系图的节点进行嵌入得到每个节点对应的特征向量;对所述每个节点对应的特征向量进行两两交叉得到每个所述历史事件文本中至少两个类别字段的距离关系特征;基于树类模型训练所述事件检测模型,所述事件检测模型使得每个所述历史事件文本对应的事件类型标签与该历史事件文本中至少两个类别字段的距离关系特征相关联。10.根据权利要求9所述的方法,其中在所述基于树类模型训练事件检测模型,所述事件检测模型使得每个所述历史事件文本对应的事件类型标签与该历史事件文本中至少两个类别字段的距离关系特征相关联步骤之后还包括:通过所述事件检测模型得到每个所述历史事件文本中至少两个类别字段的距离关系特征的重要程度。11.根据权利要求10所述的方法,其中所述树类模型是Xgboost树类模型。12.根据权利要求1所述的方法,其中所述事件文本是支付类风控事件文本。13.根据权利要求12所述的方法,其特征在于,所述事件类别标签包括风险事件标签和非风险事件标签。14.一种事件检...
【专利技术属性】
技术研发人员:王经宇,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。