本发明专利技术属于在计算机信息处理技术领域,提供一种基于证据权重统计的交易安全程度预测方法、装置和电子设备,方法包括:获取与待评估用户存在社交关联的关联用户对待评估用户的备注文本;对每个关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记;根据证据权重算法及不同类别标记的数量计算备注文本对应的待评估用户的交易安全程度。本发明专利技术通过获取与用户相关联的关联用户对该用户的备注文本,确定备注文本中每个词语的好坏,最后根据证据权重算法计算得到该用户的交易安全程度,解决了在用户数据较少的情况下,无法通过用户特征预测出用户交易安全程度或预测结果不准确的问题,以便及时做出应对策略,避免损失,提高交易安全。提高交易安全。提高交易安全。
【技术实现步骤摘要】
基于证据权重统计的交易安全程度预测方法和装置
[0001]本专利技术属于计算机信息处理
,更具体的是涉及一种基于证据权重统计的交易安全程度预测方法、装置、电子设备和计算机可读介质。
技术介绍
[0002]现有技术中,在交易安全领域,存在信用风险大和安全风险高的特点,因此机构通常通过运用大量的历史样例数据对评分模型进行训练,训练生成评分模型,来判断用户的交易安全程度,但是当机构收集的用户信息较少时,则对用户的交易安全程度预测难度加大,预测结果不准确,例如只获取到用户的通讯录信息,而没有获取到用户的其他信息时,很难准确预测出该用户的交易安全程度。
技术实现思路
[0003](一)要解决的技术问题
[0004]本专利技术旨在解决如何在用户信息较少的情况下准确预测用户的安全交易程度的技术问题。
[0005](二)技术方案
[0006]为解决上述技术问题,本专利技术的一方面提出一种基于证据权重统计的交易安全程度预测方法,包括:
[0007]获取与待评估用户存在社交关联的关联用户对所述待评估用户的备注文本;
[0008]对每个所述关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记;
[0009]根据证据权重算法及不同类别标记的数量计算所述备注文本对应的待评估用户的交易安全程度。
[0010]根据本专利技术的优选实施方式,所述获取与待评估用户存在社交关联的关联用户对所述待评估用户的备注文本,进一步包括:
[0011]获取与待评估用户存在社交关联的关联用户,将所述关联用户按照不同年龄段进行分类;
[0012]获取预设年龄段中每个所述关联用户对所述待评估用户的通讯录备注文本。
[0013]根据本专利技术的优选实施方式,所述对每个所述关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记,进一步包括:
[0014]根据结巴分词算法分别将每个所述备注文本分解为不同的词语集合;
[0015]从数据库中查询并调用所述词语集合中每个词语对应的标记信息。
[0016]根据本专利技术的优选实施方式,在从数据库中查询并调用所述词语集合中每个词语对应的标记信息前,所述方法还包括:
[0017]将与历史用户存在社交关联的历史关联用户对所述历史用户的备注文本作为训练样本;
[0018]对所述训练样本进行分词,获取每个词语对应的每个历史用户的交易安全程度,根据所述交易安全程度分别对该词语标记好或坏;
[0019]统计每个词语的好标记和坏标记数量,并存储在数据库中。
[0020]根据本专利技术的优选实施方式,所述根据证据权重算法及不同类别标记的数量计算所述备注文本对应的待评估用户的交易安全程度,进一步包括:
[0021]将每个词语不同类别标记的数量输入证据权重模型计算每个词语的得分;
[0022]将所述待评估用户对应的备注文本中所有词语的得分进行加权平均得到所述待评估用户的交易安全程度。
[0023]根据本专利技术的优选实施方式,所述将每个词语不同类别标记的数量输入证据权重模型计算每个词语的得分,进一步包括:
[0024]根据证据权重算法计算每个词语的得分:
[0025][0026]其中,woe
i
是第i个词语的得分,g
i
是在所述训练样本中第i个词语对应好标记的数量,G是在所述训练样本中所有词语对应好标记的数量,b
i
是在所述训练样本中第i个词语对应坏标记的数量,B是在所述训练样本中所有词语对应坏标记的数量。
[0027]根据本专利技术的优选实施方式,所述方法还包括:
[0028]定期更新所述训练样本,并更新所述训练样本中每个词语的标记数量。
[0029]本专利技术第二方面提出一种基于证据权重统计的交易安全程度预测装置,包括:
[0030]备注文本获取模块,用于获取与待评估用户存在社交关联的关联用户对所述待评估用户的备注文本;
[0031]标记模块,用于对每个所述关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记;
[0032]预测模块,用于根据证据权重算法及不同类别标记的数量计算所述备注文本对应的待评估用户的交易安全程度。
[0033]本专利技术第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。
[0034]本专利技术第四方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
[0035](三)有益效果
[0036]本专利技术通过获取与用户相关联的关联用户对该用户的备注文本,并对备注文本进行分词,确定分词后每个词语的好/坏标记,最后根据证据权重算法和词语好/坏标记的数量计算得到该用户的交易安全程度,解决了在用户数据较少的情况下,无法通过用户特征预测出用户交易安全程度或预测结果不准确的问题,根据预测的用户的交易安全程度在与用户进行交易前及时做出应对策略,避免损失,提高交易安全。
附图说明
[0037]图1是本专利技术一个实施例的一种基于证据权重统计的交易安全程度预测方法流程
示意图;
[0038]图2是本专利技术一个实施例的一种基于证据权重统计的交易安全程度预测装置示意图;
[0039]图3是本专利技术的一个实施例的电子设备的结构示意图;
[0040]图4是本专利技术的一个实施例的计算机可读记录介质的示意图。
具体实施方式
[0041]在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本专利技术。
[0042]附图中的流程图仅是一种示例性的流程演示,不代表本专利技术的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本专利技术的专利技术主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
[0043]附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
[0044]各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本专利技术实质本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于证据权重统计的交易安全程度预测方法,其特征在于,包括:获取与待评估用户存在社交关联的关联用户对所述待评估用户的备注文本;对每个所述关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记;根据证据权重算法及不同类别标记的数量计算所述备注文本对应的待评估用户的交易安全程度。2.根据权利要求1所述的基于证据权重统计的交易安全程度预测方法,其特征在于,所述获取与待评估用户存在社交关联的关联用户对所述待评估用户的备注文本,进一步包括:获取与待评估用户存在社交关联的关联用户,将所述关联用户按照不同年龄段进行分类;获取预设年龄段中每个所述关联用户对所述待评估用户的通讯录备注文本。3.根据权利要求1或2所述的基于证据权重统计的交易安全程度预测方法,其特征在于,所述对每个所述关联用户的备注文本进行分词,获取每个分词在数据库中对应的预设标记,进一步包括:根据结巴分词算法分别将每个所述备注文本分解为不同的词语集合;从数据库中查询并调用所述词语集合中每个词语对应的标记信息。4.根据权利要求1
‑
3任一项所述的基于证据权重统计的交易安全程度预测方法,其特征在于,在从数据库中查询并调用所述词语集合中每个词语对应的标记信息前,所述方法还包括:将与历史用户存在社交关联的历史关联用户对所述历史用户的备注文本作为训练样本;对所述训练样本进行分词,获取每个词语对应的每个历史用户的交易安全程度,根据所述交易安全程度分别对该词语标记好或坏;统计每个词语的好标记和坏标记数量,并存储在数据库中。5.根据权利要求1
‑
4任一项所述的基于证据权重统计的交易安全程度预测方法,其特征在于,所述根据证据权重算法及不同类别标记的数量计算所述备注文本对应的待评估用户的交易安全程度,进一步包括:将每个词语不同类别标记的数量输入证据权重模...
【专利技术属性】
技术研发人员:王磊,宋孟楠,苏绥绥,
申请(专利权)人:北京淇瑀信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。