The present invention provides a method and apparatus for predicting the behavior of, among them, the method comprises: acquiring a plurality of user historical data collection, among them, each historical data set comprises a number of historical data, historical data including the target behavior; to deal with all the historical data, get the maximum frequent set, all the historical data corresponding to the among them, the maximum frequent itemsets includes a plurality of elements, each element in the sequence, and the support from each element, including a number of historical data, the historical data of each element in ascending order according to the degree of support; according to the objective behavior and the maximum frequent itemsets of the various historical data, determining a plurality of effective association the rules used to derive the target behavior; according to the historical data of the target user set and various effective association rules, to determine. The probability of executing the target behavior of the target user is improved by using the improved association rules algorithm. The prediction accuracy is higher, and the operation is simple and the practicability is better.
【技术实现步骤摘要】
一种行为预测方法和装置
本专利技术涉及行为预测
,具体而言,涉及一种行为预测方法和装置。
技术介绍
当前,我们的社会在经济政治和科学技术等方面均经历着巨大的改变。社会的发展虽然给我们的生活带来了许许多多的便利,但是,形形色色的违法犯罪行为也时常出现在我们身边。这些呈现出高科技化、团伙化、智能化的犯罪行为严重影响这我们正常生活秩序。长久以往,更是阻碍社会和谐发展一大障碍。长年累月下来,监狱改造信息管理系统中积累了大量的犯罪人员相关数据。然而,该如何利用好这些已有的犯罪人员相关数据,实现对犯罪行为的有效分析和管控,是摆在监狱管理人员面前的一大难题,也是监狱系统迫切需要研究的课题。现有技术中提供的人员再犯罪的预测方案大体分为两种:一种是基于决策树算法的再犯罪预测方法,该方法首先选用样本属性,该样本属性是用于预测犯罪分子再犯罪的可能因素,其次从搜集的惯犯实施刑事案件材料中选取代表性案件,并在决策树分类模型中对上述代表性案件进行分类训练,最后通过决策树输出一组规则,以通过该规则判断犯罪分子是否再犯罪。另一种是基于综合科学的再犯罪预测方法,该方法综合社会学、心理学和管理学等科学学科,研究再犯罪风险与风险评估、再犯罪风险的基本因素和再犯罪风险的各种主客观因素,最后给出再犯罪风险评估的实体标准。专利技术人在研究中发现,现有技术中基于决策树算法的再犯罪预测方法由于受限于决策树算法自身存在的多值偏向的问题,导致预测的结果较为单一且预测准确度较低,而基于综合科学的再预测方法,操作过程复杂,实用性较差。另外,对于同时满足预测准确度高和实用性佳的犯罪行为再预测尚无完善的方案。 ...
【技术保护点】
一种行为预测方法,其特征在于,包括:获取多个用户的历史数据集合,其中,每个所述历史数据集合均包括多个历史数据,所述历史数据包括目标行为;对所有所述历史数据进行处理,得到所有所述历史数据对应的最大频繁项集,其中,所述最大频繁项集中包括多个元素,每个所述元素按照支持度由小到大的顺序排列,且,每个所述元素包括多个所述历史数据,每个所述元素中的各个所述历史数据按照支持度由小到大的顺序排列;根据目标行为和所述最大频繁项集中的各个所述历史数据,确定用于推导所述目标行为的多个有效关联规则;根据目标用户的所述历史数据集合和各个所述有效关联规则,确定所述目标用户执行所述目标行为的概率。
【技术特征摘要】
1.一种行为预测方法,其特征在于,包括:获取多个用户的历史数据集合,其中,每个所述历史数据集合均包括多个历史数据,所述历史数据包括目标行为;对所有所述历史数据进行处理,得到所有所述历史数据对应的最大频繁项集,其中,所述最大频繁项集中包括多个元素,每个所述元素按照支持度由小到大的顺序排列,且,每个所述元素包括多个所述历史数据,每个所述元素中的各个所述历史数据按照支持度由小到大的顺序排列;根据目标行为和所述最大频繁项集中的各个所述历史数据,确定用于推导所述目标行为的多个有效关联规则;根据目标用户的所述历史数据集合和各个所述有效关联规则,确定所述目标用户执行所述目标行为的概率。2.根据权利要求1所述的方法,其特征在于,所述对所有所述历史数据进行处理,得到所有所述历史数据对应的最大频繁项集,包括:对所有所述历史数据进行处理,得到所述历史数据对应的第K候选项集,其中,所述第K候选项集包括多个候选元素,每个所述候选元素均包括K个所述历史数据,且每个所述候选元素中,支持度最小的所述历史数据为首位历史数据,支持度最大的所述历史数据为末位历史数据;其中,K大于等于2;对所述第K候选项集进行处理,得到第K频繁项集,其中,所述第K频繁项集包括多个频繁元素,每个所述频繁元素的支持度均大于预设支持度,各个所述频繁元素按照支持度由小到大的顺序进行排序,每个所述频繁元素均包括K个所述历史数据,且每个所述频繁元素中,支持度最小的所述历史数据为首位历史数据,支持度最大的所述历史数据为末位历史数据;若所述第K频繁项集中,存在前K-1个所述历史数据相同的多个所述频繁元素,则将前K-1个所述历史数据相同的多个所述频繁元素进行合并,得到第K+1候选项集,若所述第K频繁项集中,不存在前K-1个所述历史数据相同的多个所述频繁元素,则将所述第K频繁项集确定为所有所述历史数据对应的最大频繁项集。3.根据权利要求2所述的方法,其特征在于,所述对所述第K候选项集进行处理,得到第K频繁项集,包括:对于所述第K候选项集中的每个所述候选元素,确定所述候选元素中的前K-1个所述历史数据共同出现的所述历史数据集合,根据确定的所述历史数据集合确定所述候选元素的支持度;根据所述第K候选项集中每个所述候选元素的支持度,以及所述预设支持度,对各个所述候选元素进行筛选,得到支持度大于所述预设支持度的所述候选元素;根据得到的每个所述候选元素的支持度由小到大的顺序,对得到的每个所述候选元素进行排序,得到第K频繁项集。4.根据权利要求2所述的方法,其特征在于,所述对所有所述历史数据进行处理,得到所有所述历史数据对应的最大频繁项集,还包括:将所有所述历史数据进行组合,得到第一候选项集;确定所述第一候选项集对应的第一频繁项集,其中,所述第一频繁项集中,每个所述历史数据的支持度均大于所述预设支持度,且每个所述历史数据按照支持度由小到大的顺序进行排序;根据所述第一频繁项集中各个所述历史数据的顺序,对所述第一频繁项集中的各个所述历史数据进行组合,得到第二候选项集,其中,所述第二候选项集包括多个候选元素,每个所述候选元素均包括两个所述历史数据,且每个所述候选元素中,支持度最小的所述历史数据为首位历史数据,支持度最大的所述历史数据为末位历史数据。5.根据权利要求1所述的方法,其特征在于,所述根据目标行为和所述最大频繁项集中的各个所述历史数据,确定用于推导所述目标行为的多个有效关联规则,包括:根据目标行为和所述最大频繁项集中的各个所述历史数...
【专利技术属性】
技术研发人员:刘力,王忠林,
申请(专利权)人:东方网力科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。