本发明专利技术公开了一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取。本发明专利技术能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实施更好的精确化管理,大大提高管理效率和管理准确度。管理效率和管理准确度。管理效率和管理准确度。
【技术实现步骤摘要】
一种基于贝叶斯分类的人员脱逃倾向性判断方法
[0001]本专利技术涉及计算机数据处理
,具体涉及一种基于贝叶斯分类的人员脱逃倾向性判断方法。
技术介绍
[0002]目前对于人员脱逃倾向性心理的判断主要包括个人谈话、监控管理,这些方法使用时候往往具有滞后性,无法提前预知目标人员的后续行为,考虑到有大部分目标人员是提前有预谋,有征兆的行为,同时单纯的监控分析以及人工谈话往往需要耗费大量的人力,效果也不一定好,因此需要设计一种人员脱逃倾向性判断方法来解决上述问题。
技术实现思路
[0003]本专利技术的目的在于提出一种基于贝叶斯分类的人员脱逃倾向性判断方法,预测目标人员在日常作业中的脱逃倾向性。本专利技术主要是通过以下技术方案来实现的:
[0004]一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
[0005]步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;
[0006]步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;
[0007]步骤3、对文本数据进行特征转化,通过bag
‑
of
‑
words词袋模型计算文本向量,得到每一个文本的向量表示;
[0008]步骤4、对样本进行标注;基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况作为样本分类标签,所述脱逃倾向性情况分为高、中、低;
[0009]步骤5、重复步骤1
‑
步骤4,积累训练样本数据和标签,从而用于训练模型;
[0010]步骤6、基于步骤5样本构建贝叶斯模型,利用贝叶斯公式构建分类概率;
[0011]步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果;
[0012]步骤8、重复步骤6和步骤7构建完成贝叶斯模型;
[0013]步骤9、通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员日常数据经过清洗后进入贝叶斯模型,进行目标人员脱逃倾向性预测,并给出监控建议。
[0014]本专利技术的有益效果是:能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实
施更好的精确化管理,大大提高管理效率和管理准确度。
附图说明
[0015]图1是本专利技术的数据采集上报系统的示意图;
[0016]图2是本专利技术的模型服务系统的示意图;
[0017]图3是本专利技术的模型处理流程的示意图;
[0018]图4是本专利技术实施例中入模数据特征示例;
具体实施方式
[0019]下面详细描述本专利技术的实施例,下面的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0020]一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
[0021]步骤1、如图1所示,通过数据采集系统采集上报目标人员日常数据,目标人员在日常作业时,收集其日常填写的心理测试、监控可及的谈话语音以及管理人员对其行为表现的评估文字材料等。
[0022]步骤2、如图1所示,将这些文字材料收集后在信息采集系统上进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取,并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本,最终将数据整理成合适的数据结构进行存储。文本分割方式如下,如原始文本“监管地待的太压抑了,十分想走”,经过切割后得到“监管地/待/的/太/压抑/了/十分/想/走”,过滤有效信息后为“监管地/待/太/压抑/十分/想/走”。
[0023]步骤3、对文本数据进行特征转化,通过bag
‑
of
‑
words词袋模型计算文本向量,得到每一个文本的向量表示,如文档1:“监管地待的太压抑了,十分想走”,文档2:“监管地劳动太压抑”,两个文档分词后汇总构建词典={1:“监管地”,2:“待”,3:“太”, 4:“压抑”,5:“十分”,6:“想”,7:“劳动”},这个词典一共包含7个词语,按照出现数量可转化成向量:文档1:[1,1,1,1,1,1,0],文档2:[1,0,1,1,0,0, 1]。
[0024]步骤4、对所有样本进行标注,基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况,作为样本分类标签,所述脱逃倾向性情况分为高、中、低。
[0025]步骤5、重复步骤1
‑
步骤4的数据,积累训练样本数据和标签,从而用于训练模型。
[0026]步骤6、基于步骤5样本构建贝叶斯模型,利用贝叶斯公式构建分类概率,如图4所示,每个样本词袋向量表达了样本的好坏,通过贝叶斯概率即可预测得到预测结果。
[0027]步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果。
[0028]步骤8、如图3所示,重复步骤6和步骤7构建完成贝叶斯模型,模型训练效果良好,如表1所示;
[0029]表1
[0030][0031]步骤9、如图2所示,通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员信息经过清洗后进入贝叶斯模型,并进行预测其脱逃倾向性,并给出监控建议,每天采集对应样本的数据,经过加工后调用模型接口,然后返回模型预测结果,给出脱逃倾向预测,如果达到一定值就发生报警。
[0032]以上述依据本专利技术的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项专利技术技术思想的范围内,进行多样的变更以及修改。本项专利技术的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于贝叶斯分类的人员脱逃倾向性判断方法,其特征在于,包括以下步骤:步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;步骤3、对文本数据进行特征转化,通过bag
‑
of
‑
words词袋模型计算文本向量,得到每一个文本的向量表示...
【专利技术属性】
技术研发人员:施政,金晓东,张子权,王强,戴志朋,张富睿,
申请(专利权)人:杭州华亭科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。