一种基于快速剪枝策略的高效用序列模式的用药DDD值数据分析方法,包括以下步骤:步骤1、对整理出用药记录表和药品DDD值表,对用药记录表中每条的用药记录的数据进行预处理;步骤2、计算序列数据库中q‑项的序列权重效用值SWU;步骤3、去除序列权重效用值SWU小于阈值ξ的q‑项,得到新的s‑序列数据库;步骤4、建立q‑项集内连接效用矩阵WICUM;步骤5、建立q‑项集间连接效用矩阵BICUM;步骤6、建立数据库中每个项的效用矩阵;步骤7、建立序列模式树,得到全部的高效用序列模式,这些高效用序列模式代表不同时间段服用各种药物,各种药物间组合后累计DDD值是超出阈值的,为高累计DDD值药物组合。本发明专利技术简化了剪枝操作的复杂性并减少了数据库的扫描次数,从而提高了挖掘高效用序列模式的效率。
【技术实现步骤摘要】
201610172655
【技术保护点】
一种基于快速剪枝策略的高效用序列模式的用药DDD值数据分析方法,其特征在于:包括以下步骤:步骤1、整理出用药记录表和药品DDD值表,对用药记录表中每条用药记录的用药数据进行预处理;步骤2、计算序列数据库中q‑项的序列权重效用值SWU;步骤3、去除序列权重效用值SWU小于阈值ξ的q‑项,得到新的s‑序列数据库;步骤4、建立q‑项集内连接效用矩阵WICUM;步骤5、建立q‑项集间连接效用矩阵BICUM;步骤6、建立数据库中每个项的效用矩阵;步骤7、建立序列模式树,过程如下:7.1 创建一个根结点;7.2 按照字母序建立1‑q‑序列的子结点;7.3 建立2‑q‑序列的子结点,按照字母序进行连接,连接分为q‑项集内的连接和q‑项集间的连接,产生的2‑q‑序列的子结点分为大小为1的2‑q‑序列和大小为2的2‑q‑序列,具体步骤为:7.3.1 q‑项集内的连接产生大小为1的2‑q‑序列,查找WICUM结构表找出相应的连接项的WICUM值,当WICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点;否则生成结点,转到步骤7.3.3;7.3.2 q‑项集间的连接产生大小为2的2‑q‑序列,查找BICUM结构表找出相应的连接项的BICUM值,当BICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点,否则生成结点,转到步骤7.3.3;7.3.3 建立连接后新结点的效用矩阵,通过效用矩阵计算新结点的效用值7.3.4 计算新结点的效用值上界,新结点的效用值上界为新结点在效用矩阵中效用值与剩余效用值总和,当效用值上界大于阈值ξ时,则向下生成结点,否则不向下生成结点;7.4 建立3‑q‑序列的子结点,按照字母序进行连接,连接分为q‑项集内的连接和q‑项集间的连接,产生的3‑q‑序列的子结点分为大小为1的3‑q‑序列、大小为2的3‑q‑序列和大小为3的3‑q‑序列,具体步骤为:7.4.1 由大小为1的2‑q‑序列进行q‑项集内的连接产生大小为1的3‑q‑序列,查找WICUM结构表找出相应的连接项的WICUM值,当WICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点;否则生成结点,转到步骤7.4.5;7.4.2 由大小为1的2‑q‑序列进行q‑项集间的连接产生大小为2的3‑q‑序列,查找BICUM结构表找出相应的连接项的BICUM值,当BICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点;否则生成结点,转到步骤7.4.5;7.4.3 由大小为2的2‑q‑序列进行q‑项集内的连接产生大小为2的3‑q‑序列,查找WICUM结构表找出相应的连接项的WICUM值,当WICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点,否则生成结点,转到步骤7.4.5;7.4.4 由大小为2的2‑q‑序列进行q‑项集间的连接产生大小为3的3‑q‑序列,查找BICUM结构表找出相应的连接项的BICUM值;当BICUM值小于阈值ξ时,则不进行连接操作,进行剪枝,这个连接项不产生结点;否则生成结点,转到步骤7.4.5;7.4.5 建立连接后新结点的效用矩阵,通过效用矩阵计算新结点的效用值;7.4.6 计算新结点的效用值上界,新结点的效用值上界为新结点在效用矩阵中效用值与剩余效用值总和,当效用值上界大于阈值ξ时,则向下生成结点,否则不向下生成结点;7.5 循环构建结点,直到序列模式树构建完成,最终得到全部的高效用序列模式,所述高效用序列模式代表不同时间段服用各种药物,当各种药物间组合后累计DDD值超出预设阈值,判定为高累计DDD值药物组合。...
【技术特征摘要】
【专利技术属性】
技术研发人员:吕存伟,孙小明,温晓岳,
申请(专利权)人:银江股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。