基于血缘解析的自动依赖推荐制造技术

技术编号：38052954 阅读：11 留言：0更新日期：2023-06-30 11:18

本申请的实施例能够支持自动解析多种类型的SQL任务,将解析及关联结果实时同步至图数据库。本申请的一些实施例还能通过多个属性及权重通过图数据库计算获取匹配度最高的TOP N个任务，为用户推荐最合适的依赖任务。为用户推荐最合适的依赖任务。为用户推荐最合适的依赖任务。

全部详细技术资料下载

【技术实现步骤摘要】
基于血缘解析的自动依赖推荐

[0001]本申请涉及大数据技术，特别地涉及基于血缘解析来自动推荐任务依赖的方法。

技术介绍

[0002]互联网时代，尤其是社交网络、电子商务和移动通信把人类社会带入了一个以“PB”为单位的结构和非结构信息的大数据时代。学术界和工业界提出了多种大数据处理工具(或称计算平台)，例如分布式计算框架Hadoop、数据仓库工具Hive、基于内存计算的分布式系统Spark、大规模图数据计算平台Giraph等。借助于多种多样计算平台，数据开发人员每天会提交各种类型的任务来加工、分析数据。各种任务之间相互依赖，随时平台的不断使用，作业也不断增加，任务类型多种多样，因此造成查找任务(当前任务)的依赖越来越麻烦，因此迫切需要一种能够智能推荐依赖(即当前任务所依赖的任务))给到用户以进行选择的方法。

技术实现思路

[0003]本申请的实施例提供了一种为当前任务计算依赖的方法，包括：
[0004]在任务运行后对该任务进行血缘解析；
[0005]将所述血缘解析的结果与所述任务相关联地存入数据库；
[0006]以所述当前任务的属性作为输入，对所述数据库中的数据进行分析，以计算出与所述当前任务具有匹配关系的至少一个任务。
[0007]本申请的实施例还提供了一种计算机可读介质，其上存储有计算机可读指令，所述指令被执行时可实施如上所述的方法。
[0008]本申请的实施例能够支持自动解析多种类型的SQL任务,将解析及关联结果实时同步至图数据库。本申请的一些实施例还能通...

【技术保护点】

【技术特征摘要】
1.一种为当前任务计算依赖的方法，包括：在任务运行后对该任务进行血缘解析；将所述血缘解析的结果与所述任务相关联地存入数据库；以所述当前任务的属性作为输入，对所述数据库中的数据进行分析，以计算出与所述当前任务具有匹配关系的至少一个任务。2.如权利要求1所述的方法，其中所述血缘解析操作是通过符合特定的插件协议的插件而执行的，所述插件协议能够适配不同版本、不同厂商的计算平台。3.如权利要求1所述的方法，其中所述数据库是图数据库，并且所述分析操作使用了逻辑回归算法。4.如权利要求3所述的方法，其中，在将所述血缘解析的结果存入所述图数据库之前先存入关系型数据库，然后通过增量数据订阅机制将相关数据存入所述图数据库。5.如权利要求1所述的方法，其中所述关联是基于所述解析结果的批次ID和所述任务的ID。6.如权利要求1所述的方法，其中，在将所述血缘解析的结果与所述任务相关...

【专利技术属性】
技术研发人员：张森森，甘云锋，江敏，高雁冰，刘俊明，
申请(专利权)人：杭州数澜科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人