The embodiment of the invention discloses a label determining method, equipment and system, the current node device receives the label update message, node device, and the label update message to the label to be determined which carry the label type and label label update messages; when the node equipment before the node equipment update the label to be determined the label of the current node equipment; convergence judgment coefficient residual label label node equipment to be determined in before and after updating the value is less than a preset; when the judgment result is yes, the current node equipment will be updated after the label set to be determined for the label of the node devices to determine the label. Through the application of the technical scheme for the equipment to be determined fast determine the node label node device using a small amount of tags have been identified, so as to improve the efficiency of tag nodes to determine the level of implementation minutes large graph for one billion level of the label to determine.
【技术实现步骤摘要】
本申请涉及通信
,尤其涉及一种标签确定方法、设备和系统。
技术介绍
现有技术中,通常会应用标签传播算法根据已标记商品、店铺或视频等实体的标签信息去预测未标记商品、店铺或视频等实体的标签信息,例如,电子购物网站的商品类目分类、O2O(OnlineToOffline,线上线下电子商务)店铺主营业务分类、视频分享网站的视频分类等场景中。现有的标签传播算法通常是根据人工标记的已标记实体的标签,利用半监督的方法,根据实体和实体之间的相似度进行标签传播,从而,对未标记的实体进行标记。申请人在实现本专利技术的过程中发现现有分类技术中存在以下技术问题:(1)人工标记标签的人力投入成本很高,而且效率比较低,并且容易出现错误或遗漏。(2)随着网络技术的发展,动辄十亿级别,甚至规模更加巨大的海量数据集的标签传播确定过程的时间复杂度非常高,以至于常规的单机方案无法无法解决海量数据集的标签确定需求。
技术实现思路
本申请实施例提供了一种标签确定的方法及设备,用以利用少量的标签已确定的节点设备确定大量的标签待确定的节点设备。为此,本申请采用以下技术手段:本申请实施例提供了一种标签确定的方法,应用于包括基于整体同步并行计算模型BSP架构的多个节点设备的系统中,该方法包括:当前节点设备接收标签更新消息,并将所述标签更新消息发送给标签待确定的节点设备,其中,所述标签更新消息中携带标签类型和标签值;所述当前节点设备根据所述标签类型和标签值,以及所述标签待确定的节点设备当前的标签,更新所述标签待确定的节点设备的标签;所述当前节点设备判断所述标签待确定的节点设备在更新前和更新后的标签值的残差 ...
【技术保护点】
一种标签确定的方法,应用于包括基于整体同步并行计算模型BSP架构的多个节点设备的系统中,其特征在于,该方法包括:当前节点设备接收标签更新消息,并将所述标签更新消息发送给标签待确定的节点设备,其中,所述标签更新消息中携带标签类型和标签值;所述当前节点设备根据所述标签类型和标签值,以及所述标签待确定的节点设备当前的标签,更新所述标签待确定的节点设备的标签;所述当前节点设备判断所述标签待确定的节点设备在更新前和更新后的标签值的残差是否小于预设的收敛系数;当判断结果为是时,所述当前节点设备将所述更新后的标签设置为所述标签待确定的节点设备的确定标签。
【技术特征摘要】
1.一种标签确定的方法,应用于包括基于整体同步并行计算模型BSP架构的多个节点设备的系统中,其特征在于,该方法包括:当前节点设备接收标签更新消息,并将所述标签更新消息发送给标签待确定的节点设备,其中,所述标签更新消息中携带标签类型和标签值;所述当前节点设备根据所述标签类型和标签值,以及所述标签待确定的节点设备当前的标签,更新所述标签待确定的节点设备的标签;所述当前节点设备判断所述标签待确定的节点设备在更新前和更新后的标签值的残差是否小于预设的收敛系数;当判断结果为是时,所述当前节点设备将所述更新后的标签设置为所述标签待确定的节点设备的确定标签。2.如权利要求1所述的方法,其特征在于,所述当前节点设备接收标签更新消息,并将所述标签更新消息发送给标签待确定的节点设备,具体包括:所述当前节点设备接收标签已确定的节点设备发送的标签更新消息,其中,所述标签更新消息中携带的标签类型和标签值是所述当前节点设备根据所述标签已确定的节点设备与所述标签待确定的节点设备的相似度和阻尼系数得到的。3.如权利要求1所述的方法,其特征在于,所述当前节点设备将所述更新后的标签设置为所述标签待确定的节点设备的确定标签后,所述方法还包括:所述当前节点设备将所述标签待确定的节点设备的状态设置为标签已确定的节点设备,并不再对所述确定标签进行更新。4.如权利要求1所述的方法,其特征在于,所述方法还包括:当所述当前节点设备判断所述标签待确定的节点设备在更新前和更新后的标签值的残差不小于预设的收敛系数时,则再次接收标签更新消息。5.如权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:如果所述标签待确定的节点设备不存在当前的标签,则设...
【专利技术属性】
技术研发人员:毛仁歆,李龙飞,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。