一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质技术方案

技术编号：28837455 阅读：11 留言：0更新日期：2021-06-11 23:34

本发明专利技术公开了一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质，本方案首先构建相应样本的选择交互向量，包括推送向量与点击向量，其中推送向量为被动选择向量，点击向量为主动选择的向量；然后基于不同样本的推送向量与点击向量，分别计算两个样本间的真实契合度与没有知识点重合时的先验契合度；最后通过度量两种契合度的提升程度，即可获得样本间知识聚合度。本方案能够在不使用样本本身内容的情况下，仅利用选择向量表示的选择交互数据，计算出样本间知识点或兴趣的聚合程度，在计算中排除样本流行程度的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
本专利技术涉及互联网、人工智能领域中数据样本处理技术，具体涉及样本知识聚合度的计算技术。
技术介绍
很多互联网任务中，存在大量选择交互，比如对某个网页的选择、对资讯的选择、及对商品的选择，由此可以产生大量的选择数据。从被选择的目标角度来看，选择数据可以整理成选择主体的集合，或者写成高维组合向量的形式，即维度为选择主体数目、元素值为0或1的高度稀疏向量。很多时候需要利用选择这种形式的选择数据计算被选择的目标间的相似度，比如通过两篇资讯的选择向量计算它们之间的相似度，该相似度可以进一步作为资讯推荐的依据，类似的，通过两件商品的选择向量计算它们之间的关联度也可用来推荐商品。目前通常用于计算上述选择向量的方法包括皮尔逊相似性度量，余弦相似性度量与杰卡德相似性度量。在这些相似性度量方法中，杰卡德相似性度量方法尤其适合高度稀疏的高维组合选择向量，其核心思路是计算两个集合的交集规模在它们并集规模中的比例，对于选择向量来说则通过逻辑运算实现，通过分别对两个选择向量进行按位与和按位或操作，然后计算两种操作后结果1范数比值，其中1范数指向量中的非零元素个数。众所周知在互联网应用中，很多时候要考虑选择数据样本间的本质内容的相似性，比如其涵盖的知识或兴趣的聚合程度，而包括杰卡德相似性度量在内的现有相似度计算方法通过对样本选择变量的统计获得，是一个绝对的数值，没有考虑样本自身的选择比例或流行程度，因此不能客观反映样本间知识点或兴趣的聚合程度或聚合价值。例如，对...

【技术保护点】
1.基于选择交互的样本知识聚合度计算方法，其特征在于，包括：/n构建相应样本的选择交互向量，包括推送向量与点击向量，其中推送向量为被动选择向量，点击向量为主动选择的向量；/n基于不同样本的推送向量与点击向量，分别计算两个样本间的真实契合度与没有知识点重合时的先验契合度；/n通过度量真实契合度与先验契合度之间的提升程度，获得样本间知识聚合度。/n

【技术特征摘要】
1.基于选择交互的样本知识聚合度计算方法，其特征在于，包括：
构建相应样本的选择交互向量，包括推送向量与点击向量，其中推送向量为被动选择向量，点击向量为主动选择的向量；
基于不同样本的推送向量与点击向量，分别计算两个样本间的真实契合度与没有知识点重合时的先验契合度；
通过度量真实契合度与先验契合度之间的提升程度，获得样本间知识聚合度。

2.根据权利要求1所述的基于选择交互的样本知识聚合度计算方法，其特征在于，所述方法通过如下方式构建样本的选择交互向量：

其中N表示选择主体的个数，TA表示N个选择主体被推送样本A的指示向量，如第i个选择主体被推送，TA中第i个元素记为1，否则记为0；DA表示N个选择主体点击样本A的指示向量，如第i个选择主体点击样本A，则DA中第i个元素记为1，否则记为0。

3.根据权利要求1所述的基于选择交互的样本知识聚合度计算方法，其特征在于，所述方法计算样本知识聚合度时，包括：
首先基于不同样本的推送向量与点击向量，构建契合度与知识重合度的关联方式；
接着，通过将知识重合度置零可以获得样本的先验契合度；
接着，通过正常的样本契合度计算方式获得样本间真实契合度；
接着，通过两种契合度做比，并通过两个样本各自...

【专利技术属性】
技术研发人员：项涛，刘智勇，杨旭，曾少锋，姚志煜，
申请(专利权)人：上海维外科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人