矩阵因式分解中的特征嵌入制造技术

技术编号:12024689 阅读:116 留言:0更新日期:2015-09-10 09:44
在各种实施例中,提供用于通过使用特征向量来增强媒体内容推荐的系统和方法。接收具有第一部分和第二部分的增强-矩阵。所述增强-矩阵的所述第一部分包括用户项矩阵,以及,所述增强-矩阵的所述第二部分包括特征项矩阵。所述特征项矩阵中的每个条目是项元数据。基于关联于所述项的特征向量的每个的加权和确定项-主干向量。基于项-主干向量和项-偏移量向量生成项-潜在-特质向量。所述项-偏移量向量是针对所述用户项矩阵中的项的项向量。提供基于所述项-潜在-特质向量导出的一个或多个推荐的-媒体内容。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】矩阵因式分解中的特征嵌入
技术介绍
推荐系统帮助预测用户对产品或服务的兴趣。推荐系统已在包括媒体递送服务的 多种媒体服务中变得极其常见。推荐系统可以使用几种不同的方法来向用户提供推荐。
技术实现思路
提供本摘要来以简要形式介绍下面在【具体实施方式】中进一步描述的概念的选集。 本摘要不旨在标识所要求权利的主题的关键特征或必要特征,其也不旨在被单独用作在确 定所要求权利的主题的范围时的辅助。 提供本专利技术的实施例以便通过使用特征向量来增强媒体内容推荐。可以通过两个 单独的独立矩阵一用户和/或项的特征矩阵一来增强用户-项矩阵,从而矩阵因式分解生 成用于告知用户与项之间的关系的潜在空间模型。用户-项矩阵包括这样的条目,所述条 目是信号,所述信号表示来自用户的关于特定项的反馈。在所述特征矩阵中,每个用户或项 关联于多个特征,所述多个特征表示针对该特定用户或项的元数据。所述用户-项矩阵中 的每个用户和项具有先验概率分布(下文中称"先验")。针对用户或项的先验是基于在各自 特征矩阵中该用户的特征的总和或该项的特征的总和。在实施例中,特征的总和可以是加 权和。所述先验表示所述用户或项在所述用户-项矩阵中的概率值。所述基于特征总和的 先验称为主干(stem)。在这点上,每个用户或项可以关联于用户-主干向量或项-主干向 量,其中,所述用户-主干向量或项-主干向量基于关联于该用户或项的特征向量的每个的 总和计算出。进一步地,每个用户或项可以还基于关联于该用户或项的信息而从所述主干 偏离。所述用户或项向量与所述主干的差异或偏离称为偏移。所述用户或项主干和偏移可 以用于形成具有针对用户和项的潜在特质向量的潜在空间模型,其中,该针对用户和项的 潜在特质向量在标识和然后提供推荐的-媒体内容时使用。【附图说明】 下面参考附图详细描述了本专利技术,其中: 图1是适于在实现本专利技术的实施例时使用的一个示例性计算环境的框图; 图2是本专利技术的实施例可以在其中被使用的一个示例性系统体系结构的框图; 图3A-3C描绘了示出方法的一个示例性增强-矩阵和潜在空间模型,其中,所述方法用 于利用本专利技术的实施例通过使用特征向量来增强媒体内容推荐; 图4A-4C是这样的图,其示出了利用本专利技术的实施例通过使用特征向量来增强媒体内 容推荐的方法; 图5是利用本专利技术的实施例通过使用特征向量来增强媒体内容推荐的方法的流程图; 图6是流程图,其示出了利用本专利技术的实施例通过使用特征向量来增强媒体内容推荐 的方法;以及 图7是流程图,其示出了利用本专利技术的实施例通过使用特征向量来增强媒体内容推荐 的方法。【具体实施方式】 在本文中使用特异性描述了本专利技术的实施例的主题以满足法定要求。然而,本说 明书其自身不旨在限制本专利的范围。相反,专利技术人已设想,所要求权利的主题还可以通过 其它方式被实现,包括结合其它现有和未来技术的、与在本文档中描述的那些相似的不同 步骤或步骤的组合。此外,尽管术语"步骤"和/或"框"在本文中可以用于暗示所使用方 法的不同单元,但所述术语不应当被解释为暗示在本文中公开的各个步骤之中或之间的任 何特定顺序,除非当明确描述了各个步骤的顺序。 提供本专利技术的实施例以便通过使用特征向量来增强媒体内容推荐。推荐系统对用 户兴趣进行评估,并且使用用户-兴趣数据执行计算以识别推荐的-媒体内容。例如,当用 户观看电影时,他们可以提供他们对每个电影的满意水平的反馈。可以收集针对电影的用 户满意度信息,并且该数据用于向其他用户做出推荐。在操作中,矩阵因式分解提供一种推 荐系统用于推荐媒体内容的方式。特别地,矩阵因式分解中的协同过滤创建用于推荐不同 类型媒体(例如电影、音乐、视频游戏、电视节目)的用户-项矩阵。所述用户-项矩阵用于 分析用户与项之间的关联,以便产生其他用户与项之间的新关联。例如,一个n维用户-项 矩阵可以包括表示用户的行和表示项的列。该矩阵可以包括这样的信号,所述信号是对项 的评级或偏好。所述评级或偏好可以与特定用户或设备相关联。"喜欢"和"不喜欢"的评 级系统可以作为矩阵单元(cell)中的条目而存在。在实施例中,问号可以表示这样的情况, 其中,用户还未对项进行评级。每个用户可能已在系统中对一个或多个项进行评级,并且对 该用户还未使用的一个或多个项做出推荐或预测。然而,具有协同过滤的矩阵因式分解受 冷用户或冷项的影响,所述冷用户或冷项即没有足够使用信息的用户或项。不能对没有足 够信息的用户和项进行正确建模以便产生用于提供推荐的新关联。特别的,对于数学上生 成用户与项之间的另外了解的关系的潜在空间模型,难以解释该潜在空间中的向量的方向 的直观意义。同样,本专利技术中的实施例提供用于基于矩阵因式分解来识别推荐的-媒体内 容的方法和系统,其中,所述矩阵因式分解使用用户和项的特征向量对潜在空间进行建模。 提供本专利技术的实施例以便通过使用特征向量来增强媒体内容推荐。可以通过用户 和/或项的至少一个独立特征矩阵来增强用户_项矩阵,从而矩阵因式分解生成用于告知 用户与项之间的关系的潜在空间模型。用户-项矩阵包括这样的条目,所述条目是信号,所 述信号表示来自用户的关于特定项的反馈。在所述特征矩阵中,每个用户或项与多个特征 相关联,其中,所述多个特征表示针对该特定用户或项的元数据。用户-项矩阵中的每个用 户和项具有先验概率分布(在下文中称"先验")。针对用户或项向量的该先验是基于在各自 特征矩阵中该用户的特征的总和或该项的特征的总和。在本专利技术的范围内已设想,所述特 征的总和可以是加权和,从而不同的各个特征可以或多或少地有影响。所述先验表示该用 户或项在用户-项矩阵内的概率值。基于特征总和的该先验称为主干。在这点上,每个用户 或项可以与用户-主干向量或项-主干向量相关联,所述用户-主干向量或项-主干向量 基于关联于该用户或项的特征向量的每个的和(例如纯和、加权和或归一化和)计算出。进 一步地,每个用户或项可以还基于关联于该用户或项的信息而与主干偏离。用户或项向量 与主干的差异或偏离称为偏移。用户或项主干和偏移可以用于形成潜在空间模型,其中,针 对用户和项的潜在特质向量在识别推荐的-媒体内容以及然后提供以便显示该推荐的-媒 体内容时使用。 在实施例中,特征还用于达到对在用户-项矩阵中没有足够信息的冷用户或冷项 的潜在表示。所述用户或项可以由从特征矩阵导出的用户-主干向量或项-主干向量在 潜在空间中表示。同样,即使用户或项不具有足够用于形成用户-项矩阵中的偏移向量的 信息,该用户或项将仍然在潜在空间中被表示。另外,用户替换或项替换可以用于在潜在空 间中更准确地表示用户或项向量。在潜在空间中未被正确表示的用户和项可以被替换。如 将在下面详细讨论的,"冷"指定这样的用户或项,所述用户或项没有足够用于从其得出关 于相似用户或项的推论的信息(例如评级),其中,根据所述推论做出推荐。相反,"暖"指定 具有足够信息的用户或项。在实施例中,"暖"用户或项可以提供信息,其中,从所述信息得 出关于相似用户或项的推论以便识别推荐的-媒体内容。暖用户或项具有足够的信息,并 且在潜在空间内被正确地表示。在操作中,识别出分别与冷用户或冷项相似的暖用户或暖 项的子集,并且基于从所述子集导出的向量值本文档来自技高网...

【技术保护点】
一个或多个存储计算机可用指令的计算机存储介质,所述计算机可用指令当被一个或多个计算设备使用时导致所述一个或多个计算设备执行用于通过使用特征向量来增强媒体内容推荐的方法,所述方法包括:接收具有第一部分和第二部分的增强‑矩阵,其中,所述第一部分包括用户‑项矩阵,并且所述第二部分包括特征‑项矩阵,以及其中,所述特征‑项矩阵中的每个条目是项元数据;基于关联于所述项的特征向量的每个的和确定项‑主干向量;基于所述项‑主干向量和项‑偏移向量生成项‑潜在‑特质向量,其中,所述项‑偏移向量是所述用户‑项向量中针对该项的项向量;以及提供基于所述项‑潜在‑特质向量识别的一个或多个推荐的‑媒体内容。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:N奈斯N克尼希施泰因U帕凯SZ克伦A贾弗里
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1