多层电子邮件优先级排序法制造技术

技术编号:11284942 阅读:129 留言:0更新日期:2015-04-10 22:24
一种使入站消息优先级排序自动化的方法。所述方法包括使用训练数据训练计算机系统的全局分类器。根据多个反馈实例动态地训练所述计算机系统的用户特定的分类器。根据基于主题的用户模型,推断所述计算机系统接收的所述入站消息的主题。计算所述入站消息的多个上下文特征。根据所计算的所述入站消息的上下文特征和所述全局分类器与所述用户特定的分类器的加权组合,确定用于向所述入站消息分配优先级级别的优先级分类策略。根据所述优先级分类策略对所述入站消息进行分类。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一种使入站消息优先级排序自动化的方法。所述方法包括使用训练数据训练计算机系统的全局分类器。根据多个反馈实例动态地训练所述计算机系统的用户特定的分类器。根据基于主题的用户模型,推断所述计算机系统接收的所述入站消息的主题。计算所述入站消息的多个上下文特征。根据所计算的所述入站消息的上下文特征和所述全局分类器与所述用户特定的分类器的加权组合,确定用于向所述入站消息分配优先级级别的优先级分类策略。根据所述优先级分类策略对所述入站消息进行分类。【专利说明】
本专利技术一般地涉及用于电子邮件消息的优先级排序的方法和装置,更具体地说, 涉及用于多层电子邮件消息优先级排序法的方法和装置。
技术介绍
假如知识工作者每天接收大量消息并且需要大量时间来阅读并回复每个消息,则 知识工作者会想办法通过扫描收件箱,检查发件人姓名和主题以使某些消息的关注优先级 高于其它消息,来优化花在消息处理上的时间。当知识工作者收件箱内的新消息数量很大 时,过滤消息以迅速识别高优先级消息本身成为重要且耗时的工作。此重要且耗时的工作 让人每天觉得"邮件过载",并且偶尔会导致忽略关键消息的不良后果,因为人们发现在根 据发件人、主题或日期等元素进行排序时,很难创建有效的次序。 -般很容易理解,用户针对消息执行的诸如阅读、回复、归档或删除之类的动作主 要取决于用户感知的消息重要性。因此,电子邮件优先级排序的主要目标是识别具有较高 的用户感知重要性值的电子邮件消息。 已提出或建议若干用于重新设计电子邮件接口的技术以帮助用户快速识别其收 件箱中的重要电子邮件。例如,现有的方法多数根据使用监管式学习算法训练的分类器来 排列电子邮件的优先级。 例如,某些传统的方法自动将电子邮件分组为会话式线程并根据具有各种社交、 内容、线程和标签特征的线性逻辑回归模型排列消息的优先级,从而对用户的入站消息进 行优先级排序。其它传统的方法在基于单词、基于短语以及元级特征(例如,消息发件人、 收件人、长度、时间、是否带附件)上使用支持向量机(SVM)分类器以确定新的未读电子邮 件的重要性。还有一些传统的方法使用SVM分类器,但是根据通过电子邮件数据推导的每 个用户的个人社交网络计算额外的社交重要性特征。这些方法为了分类器学习而使用的基 于内容的特征是在电子邮件内容中出现的单词,对于单词太少(稀疏数据)的极简短消息 或单词太多的长消息(噪声数据)而言,这种方法效果不太好。 例如,传统的技术通过查看消息正文内的所有单词来训练其分类器。这种方法导 致高维度分类,因为每个单词都是一个维度。有些传统的分类器使用此高维度方法,然后尝 试通过计算一个或多个特定单词出现的实例数来推断消息的重要性,而其它传统的分类器 尝试根据一个单词相对于另一单词的位置来预测消息的重要性。由于其高维特性,这些方 法非常嘈杂。因此,用户很难了解为何看上去类似的消息被采用传统方法的系统以不同的 方式进行分类。 为增加优先级排序的准确度,有些传统方法通过一次性批处理标记的训练数据来 训练分类器,它们或者不考虑动态用户反馈,或者简单地使用用户反馈逐步更新分类器的 特征权重。例如,在提供用户反馈的传统技术中,反馈只是被调入分类器,这简单地调整分 类器的现有权重。但是,由于仅针对每个特定的反馈实例更新分类器,因此该反馈可能不会 立即反映在分类器中,例如,即使在用户指示来自某一发件人的消息为低优先级之后,他仍 可能会从该发件人接收到被标记为高优先级的消息。换言之,可能需要一些时间才能让分 类器的权重以有意义的方式更新,例如,以导致系统更改预测的消息优先级的方式。 此外,根据用户反馈积极地更新特征权重会降低电子邮件优先级排序的稳健性, 例如,牺牲分类器提供的可靠性,而保守地更新特征权重将导致对用户反馈的迟缓响应。 因此,本专利技术的专利技术人意识到需要一种改进的电子邮件系统和方法,从而通过在 不牺牲全局(通用)分类器提供的可靠性的情况下,快速结合用于确定已接收电子邮件消 息优先级的用户特定准则,来帮助用户执行他/她的入站消息日常分类。
技术实现思路
鉴于传统方法和结构的上述以及其它示例性问题、缺陷和缺点,本专利技术的一个示 例性特征是提供一种方法和结构,其中由基于主题的模型通知电子邮件优先级排序,该模 型从用户的电子邮件数据和相关企业信息(例如,组织结构)自动构建。 在本专利技术的第一示例性方面,全局分类器有助于缓解冷启动问题并提高优先级预 测的稳健性,而用户特定的分类器增加系统的适应性并允许对用户反馈做出快速响应。 在本专利技术的另一示例性方面,用户模型、消息元数据和消息内容被用于计算作为 优先级分类器输入的上下文特征。 在本专利技术的另一示例性方面,提供组合全局优先级分类器和用户特定的分类器的 动态策略。 本专利技术提供如权利要求1中要求保护的方法,以及对应的系统和计算机程序。 根据本专利技术的另一示例性方面,提供一种装置。所述装置包括用于接收入站消息 的输入端;至少一个处理器;以及有形地体现用于使入站消息优先级排序自动化的一组指 令的存储器。所述指令包括批次学习模块,该批次学习模块根据输入其中的训练数据生成 全局分类器;反馈学习模块,该反馈学习模块根据多个反馈实例生成用户特定的分类器; 特征提取模块,该特征提取模块接收所述入站消息和基于主题的用户模型,根据所述基于 主题的用户模型推断所述入站消息的主题,并且计算所述入站消息的多个上下文特征;以 及分类模块,该分类模块根据所述入站消息的多个上下文特征和所述全局分类器与所述用 户特定的分类器的加权组合,动态地确定用于向所述入站消息分配优先级级别的优先级分 类策略,并且根据所述优先级分类策略对所述入站消息进行分类。 根据本专利技术的另一示例性方面,提供一种计算机系统,其中包括有形地体现用于 使入站消息优先级排序自动化的一组指令的存储器。所述指令导致所述计算机系统包括: 多个分类器,其中包括:使用训练数据创建的全局分类器;根据反馈实例动态更新的用户 特定的分类器;基于主题的用户模型,其包括多个主题模型;特征提取模块,其推断所述入 站消息的主题并根据所推断的所述入站消息的主题计算所述入站消息的多个上下文特征; 以及分类模块,其根据所述全局分类器与所述用户特定的分类器的动态组合,向所述多个 上下文特征中的每个上下文特征分配权重,组合每个上下文特征的已分配权重,并且确定 所述入站消息的优先级级别。 根据本专利技术的另一示例性方面,提供一种使入站消息优先级排序自动化的计算机 系统。所述计算机系统包括:多个分类器,其中包括:使用训练数据创建的全局分类器;以 及根据反馈实例动态更新的用户特定的分类器;基于主题的用户模型,其包括多个主题模 型;特征提取模块,其推断所述入站消息的主题并根据所推断的所述入站消息的主题计算 所述入站消息的多个上下文特征;以及分类模块,其根据所述全局分类器与所述用户特定 的分类器的动态组合,向所述多个上下文特征中的一组上下文特征分配权重,组合所述一 组上下文特征的已分配权重,并且确定所述入站消息的优先级级别。根据本专利技术的另一示 例性方面,提供一种装置。所述装置包括:用于接收入站消息的输入端;至少本文档来自技高网
...

【技术保护点】
一种使入站消息优先级排序自动化的方法,所述方法包括:使用训练数据训练计算机系统的全局分类器;根据多个反馈实例动态地训练所述计算机系统的用户特定的分类器;根据基于主题的用户模型,推断所述计算机系统接收的所述入站消息的主题;计算所述入站消息的多个上下文特征;根据所计算的所述入站消息的上下文特征和所述全局分类器与所述用户特定的分类器的加权组合,确定用于向所述入站消息分配优先级级别的优先级分类策略;以及根据所述优先级分类策略对所述入站消息进行分类。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:吕洁文镇潘诗梅J·赖
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1