端到端电子邮件标签预测制造技术

技术编号:34684998 阅读:29 留言:0更新日期:2022-08-27 16:17
一种系统提供电子邮件消息的自动、端到端标记。在发送电子邮件客户端处编写消息时,服务器可以接收用作预测模型的输入的电子邮件信息。该模型识别可用于特定用户组或电子邮件列表的应用于电子邮件消息的标签。这些预测标签被发送回电子邮件客户端,在那里它们可以与其它用户定义的标签一起嵌入在电子邮件中。当消息通过电子邮件服务器传递时,系统可以使用对预测标签所做的任何更改来重新训练模型。当在第二电子邮件客户端处接收到消息时,接收者可以进一步编辑标签,并且可以再次使用任何更改来重新训练模型。改来重新训练模型。改来重新训练模型。

【技术实现步骤摘要】
【国外来华专利技术】端到端电子邮件标签预测

技术介绍

[0001]现代互联网和网络通信在过去二十年中呈指数增长。组织的成员现在能够通过包括电子邮件、即时消息传递、文本消息传递、对话信道、社交媒体等多个不同的并行通信信道进行即时通信。这种通信导致信息的可访问性增加,以及在分布式劳动力中前所未有的协作和团队合作水平。面对面会议在很大程度上已被通常更高效、简洁和有效的电子通信所取代。
[0002]尽管不断出现各种通信手段,但商业通信的主要方法仍然是组织内的电子邮件(email)。尽管由于即时电子邮件通信已经实现了生产力的提高,但仍然存在限制可能做出的改进的若干问题。具体而言,随着组织内电子邮件数量的增加,用户可能需要花费越来越多的时间来打开、阅读、填写、寻址和以其它方式处理每天出现的大量电子邮件通信。即使当仅限于特定组织,诸如参与小组项目的几个成员,每天接收到的大量电子邮件也会迅速导致信息过载。
[0003]过去,接收电子邮件的用户已经使用多种技术来尝试组织和减轻这种电子邮件通信的雪崩。例如,一些电子邮件客户端允许用户将接收到的电子邮件分类到不同的文件夹中。其它电子邮件客户端已经使用手动分配的静态标志(label)或标签(tag)来根据特定主题对电子邮件进行分类。一些先前的解决方案已经使用逻辑表达式来设置规则,这些规则在接收到电子邮件时基于电子邮件主题行或正文中的词语序列自动对它们进行分类。但是,这些解决方案中的每一个都无法在整个组织中以一致的方式自动对电子邮件进行分类,并且它们无法以端到端的方式将标签从电子邮件发送者应用到电子邮件接收者。这会导致在组织中的每个收件箱中不同的手动类别分配。

技术实现思路

[0004]一种系统提供电子邮件消息的自动、端到端标记。在发送电子邮件客户端处编写消息时,服务器可以接收用作预测模型的输入的电子邮件信息。该模型识别可用于特定用户组或电子邮件列表的应用于电子邮件消息的标签。这些预测标签(predicted tags)被发送回电子邮件客户端,在那里它们可以与其它用户定义的标签一起嵌入在电子邮件中。当消息通过电子邮件服务器传递时,系统可以使用对预测标签所做的任何更改来重新训练模型。当在第二电子邮件客户端处接收到消息时,接收者可以进一步编辑标签,并且可以再次使用任何更改来重新训练模型。
[0005]当在发送电子邮件客户端处起草电子邮件消息时,可以从系统请求预测标签集合。电子邮件消息可以与用户组(诸如邮件列表或其它组织组)相关联,并且组可以具有其自己的可用标签集合,这些标签随着时间推移随组消息而演进。系统可以使用电子邮件信息(例如,正文、主题行、电子邮件接收者等)作为模型的输入,并且输出对应于每个可用标签。模型可以针对每个标签生成分数,并且可以使用阈值从该组的可用标签中选择预测标签集合。发送电子邮件客户端可以在用户界面中显示预测标签以及主题、接收者列表等。用户然后可以编辑预测标签、选择预测标签、取消选择预测标签和/或添加新用户标签。当添
加新标签时,系统可以提供自动完成功能,该功能将键入的前缀与未作为预测标签提供的可用标签进行匹配。
[0006]当发送电子邮件消息时,所选择的/未选择的/用户标签可以与电子邮件消息一起发送。例如,标签可以嵌入在电子邮件消息的标头(header)中。当邮件服务器接收到消息时,系统可以再次使用模型来分析邮件的标签。如果没有选择/提供预测标签,那么系统可以使用电子邮件信息在电子邮件服务器处生成预测标签集合。然后,这些预测标签可以在电子邮件被转发到接收电子邮件客户端之前添加到电子邮件。如果用户添加了新标签,或者如果用户编辑了现有标签,那么可以使用电子邮件信息和更改的标签作为训练对(training pair)来重新训练模型。
[0007]当接收电子邮件客户端接收到电子邮件时,接收用户可以再次使用用户界面来编辑、添加和/或移除与电子邮件消息一起接收到的标签。一旦这些编辑完成,系统可以再次使用接收用户所做的任何更改来为标签预测模型生成新的训练集。这允许从电子邮件消息生命周期的开始到结束分配、传播和/或编辑标签。发送者和/或接收者可以使用公共标签集合,使得电子邮件的分类可以在组内标准化。为发送电子邮件而训练和使用的标签预测模型也可以用于在附加通信信道(诸如信道、社交媒体馈送、即时消息传递等)中标记消息。
[0008]标签预测模型的一些实施方式可以生成使用电子邮件信息填充的词语嵌入矩阵。具有不同窗口尺寸的多个不同卷积过滤器可以各自在词语嵌入矩阵的列上执行。卷积过滤器的结果可以经历最大池化操作以填充结果向量。模型还可以包括也使用词语嵌入矩阵的并行操作集合。可以从词语嵌入矩阵生成关注矩阵,并且可以使用另一个最大池化操作使特定标签与输入文本的部分相关。所得到的关注向量可以与词语嵌入矩阵的转置版本相乘,以生成第二结果向量。然后可以将这两个结果向量组合为完全连接层,以提供每个可用标签的最终分数。
附图说明
[0009]可以通过参考说明书的其余部分和附图来实现对各种实施例的性质和优点的进一步理解,其中在几个附图中使用相同的附图标记来指代相似的部件。在一些情况下,子标签与附图标记相关联以表示多个相似部件之一。当引用附图标记而不指定现有子标签时,旨在引用所有此类多个相似部件。
[0010]图1图示了根据一些实施例的用于实现动态标签预测的系统体系架构。
[0011]图2A图示了根据一些实施例的可以是在发送客户端设备处的电子邮件客户端的一部分的用户界面。
[0012]图2B图示了根据一些实施例的如何可以使用用户界面来添加新标签和移除现有标签。
[0013]图2C图示了根据一些实施例的在对标签列表202进行用户更改之后的用户界面。
[0014]图2D图示了根据一些实施例的如何可以使用用户界面来将标签应用到特定文本选择。
[0015]图3图示了根据一些实施例的由电子邮件客户端执行以显示预测标签集合以供用户编辑的处理的流程图。
[0016]图4图示了根据一些实施例的由标签预测服务器执行以从可用标签集合生成预测标签集合的操作的功能图。
[0017]图5图示了根据一些实施例的用于在通过电子邮件服务器发送电子邮件消息时处理电子邮件消息中的标签的方法的流程图。
[0018]图6图示了根据一些实施例的用于使用接收客户端设备与标签交互的方法的流程图。
[0019]图7A图示了根据一些实施例的在接收电子邮件客户端处实现的用户界面。
[0020]图7B图示了根据一些实施例的如何可以使用用户界面来修改标签集合。
[0021]图7C图示了根据一些实施例的如何使用用户界面来查看与电子邮件消息内的特定标签相关的特定文本。
[0022]图8图示了根据一些实施例的图示标签预测模型如何基于输入的电子邮件信息为可用标签生成置信度(confidence)分数集合的图。
[0023]图9图示了根据一些实施例的由标签预测模型执行以生成可用标签的置信度分数的第二操作。
[0024]图10图示了根据一些实施例的来自标签预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种包括指令的非暂态计算机可读介质,所述指令在由一个或多个处理器执行时,使得所述一个或多个处理器执行包括以下的操作:从第一电子邮件客户端接收电子邮件信息,其中该电子邮件信息与从第一电子邮件客户端发送到第二电子邮件客户端的电子邮件消息相关联;将电子邮件信息提供给模型,其中该模型生成可用标签集合的分数;至少部分地基于所述分数将预测标签集合识别为可用标签集合的子集;以及将预测标签集合发送到第一电子邮件客户端,其中预测标签集合中的所选择的标签集合在电子邮件消息被发送到第二电子邮件客户端时与该电子邮件消息一起被发送。2.如权利要求1所述的非暂态计算机可读介质,其中所选择的标签集合在电子邮件消息被发送到第二电子邮件客户端时嵌入在电子邮件消息的标头中。3.如权利要求1所述的非暂态计算机可读介质,还包括:从第一电子邮件客户端接收请求,该请求包括从用户接收到的新标签的前缀;在可用标签集合中识别以所述前缀开头的自动完成标签集合;以及将所述自动完成标签集合发送到第一电子邮件客户端。4.如权利要求1所述的非暂态计算机可读介质,其中所述预测标签集合中的未选择的标签集合在电子邮件消息被发送到第二电子邮件客户端时也与该电子邮件消息一起被发送。5.如权利要求1所述的非暂态计算机可读介质,其中所述预测标签集合中的用户标签集合在电子邮件消息被发送到第二电子邮件客户端时也与该电子邮件消息一起被发送,其中所述用户标签集合与所述预测标签集合不同。6.如权利要求1所述的非暂态计算机可读介质,其中第一电子邮件客户端被配置为生成用户界面,该用户界面包括包含所述预测标签集合的电子邮件标头的显示。7.如权利要求1所述的非暂态计算机可读介质,其中所述操作还包括基于电子邮件信息生成散列键,其中散列键唯一地识别电子邮件消息。8.如权利要求7所述的非暂态计算机可读介质,其中所述操作还包括将散列键存储在散列键的散列映射中,其中散列映射中的每个散列键引用表示所述可用标签集合的不属于所述预测标签集合的子集的数据结构。9.如权利要求8所述的非暂态计算机可读介质,其中所述数据结构包括前缀的加权特里结构。10.如权利要求8所述的非暂态计算机可读介质,其中所述操作还包括:从第一电子邮件客户端接收前缀和电子邮件信息;使用电子邮件信息重新生成散列键;使用散列键来引用电子邮件消息的数据结构;以及从数据结构中检索所述可用标签集合中的完成所述前缀的一个或多个标签。11.如权利要求1所述的非暂态计算机可读介质,其中所述操作还包括从传输电子邮件消息的电子邮件服务器接收所选择的标签集合。12.如权利要求11所述的非暂态计算机可读介质,其中所述操作还包括从电子邮件服务器接收...

【专利技术属性】
技术研发人员:N
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1