本发明专利技术涉及利用元数据优化归档电子邮件的效率,具体提供了归档电子邮件的方法、计算机程序产品和系统,其中该电子邮件系统包含至少一个用户邮箱,并被配置成接收电子邮件和将电子邮件存储在用户邮箱内以及从所述用户邮箱发送电子邮件。收集与每个用户邮箱接收和发送的电子邮件相对应的特定于用户的元数据。分析已收集特定于用户的元数据,以便为每个用户邮箱提供将什么时候归档电子邮件和归档哪些电子邮件的预测指示,并根据每个用户邮箱的预测指示为用户邮箱归档电子邮件。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及归档电子邮件消息。
技术介绍
电子消息或电子邮件服务器系统可以被配置成提供由服务器系统的用户发送和接收的电子邮件消息(电子邮件)的日志。电子邮件的日志通常包括在电子邮件传送过程中将利用服务器发送或接收的电子邮件的单独副本放置在专用邮箱或数据库日志中。日志中的电子邮件是分发给收件人的电子邮件的副本,也可能包含,像电子邮件元数据(例如,“To(送往)”、“Cc (抄送)”和“Bcc (密件抄送)”首标字段中的电子邮件地址)中的所有电子邮件收件人的列表以及分解的组那样的,单个收件人不可获得的附加信息。归档电子邮件的例子包括一但不限于一由于合规性的原因而归档来自日志的电子邮件,以及由于节省空间的原因而归档来自单个用户邮箱的电子邮件。消息的归档通常按如下操作顺序进行:-识别由于节省空间的目的而应该归档电子邮件的一个或多个邮箱;-搜索和识别有资格归档(称为爬过)的消息;-提取特定用户邮箱中有资格归档的消息;以及-将提取的消息存储在档案中。为了合规性而归档通常在电子邮件服务器中为邮箱发送或接收到电子邮件之后马上或不久在日志内进行。通常在可以归档日志中的所有消息的短间隔上爬过日志。为了节省用户邮箱中的空间而归档通常根据经过的时段来进行,也可以包括其他限制(例如,只归档具有某种存储大小的消息)。归档用户邮箱的典型例子可以是归档邮箱中4个星期之前接收到的所有消息,如果这样的消息仍然存在于邮箱之中的话(即,邮箱用户还未删除这样的消息)。爬过的操作过程可以给服务器造成较大负担,增加了归档电子邮件的费用。因此,重要的是要避免爬过还没有足够的有资格归档的合格消息的邮箱。典型的电子邮件归档系统使用说明性手段(例如,根据用户邮箱中的内容量或时间)来确定应该在什么时候在邮箱中搜索需要归档的电子邮件。例如,确定哪些电子邮件要归档的爬过操作可能要求每所选时段(例如,每所选分钟数,每所选天数等)搜索特定服务器的所有邮箱,以便在所选时间跨度内归档特定用户邮箱的每个有资格的邮件。当将说明性手段用于电子邮件归档时,系统管理员通常编制用于通过在邮箱中搜索有资格处理的邮件来周期性检验是否有必要处理的时间表。另外,通常对所有邮箱一视同仁,以及处理邮箱的顺序可以是随机的。这可能导致某些用户邮箱在超过与这样的邮箱相关联的邮箱配额之前未处理归档电子邮件。另外,这可以导致存储空间的预留不足,因为一些用户邮箱可能比其他用户邮箱更迅速地充满电子邮件内容。更进一步,系统管理员试图根据不同邮箱如何使用为不同邮箱配制单独归档时间表既太困难又太费时。
技术实现思路
本专利技术提供了如要求保护的在电子邮件系统中归档电子邮件的计算机实现的方法、归档电子邮件的计算机程序产品以及归档电子邮件的系统。于是,本专利技术的实施例包括归档电子邮件的方法、计算机程序产品以及系统。该电子邮件系统包括至少一个用户邮箱,并被配置成接收电子邮件和将电子邮件存储在用户邮箱内以及从所述用户邮箱发送电子邮件。收集与每个用户邮箱接收和发送的电子邮件相对应的特定于用户的元数据。分析已收集特定于用户的元数据,以为每个用户邮箱提供将什么时候归档电子邮件和归档哪些电子邮件的预测指示,并根据每个用户邮箱的预测指示为用户邮箱归档电子邮件。一旦研究了如下详细描述,尤其当结合各种图形中的相同标号用于表示相同部件的附图时,本专利技术实施例的上述和进一步特征和优点将变得显而易见。附图说明图1是例示包括依照本专利技术归档电子邮件的部件的电子邮件系统的示范性实施例的框图;以及图2提供了描述按照本专利技术的实施例和利用图1的电子邮件系统归档电子邮件的示范性方法的流程图。具体实施例方式依照本专利技术的示范性实施例的方法、系统以及计算机程序产品通过利用电子邮件系统中的单个用户邮箱的已收集元数据和使用模式确定什么时候爬过和归档邮箱,以及可选地,在系统内也提供什么时候爬过和处理用户邮箱加以归档的排名功能,来优化归档电子邮件消息(电子邮件)的效率。已收集元数据是从电子邮件系统处理的电子邮件中获得的。如本文所使用,与电子邮件消息有关的“已处理”指的是与每个用户邮箱有关的电子邮件服务器的进来和出去的电子邮件以及在电子邮件服务器内部的一个或多个用户邮箱之间传送的电子邮件。进一步如本文所使用,与元数据有关的“已收集”指的是以任何适当方式从每个已处理电子邮件中提取、复制、计算或获取的元数据。在将日志系统用于复制已处理电子邮件(例如,为了合规性的目的)的示范性实施例中,可以从与电子邮件系统中的每个用户邮件相关联的每个已处理电子邮件消息的日志副本中收集元数据。但是,值得注意的是,元数据可以由电子邮件服务器利用任何其他适当过程从已处理电子邮件中收集。在日志数据库中,几乎在将这样的电子邮件存储在日志数据库中之后立刻或不久就归档每个电子邮件。日志数据库中与每个邮箱相关联的电子邮件的已收集元数据可以用于为每个邮箱生成统计信息(例如,统计模型),其中该统计信息被用于预测与每个邮箱有关的某些特征,包括一但不限于一预测可以在特定邮箱中的消息的最大数量,预测特定邮箱内有资格归档的合格的电子邮件内容,以及什么时候爬过并归档特定邮箱内的电子邮件。尤其,使用来自日志数据库的已收集元数据为每个用户邮箱生成的统计信息可以用于预测像与指定限制(例如,用户邮件的大小限制)匹配的、将在用户邮箱中获得的消息的最大数量那样的特征。在电子邮件中存在可以在用在生成统计模型中的过程中收集以确定什么时候为电子邮件归档处理用户邮箱的各种类型元数据。电子邮件中可以收集的多种类型元数据的例子包括一但不限于一寄件人信息、收件人信息(例如,电子邮件的“To”字段以及“Ce”和“Bcc”字段中的收件人)、主题信息(例如,来自电子邮件的主题字段的信息)、有关电子邮件的存储大小的信息、有关存储大小的信息、电子邮件的附件的数量和/或类型、发送、交付和/或观看消息的时间和日期等。可以从电子邮件元数据中获得一种或多种任何适当组合或类型的信息来生成预测特定用户邮箱中的内容的统计模型,以便为用户邮箱内的电子邮件的爬过和归档确定适当时段。用户邮箱的爬过指的是搜索特定用户邮箱以识别邮箱中的明_电子邮件有资格归档。从归档在日志数据库中的电子邮件中收集以便为每个用户邮箱生成统计信息的元数据的类型将取决于特定电子邮件系统中归档电子邮件的资格标准。用于归档电子邮件并包括日志系统的示范性电子邮件系统示意性地描绘在图1的框图中。具体地,电子邮件系统2包括电子邮件服务器4,该电子邮件服务器4包括用户邮箱。电子邮件服务器4可操作地与任何其他服务器和/或联网系统耦合,以便于向和从与电子邮件服务器相关联的用户邮箱发送和接收电子邮件。另外,电子邮件服务器4有助于在电子邮件服务器内的用户邮箱之间传送电子邮件消息。电子邮件服务器4还可操作地与用户邮箱归档系统6耦合。用户邮箱归档系统6可操作地与电子邮件档案存储系统8耦合,该电子邮件档案存储系统8为用户邮箱存储已归档电子邮件。用户邮箱归档系统6进一步包括处理器,该处理器利用以下述的方式获得的统计信息以确定什么时候爬过并归档用户邮箱中的电子邮件。电子邮件服务器4进一步可操作地与日志数据库10耦合。如上所述,将来自用户邮箱的所有已处理电子邮件同与这样的电子邮件相关联的元数据一起复制到日志数据库10中。日志数据库本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:D·皮藤讷,D·塞德尔,M·贝斯勒,M·洛尔西,K·普法依尔,J·马莱茨,
申请(专利权)人:国际商业机器公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。