基于邮件二分类模型的建档方法、装置、电子设备及介质制造方法及图纸

技术编号:21200270 阅读:31 留言:0更新日期:2019-05-25 01:21
本发明专利技术提供一种基于邮件二分类模型的建档方法、装置、电子设备及介质。所述基于邮件二分类模型的建档方法能够获取所有邮件,并将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件,进一步从所述分类结果中获取至少一个业务邮件,并提取所述至少一个业务邮件中每个业务邮件的邮箱地址,从每个业务邮件的邮箱地址中确定目标邮箱地址,获取所述目标邮箱地址对应的邮件,根据所述对应的邮件建档,从而实现基于邮件二分类模型的自动建档,不仅减少了企业的人力成本,还能有效防止由于人为疏忽导致档案数据的缺失。

Archiving Method, Device, Electronic Equipment and Media Based on Mail Bi-classification Model

The invention provides a filing method, device, electronic equipment and medium based on mail binary classification model. The archiving method based on the mail diclassification model can obtain all mail and input all mail into the pre-trained mail diclassification model to obtain the classification results, in which the classification results include business mail and non-business mail, further obtain at least one business mail from the classification results, and extract each of the at least one business mail. The mailbox addresses of business mail can be determined from the mailbox addresses of each business mail, and the corresponding mailbox addresses can be obtained. The corresponding mailbox addresses can be archived according to the corresponding mailbox addresses, thus realizing the automatic archiving based on the mail two-classification model, which not only reduces the labor cost of enterprises, but also effectively prevents the loss of archival data due to human negligence.

【技术实现步骤摘要】
基于邮件二分类模型的建档方法、装置、电子设备及介质
本专利技术涉及数据处理
,尤其涉及一种基于邮件二分类模型的建档方法、装置、电子设备及介质。
技术介绍
目前,邮箱是贸易交流中重要的应用程序,为了更好地管理档案数据,企业通常需要将邮箱中的客户信息添加到档案中,企业要求员工对所述档案进行手动创建并填充,然而,这将导致企业人力成本逐渐升高,企业员工对信息创建及填充的积极性也普遍下降,因此,如何基于邮件实现自动建档成了一个亟待解决的问题。
技术实现思路
鉴于以上内容,有必要提供一种基于邮件二分类模型的建档方法、装置、电子设备及介质,能够实现基于邮件二分类模型的自动建档,不仅减少了企业的人力成本,还能有效防止由于人为疏忽导致档案数据的缺失。一种基于邮件二分类模型的建档方法,所述方法包括:获取所有邮件;将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件;从所述分类结果中获取至少一个业务邮件;提取所述至少一个业务邮件中每个业务邮件的邮箱地址;从每个业务邮件的邮箱地址中确定目标邮箱地址;获取所述目标邮箱地址对应的邮件;根据所述对应的邮件建档。根据本专利技术优选实施例,在将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果前,所述方法还包括:获取所述所有邮件的邮件信息;对所述所有邮件的邮件信息进行分词处理;对分词处理后的邮件信息进行one-hot编码,得到第一特征向量;采用Word2vec算法对所述第一特征向量进行处理,得到第二特征向量;结合卷积运算、池化运算、全连接层运算以及正则化运算对所述第二特征向量进行处理,得到第三特征向量;采用Bi-LSTM技术对所述第三特征向量进行序列建模,得到目标向量;采用全连接层运算对所述目标向量进行处理,得到所述邮件二分类模型。根据本专利技术优选实施例,在将所述获取到的邮件输入到二分类模型,得到分类结果后,所述方法包括:当检测到所述分类结果为第一结果时,则该邮件为非业务邮件;或者当检测到所述分类结果为第二结果时,则该邮件为业务邮件。根据本专利技术优选实施例,所述从每个业务邮件的邮箱地址中确定目标邮箱地址包括以下一种或者多种的组合:从每个业务邮件的邮箱地址中获取与配置邮箱域名不同的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取不在配置名单中的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取未被建档的邮箱地址,作为所述目标邮箱地址。根据本专利技术优选实施例,所述根据所述对应的邮件建档包括:从所述对应的邮件中提取目标信息;根据所述目标信息建档。根据本专利技术优选实施例,所述方法还包括:每隔预设时间,获取所述目标邮箱地址新增的邮件;根据所述目标邮箱地址新增的邮件建档。根据本专利技术优选实施例,根据所述对应的邮件建档后,所述方法还包括:获取建档后得到的档案数据;当接收到触发所述档案数据中联系方式的信号时,根据所述联系方式发起沟通请求;及/或当接收到触发所述档案数据中联系地址的信号时,根据所述联系地址发起导航;及/或当接收到触发所述档案数据中采购目标的信号时,推荐与所述采购目标对应的产品信息。一种基于邮件二分类模型的建档装置,所述装置包括:获取单元,用于获取所有邮件;输入单元,用于将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件;所述获取单元,还用于从所述分类结果中获取至少一个业务邮件;提取单元,用于提取所述至少一个业务邮件中每个业务邮件的邮箱地址;确定单元,用于从每个业务邮件的邮箱地址中确定目标邮箱地址;所述获取单元,还用于获取所述目标邮箱地址对应的邮件;建档单元,用于根据所述对应的邮件建档。根据本专利技术优选实施例,所述获取单元,还用于在将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果前,获取所述所有邮件的邮件信息;所述装置还包括:处理单元,用于对所述所有邮件的邮件信息进行分词处理;编码单元,用于对分词处理后的邮件信息进行one-hot编码,得到第一特征向量;所述处理单元,还用于采用Word2vec算法对所述第一特征向量进行处理,得到第二特征向量;所述处理单元,还用于结合卷积运算、池化运算、全连接层运算以及正则化运算对所述第二特征向量进行处理,得到第三特征向量;建模单元,用于采用Bi-LSTM技术对所述第三特征向量进行序列建模,得到目标向量;所述处理单元,还用于采用全连接层运算对所述目标向量进行处理,得到所述邮件二分类模型。根据本专利技术优选实施例,所述装置还包括:检测单元,用于在将所述获取到的邮件输入到二分类模型,得到分类结果后,当检测到所述分类结果为第一结果时,则该邮件为非业务邮件;或者所述检测单元,还用于当检测到所述分类结果为第二结果时,则该邮件为业务邮件。根据本专利技术优选实施例,所述确定单元具体用于:从每个业务邮件的邮箱地址中获取与配置邮箱域名不同的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取不在配置名单中的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取未被建档的邮箱地址,作为所述目标邮箱地址。根据本专利技术优选实施例,所述建档单元根据所述对应的邮件建档包括:从所述对应的邮件中提取目标信息;根据所述目标信息建档。根据本专利技术优选实施例,所述获取单元,还用于每隔预设时间,获取所述目标邮箱地址新增的邮件;所述建档单元,还用于根据所述目标邮箱地址新增的邮件建档。根据本专利技术优选实施例,所述获取单元,还用于根据所述对应的邮件建档后,获取建档后得到的档案数据;所述装置还包括:发起单元,用于当接收到触发所述档案数据中联系方式的信号时,根据所述联系方式发起沟通请求;及/或所述发起单元,还用于当接收到触发所述档案数据中联系地址的信号时,根据所述联系地址发起导航;及/或推荐单元,还用于当接收到触发所述档案数据中采购目标的信号时,推荐与所述采购目标对应的产品信息。一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现所述基于邮件二分类模型的建档方法。一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述基于邮件二分类模型的建档方法。由以上技术方案可以看出,本专利技术能够获取所有邮件,并将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件,进一步从所述分类结果中获取至少一个业务邮件,并提取所述至少一个业务邮件中每个业务邮件的邮箱地址,从每个业务邮件的邮箱地址中确定目标邮箱地址,获取所述目标邮箱地址对应的邮件,根据所述对应的邮件建档,从而实现基于邮件二分类模型的自动建档,不仅减少了企业的人力成本,还能有效防止由于人为疏忽导致档案数据的缺失。附图说明图1是本专利技术基于邮件二分类模型的建档方法的较佳实施例的流程图。图2是本专利技术基于邮件二分类模型的建档装置的较佳实施例的功能模块图。图3是本专利技术实现基于邮件二分类模型的建档方法的较佳实施例的电子设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。如图1所示,是本本文档来自技高网...

【技术保护点】
1.一种基于邮件二分类模型的建档方法,其特征在于,所述方法包括: 获取所有邮件; 将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件; 从所述分类结果中获取至少一个业务邮件; 提取所述至少一个业务邮件中每个业务邮件的邮箱地址; 从每个业务邮件的邮箱地址中确定目标邮箱地址; 获取所述目标邮箱地址对应的邮件; 根据所述对应的邮件建档。

【技术特征摘要】
1.一种基于邮件二分类模型的建档方法,其特征在于,所述方法包括:获取所有邮件;将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件;从所述分类结果中获取至少一个业务邮件;提取所述至少一个业务邮件中每个业务邮件的邮箱地址;从每个业务邮件的邮箱地址中确定目标邮箱地址;获取所述目标邮箱地址对应的邮件;根据所述对应的邮件建档。2.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,在将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果前,所述方法还包括:获取所述所有邮件的邮件信息;对所述所有邮件的邮件信息进行分词处理;对分词处理后的邮件信息进行one-hot编码,得到第一特征向量;采用Word2vec算法对所述第一特征向量进行处理,得到第二特征向量;结合卷积运算、池化运算、全连接层运算以及正则化运算对所述第二特征向量进行处理,得到第三特征向量;采用Bi-LSTM技术对所述第三特征向量进行序列建模,得到目标向量;采用全连接层运算对所述目标向量进行处理,得到所述邮件二分类模型。3.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,在将所述获取到的邮件输入到二分类模型,得到分类结果后,所述方法包括:当检测到所述分类结果为第一结果时,则该邮件为非业务邮件;或者当检测到所述分类结果为第二结果时,则该邮件为业务邮件。4.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,所述从每个业务邮件的邮箱地址中确定目标邮箱地址包括以下一种或者多种的组合:从每个业务邮件的邮箱地址中获取与配置邮箱域名不同的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取不在配置名单中的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取未被建档的邮箱地址,...

【专利技术属性】
技术研发人员:伍嘉莉车进
申请(专利权)人:深圳市小满科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1