The invention provides a filing method, device, electronic equipment and medium based on mail binary classification model. The archiving method based on the mail diclassification model can obtain all mail and input all mail into the pre-trained mail diclassification model to obtain the classification results, in which the classification results include business mail and non-business mail, further obtain at least one business mail from the classification results, and extract each of the at least one business mail. The mailbox addresses of business mail can be determined from the mailbox addresses of each business mail, and the corresponding mailbox addresses can be obtained. The corresponding mailbox addresses can be archived according to the corresponding mailbox addresses, thus realizing the automatic archiving based on the mail two-classification model, which not only reduces the labor cost of enterprises, but also effectively prevents the loss of archival data due to human negligence.
【技术实现步骤摘要】
基于邮件二分类模型的建档方法、装置、电子设备及介质
本专利技术涉及数据处理
,尤其涉及一种基于邮件二分类模型的建档方法、装置、电子设备及介质。
技术介绍
目前,邮箱是贸易交流中重要的应用程序,为了更好地管理档案数据,企业通常需要将邮箱中的客户信息添加到档案中,企业要求员工对所述档案进行手动创建并填充,然而,这将导致企业人力成本逐渐升高,企业员工对信息创建及填充的积极性也普遍下降,因此,如何基于邮件实现自动建档成了一个亟待解决的问题。
技术实现思路
鉴于以上内容,有必要提供一种基于邮件二分类模型的建档方法、装置、电子设备及介质,能够实现基于邮件二分类模型的自动建档,不仅减少了企业的人力成本,还能有效防止由于人为疏忽导致档案数据的缺失。一种基于邮件二分类模型的建档方法,所述方法包括:获取所有邮件;将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件;从所述分类结果中获取至少一个业务邮件;提取所述至少一个业务邮件中每个业务邮件的邮箱地址;从每个业务邮件的邮箱地址中确定目标邮箱地址;获取所述目标邮箱地址对应的邮件;根据所述对应的邮件建档。根据本专利技术优选实施例,在将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果前,所述方法还包括:获取所述所有邮件的邮件信息;对所述所有邮件的邮件信息进行分词处理;对分词处理后的邮件信息进行one-hot编码,得到第一特征向量;采用Word2vec算法对所述第一特征向量进行处理,得到第二特征向量;结合卷积运算、池化运算、全连接层运算以及正则化运算对所述第二特征向量进行 ...
【技术保护点】
1.一种基于邮件二分类模型的建档方法,其特征在于,所述方法包括: 获取所有邮件; 将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件; 从所述分类结果中获取至少一个业务邮件; 提取所述至少一个业务邮件中每个业务邮件的邮箱地址; 从每个业务邮件的邮箱地址中确定目标邮箱地址; 获取所述目标邮箱地址对应的邮件; 根据所述对应的邮件建档。
【技术特征摘要】
1.一种基于邮件二分类模型的建档方法,其特征在于,所述方法包括:获取所有邮件;将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果,其中,所述分类结果包括业务邮件及非业务邮件;从所述分类结果中获取至少一个业务邮件;提取所述至少一个业务邮件中每个业务邮件的邮箱地址;从每个业务邮件的邮箱地址中确定目标邮箱地址;获取所述目标邮箱地址对应的邮件;根据所述对应的邮件建档。2.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,在将所述所有邮件输入到预先训练的邮件二分类模型中,得到分类结果前,所述方法还包括:获取所述所有邮件的邮件信息;对所述所有邮件的邮件信息进行分词处理;对分词处理后的邮件信息进行one-hot编码,得到第一特征向量;采用Word2vec算法对所述第一特征向量进行处理,得到第二特征向量;结合卷积运算、池化运算、全连接层运算以及正则化运算对所述第二特征向量进行处理,得到第三特征向量;采用Bi-LSTM技术对所述第三特征向量进行序列建模,得到目标向量;采用全连接层运算对所述目标向量进行处理,得到所述邮件二分类模型。3.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,在将所述获取到的邮件输入到二分类模型,得到分类结果后,所述方法包括:当检测到所述分类结果为第一结果时,则该邮件为非业务邮件;或者当检测到所述分类结果为第二结果时,则该邮件为业务邮件。4.如权利要求1所述的基于邮件二分类模型的建档方法,其特征在于,所述从每个业务邮件的邮箱地址中确定目标邮箱地址包括以下一种或者多种的组合:从每个业务邮件的邮箱地址中获取与配置邮箱域名不同的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取不在配置名单中的邮箱地址,作为所述目标邮箱地址;及/或从每个业务邮件的邮箱地址中获取未被建档的邮箱地址,...
【专利技术属性】
技术研发人员:伍嘉莉,车进,
申请(专利权)人:深圳市小满科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。