跨平台税务智能客服语料迁移方法及装置制造方法及图纸

技术编号:27491850 阅读:19 留言:0更新日期:2021-03-02 18:10
本发明专利技术公开了跨平台税务智能客服语料迁移方法及装置。该方法包括:利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;从原有平台的源语料库中,分别提取与各标准问题对应的答案;照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。该方法可以快速、准确地将智能客服原有平台的语料库迁移到智能客服的目标平台中,完成语料跨平台迁移,满足了智能客服系统对语料的精确搜索,逐步提升了纳税人对客户服务的满意度。户服务的满意度。户服务的满意度。

【技术实现步骤摘要】
跨平台税务智能客服语料迁移方法及装置


[0001]本专利技术属于税务服务
,具体涉及跨平台税务智能客服语料迁移方法及装置。

技术介绍

[0002]目前,税务领域中智能客服系统所依托的平台多种多样,其各自使用的语料模型并不相同。在因现有平台使用期限到期而面临将智能客服切换到其他平台的场景中,需要将现有平台的语料库迁移到目标平台的语料库中。
[0003]通常,已有语料库的语料模型与目标平台语料库要求的语料模型并不匹配。语料库动辄10万+的语料,如果由语料录入员人工逐条录入,工作量庞大,作业效率低,不能满足开发要求。
[0004]另外,目前客服语料跨平台迁移后,目标平台重建语料结果质量不佳。

技术实现思路

[0005]针对现有技术的不足,本专利技术提供的跨平台税务智能客服语料迁移方法和装置,以解决现有技术中因为语料模型不匹配导致跨平台建立语料库失败的问题。
[0006]第一方面,本专利技术提供一种跨平台税务智能客服语料迁移方法,包括:
[0007]利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;
[0008]从原有平台的源语料库中,分别提取与各标准问题对应的答案;
[0009]按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;
[0010]将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。
[0011]第二方面,本专利技术提供一种跨平台税务智能客服语料迁移装置,包括:
[0012]源语料库去重模块,用于:利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;
[0013]答案提取模块,用于:从原有平台的源语料库中,分别提取与各标准问题对应的答案;
[0014]目标语料库组织模块,用于:按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;
[0015]目标语料库迁移模块,用于:将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。
[0016]相较于目前智能客服无法跨平台共用知识库/语料库的现象,本专利技术提供的跨平台税务智能客服语料迁移的方法,可以快速、准确地将智能客服原有平台的语料库迁移到智能客服的目标平台中,完成语料跨平台迁移,解决了因为语料模型不匹配导致语料库建
立失败的问题,降低了在因平台使用期限到期而导致的建立语料模型的成本,满足了智能客服系统对语料的精确搜索,逐步提升了纳税人对客户服务的满意度。
附图说明
[0017]通过参考下面的附图,可以更为完整地理解本专利技术的示例性实施方式:
[0018]图1为本专利技术优选实施方式的跨平台税务智能客服语料迁移方法的流程示意图;
[0019]图2是本专利技术优选实施方式的跨平台税务智能客服语料迁移装置的组成示意图;
[0020]图3为本专利技术优选实施方式中智能客服的问答示例;
[0021]图4为本专利技术优选实施方式中X省的excel语料文件内容展示图;
[0022]图5为本专利技术优选实施方式中按照语料模型对应的样式模板组织以标准问题为索引的语料的word文档形式的示意图。
具体实施方式
[0023]现在参考附图介绍本专利技术的示例性实施方式,然而,本专利技术可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的范围。对于表示在附图中的示例性实施方式中的术语并不是对本专利技术的限定。在附图中,相同的单元/元件使用相同的附图标记。
[0024]除非另有说明,此处使用的术语(包括科技术语)对所属
的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
[0025]具体地,税务领域包括金税、金融、金盾等行业领域,其中,开票是用户量较大的业务类型之一。
[0026]随着人工智能技术的飞速发展,纳税服务步入“互联网+税务”的智能化时代。智能客服系统24小时在线为纳税人提供便捷智能、无处不在的客户服务,例如某以微信公众号为平台的智能客服系统。在纳税服务平台提供的咨询入口,纳税人通过语音或文字输入其咨询的问题,并触发纳税服务平台的智能客服提供针对该问题的答案。
[0027]应该理解为,具体实施时,迁移就是将从第一个智能客服的平台的语料库迁移到第二个智能客服的平台中,使得第二个智能客服的平台可以使用第一个智能客服的平台在开发、使用和维护过程中积累的语料库中的有用信息。
[0028]如图1所示,本专利技术实施例的跨平台税务智能客服语料迁移方法,包括:
[0029]利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;
[0030]从原有平台的源语料库中,分别提取与各标准问题对应的答案;
[0031]按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;
[0032]将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。
[0033]进一步地,预先构建的目标平台的语料模型中,以标准问题为索引,
[0034]标准问题对应的格式数据包括:标准问题、类别标记、关联问题、相似问题及答案;
[0035]其中,标准问题是对应有标准答案的问题,在目标语料库内,各标准问题相互不重复;
[0036]关联问题是从业务流程上,与标准问题对应的向上延伸问题或向下延伸问题,该关联问题对应有标准答案;
[0037]相似问题是与标准问题的问法不同,但语义相似、且可以用同一个答案来回答的问题;
[0038]答案是分别对应于标准问题、关联问题及相似问题的标准答案。
[0039]进一步地,按照语料模型对应的样式模板组织各标准问题对应的格式数据,包括;
[0040]在样式模板中,将标准问题作为当前的问题,占一个内容格;
[0041]向标准问题附加其对应的类别标记,类别标记占一个内容格;
[0042]向标准问题附加其对应的各相似问题,每一个相似问题占一个内容格;
[0043]向标准问题附加其对应的关联问题,每一个关联问题占一个内容格;
[0044]向标准问题附加其对应的标准答案,标准答案占一个内容格。
[0045]应该理解为,这里的内容格可以为数据库中的一个记录项,可以为excel文档中的一个记录格,也可以为word文档中的一个文本区域和/或图片区域。
[0046]进一步地,利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题,包括:
[0047]从待迁移的原有平台的源语料库本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种跨平台税务智能客服语料迁移方法,其特征在于,包括:利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;从原有平台的源语料库中,分别提取与各标准问题对应的答案;按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。2.根据权利要求1所述的方法,其特征在于,所述预先构建的目标平台的语料模型中,以标准问题为索引,所述标准问题对应的格式数据包括:标准问题、类别标记、关联问题、相似问题及答案;其中,标准问题是对应有标准答案的问题,在目标语料库内,各标准问题相互不重复;关联问题是从业务流程上,与标准问题对应的向上延伸问题或向下延伸问题,该关联问题对应有标准答案;相似问题是与标准问题的问法不同,但语义相似、且可以用同一个答案来回答的问题;答案是分别对应于标准问题、关联问题及相似问题的标准答案。3.根据权利要求2所述的方法,其特征在于,所述按照语料模型对应的样式模板组织各标准问题对应的格式数据,包括;在所述样式模板中,将标准问题作为当前的问题,占一个内容格;向标准问题附加其对应的类别标记,所述类别标记占一个内容格;向标准问题附加其对应的各相似问题,每一个相似问题占一个内容格;向标准问题附加其对应的关联问题,每一个关联问题占一个内容格;向标准问题附加其对应的标准答案,所述标准答案占一个内容格。4.根据权利要求3所述的方法,其特征在于,所述利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题,包括:从待迁移的原有平台的源语料库中,根据预先设定的类别标记及标准问题,筛选出与任一标准问题语义相同的多个问题,并保留其中一个问题作为标准问题保留,将其他问题删除。5.根据权利要求4所述的方法,其特征在于,所述利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到相似问题,包括:从待迁移的原有平台的源语料库中,根据预先设定的类别标记及标准问题,筛选出与任一标准问题语义相似的多个问题,保留其中一个问题作为标准问题,将其他问题标记为该标准问题的相似问题。6.根据权利要求5所述的方法,其特征在于,所述按照语料模型对应的样式模板组织各标准问题对应的格式...

【专利技术属性】
技术研发人员:王芳刘振宇张天飒林文辉王志刚杨硕马谊骏
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1