System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种机器人报修场景的手机号抽取方法技术_技高网

一种机器人报修场景的手机号抽取方法技术

技术编号:43253566 阅读:17 留言:0更新日期:2024-11-08 20:36
本发明专利技术属于语言处理与识别技术领域,具体涉及一种机器人报修场景的手机号抽取方法,包括以下步骤:S1、接收ASR识别出的文本,接收自动语音识别(ASR)技术识别出的客户说话文本;S2、话术转换,将文本内容中的数字话术转换为对应的数字;S3、抽取并挖空,在一轮会话中抽取可能完整的手机号,并将抽取后的原始多轮文本组合后进行挖空;S4、全量数字提取,对剩余文本进行全量数字提取;S5、正则收取,使用正则表达式从数字文本中提取多个手机号并进行格式正确性校验。本发明专利技术能够通过话术的转换与抽取方法,去除用于语音中的无关信息,并自动转换非标准数字表达话术至标准数字序列,准确的识别和提取手机号码。

【技术实现步骤摘要】

本专利技术属于语言处理与识别,具体涉及一种机器人报修场景的手机号抽取方法


技术介绍

1、随着科技的快速发展,机器人技术已广泛应用于各个行业领域,特别是在客户服务领域,机器人已成为企业提升服务效率、降低人力成本的重要工具,在机器人报修场景中,用户通常需要提供个人手机号以便于后续的联系和服务跟进,然而,现有的机器人手机号抽取方法往往面临着诸多挑战。

2、目前,大多数机器人通过语音识别和自然语言处理技术来识别和解析用户的语音输入,然而,由于用户发音不清、口音差异、多轮次说出手机号、中间夹杂着其他口语等因素,导致机器人难以准确抽取手机号,此外,现有的手机号抽取方法往往对格式要求较高,对于不同格式的手机号处理能力有限,这进一步增加了抽取的难度。

3、在机器人报修场景中,手机号抽取面临的主要技术问题包括多轮次说出手机号、中间夹杂着其他口语和语义以及资源消耗与实时性的问题。


技术实现思路

1、本专利技术的目的是提供一种机器人报修场景的手机号抽取方法,能够通过话术的转换与抽取方法,去除用于语音中的无关信息,并自动转换非标准数字表达话术至标准数字序列,准确的识别和提取手机号码。

2、本专利技术采取的技术方案具体如下:

3、一种机器人报修场景的手机号抽取方法,包括以下步骤:

4、s1、接收asr识别出的文本,接收自动语音识别(asr)技术识别出的客户说话文本;

5、s2、话术转换,将文本内容中的数字话术转换为对应的数字;

6、s3、抽取并挖空,在一轮会话中抽取可能完整的手机号,并将抽取后的原始多轮文本组合后进行挖空;

7、s4、全量数字提取,对剩余文本进行全量数字提取;

8、s5、正则收取,使用正则表达式从数字文本中提取多个手机号并进行格式正确性校验。

9、在一种优选方案中,所述话术转换的步骤中,通过查找预设话术模式,将匹配到的话术模式替换为对应的数字序列,完成非标准数字表打到标准数字序列的转换。

10、在一种优选方案中,所述话术转换的步骤中,在转换非标准数字表达为标准数字序列后,进一步滤除无关字符和词汇,以便于后续手机号抽取步骤更加准确。

11、在一种优选方案中,所述话术转换、抽取并挖空以及全量数字提取的步骤中,采用基于规则的方法或利用训练好的语言模型来处理用户的口语化数字表达,以确保转换的准确性和效率。

12、在一种优选方案中,所述抽取并挖空的步骤中,分析一轮会话中的文本,以确定是否存在满足手机号标准格式的数字序列,执行挖空处理包括从组合的多轮文本中移除已抽取的手机号,以清除该信息从而避免后续处理的干扰。

13、在一种优选方案中,所述抽取并挖空的步骤中,在完成挖空处理后对剩余文本进行再次分析以识别未被抽取的任何潜在手机号信息。

14、在一种优选方案中,所述全量数字提取的步骤中,识别并记录文本中所有连续的数字序列,不论其是否符合手机号的格式,使用正则表达式或其他文本分析技术来识别文本中的数字序列,分析和确定提取的数字信息中哪些是有效的手机号。

15、在一种优选方案中,所述全量数字提取的步骤中,在筛选出有效的手机号后,将抽取的数字信息进行清洗和格式化,以便于后续处理。

16、本专利技术取得的技术效果为:

17、本专利技术从接收asr识别出的文本开始,经过话术转换、抽取并挖空、全量数字提取以及正则收取等步骤,能够准确地从客户的语音数据中提取出手机号信息,这个过程不仅提高了手机号抽取的准确性,还提升了处理效率,为后续的业务处理提供了准确的数据支持;

18、本专利技术的方法能够有效地处理客户的口语化表达,对于非标准的数字表述、口音差异以及背景噪音等因素都有很好的适应性,这意味着客户在报修时无需担心自己的表述是否清晰或是否符合标准,机器人能够准确理解并抽取所需的手机号信息,有效提升了用户体验,同时也提高了服务的质量。

本文档来自技高网
...

【技术保护点】

1.一种机器人报修场景的手机号抽取方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换的步骤中,通过查找预设话术模式,将匹配到的话术模式替换为对应的数字序列,完成非标准数字表打到标准数字序列的转换。

3.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换的步骤中,在转换非标准数字表达为标准数字序列后,进一步滤除无关字符和词汇,以便于后续手机号抽取步骤更加准确。

4.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换、抽取并挖空以及全量数字提取的步骤中,采用基于规则的方法或利用训练好的语言模型来处理用户的口语化数字表达,以确保转换的准确性和效率。

5.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述抽取并挖空的步骤中,分析一轮会话中的文本,以确定是否存在满足手机号标准格式的数字序列,执行挖空处理包括从组合的多轮文本中移除已抽取的手机号,以清除该信息从而避免后续处理的干扰。

6.根据权利要求5所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述抽取并挖空的步骤中,在完成挖空处理后对剩余文本进行再次分析以识别未被抽取的任何潜在手机号信息。

7.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述全量数字提取的步骤中,识别并记录文本中所有连续的数字序列,不论其是否符合手机号的格式,使用正则表达式或其他文本分析技术来识别文本中的数字序列,分析和确定提取的数字信息中哪些是有效的手机号。

8.根据权利要求7所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述全量数字提取的步骤中,在筛选出有效的手机号后,将抽取的数字信息进行清洗和格式化,以便于后续处理。

...

【技术特征摘要】

1.一种机器人报修场景的手机号抽取方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换的步骤中,通过查找预设话术模式,将匹配到的话术模式替换为对应的数字序列,完成非标准数字表打到标准数字序列的转换。

3.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换的步骤中,在转换非标准数字表达为标准数字序列后,进一步滤除无关字符和词汇,以便于后续手机号抽取步骤更加准确。

4.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述话术转换、抽取并挖空以及全量数字提取的步骤中,采用基于规则的方法或利用训练好的语言模型来处理用户的口语化数字表达,以确保转换的准确性和效率。

5.根据权利要求1所述的一种机器人报修场景的手机号抽取方法,其特征在于:所述抽取并挖空的...

【专利技术属性】
技术研发人员:李志鹏乔素林吴钟健唐雪苑东波
申请(专利权)人:华云天下南京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1