System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于通信,涉及信息安全技术,具体是一种自动识别手机号的方法及系统。
技术介绍
1、在通信技术迅猛发展的当下,手机号码已成为人们日常沟通不可或缺的工具。其中手机号码自动识别技术作为一项关键技术,已广泛应用于多个领域,尤其在现代化客服聊天系统中扮演着至关重要的角色。例如,当客服人员处理用户咨询时,经常需要获取用户的联系方式以便后续跟进。自动识别手机号码技术能够快速从聊天记录中提取有效手机号,减少人工输入和校验的时间,显著提升客服工作效率。此外,自动识别手机号码还能使客服系统自动为用户生成服务工单,或通过短信、电话等方式主动联系用户,提供更加便捷和个性化的服务体验。
2、然而,现有的自动识别方法通常基于正则表达式库进行匹配,但这些库往往只考虑了部分国家和地区的手机号格式,未能全面覆盖全球信息,导致识别结果不够广泛。同时,在处理用户聊天记录时,客服系统必须确保数据的安全性和隐私保护。但现有方法常常忽视了对聊天记录内容的加密处理,存在信息泄露的风险。一旦用户数据被非法获取或滥用,将给用户和企业带来严重的损失。因此,开发一种既高效又安全的手机号码自动识别方法显得尤为重要。
技术实现思路
1、本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了一种自动识别手机号的方法及系统,用于解决现有客服聊天系统中自动识别方法准确性不够、数据安全和隐私保护不足的技术问题。
2、为实现上述目的,本专利技术的第一方面提供了一种自动识别手机号的方法及系统,包括
3、s1,根据不同国家或地区的标准手机号格式建立全球标准手机号码正则表达式库;其中,所述全球标准手机号码正则表达式库分为国内号码正则表达式库和国外号码正则表达式库;
4、s2,获取若干聊天记录文本并进行加密,将加密后的若干聊天记录文本传输至解密端进行解密,根据解密后的若干聊天记录文本得到若干手机号码相关字符序列;
5、s3,对若干手机号码相关字符序列中非数字的字符进行字符过滤,得到若干手机号码列表;
6、s4,利用所述全球标准手机号码正则表达式库对若干手机号码列表进行匹配,得到若干手机号码;
7、s5,判断若干手机号码是否在号码数据库;是,则从号码数据库中得到若干手机号码的归属地和运营商信息;否,则通过安全的api接口向运营商发起查询请求,得到若干手机号码的归属地和运营商信息,并更新至号码数据库;其中,所述号码数据库部署在本地端或者云端;
8、需要说明的是,若干聊天记录文本是由聊天系统导出,并转化成txt文本格式得到的,并且聊天记录的导出与处理利用,是通过用户许可的。
9、通过建立全球标准手机号码正则表达式库,提高了手机号码识别的广泛性和准确性;在处理聊天记录文本时,首先对其进行了加密保护,确保用户数据在传输和解密过程中的安全性,有效维护用户隐私;利用字符串搜索算法和字符过滤技术,从解密后的聊天记录中快速提取出手机号码;通过匹配全球标准手机号码正则表达式库,能够迅速识别出手机号码,并在必要时通过安全的api接口向运营商发起查询请求,以获取并更新手机号码的归属地和运营商信息。
10、进一步地,所述获取若干聊天记录文本并进行加密,包括:
11、a1,根据预设周期设置数字编码序列,并记录所述数字编码序列中的每一个数字标识符的位置,得到若干数字标识符和一一对应的若干编码位置;其中,所述数字编码序列包含若干唯一数字标识符,且相邻数字标识符间互不连续;
12、a2,获取并遍历若干聊天记录文本,将当前聊天记录文本中的字符按照预设字符长度分割成若干文本片段,并记录所述若干文本片段在当前聊天记录文本中的位置,得到一一对应的若干文本片段和若干片段位置;
13、a3,将若干编码位置与若干片段位置进行一一对应,将编码位置对应的数字标识符赋给片段位置对应的文本片段,得到带有数字标识符的若干文本片段;
14、a4,将带有数字标识符的若干文本片段进行随机打乱,得到乱序的若干文本片段,完成当前聊天记录文本的加密;
15、a5,将下一聊天记录文本标记为当前聊天记录文本,重复a2至a5,直到遍历完若干聊天记录文本,得到加密后的若干聊天记录文本。
16、进一步地,所述将加密后的若干聊天记录文本传输至解密端进行解密,包括:
17、b1,遍历加密后的若干聊天记录文本,提取当前聊天记录文本中的若干文本片段和对应的若干数字标识符;
18、b2,将若干数字标识符根据所述数字编码序列中的顺序进行排序,将若干文本片段按照若干数字标识符的顺序进行重新组合,得到解密后的当前聊天记录文本;
19、b3,将下一聊天记录文本标记为当前聊天记录文本,重复b1至b3,直到遍历完加密后的若干聊天记录文本,得到解密后的若干聊天记录文本。
20、通过预设周期定期设置唯一且不连续的数字编码序列,对聊天记录文本中的字符进行分割并编码,并通过打乱分割片段的顺序,确保了加密数据的高安全性,增加了破解难度,在预设周期到达之后再次进行上述步骤,进一步提高数据的安全性。
21、进一步地,所述根据解密后的若干聊天记录文本得到若干手机号码相关字符序列,包括:
22、s2-1,将联系提示词及各自对应的英文词汇标记为手机号码相关词汇;其中所述联系提示词包括“手机号”“电话号”“号码”“联系方式”;
23、s2-2,从解密后的若干聊天记录文本中得到当前聊天文本数据,利用字符串搜索算法判断当前聊天文本数据中是否存在所述手机号码相关词汇;是,则获取所述手机号码相关词汇在当前聊天记录文本中的起始索引和结束索引,并跳转至s2-3;否,则删除当前聊天记录文本,并将下一个聊天记录文本标记为当前聊天记录文本,重复s2-2;
24、s2-3,获取所述起始索引前若干个字符和所述结束索引后若干个字符,得到当前聊天记录文本的手机号码相关字符序列,并将当前聊天记录文本的非手机号码相关字符序列剔除;
25、s2-4,将下一个聊天记录文本标记为当前聊天记录文本,并重复s2-2至s2-3,直到遍历完若干聊天记录文本,得到若干手机号码相关字符序列。
26、进一步地,所述对若干手机号码相关字符序列中非数字的字符进行字符过滤,包括:
27、s3-1,遍历若干手机号码相关字符序列中的若干字符,获取当前手机号码相关字符序列中的若干连续数字片段;
28、s3-2,判断所述若干连续数字片段的字符长度是否处于手机号码长度阈值范围内;是,则保留若干连续数字片段,得到当前手机号码的号码列表;否,则所述若干连续数字片段进行忽略处理;其中,忽略处理为将连续数字片段从当前手机号码相关字符序列中剔除;
29、s3-3,将下一手机号码相关字符序列标记为当前手机号码相关字符序列,重复s3-1至s3-3,直到遍历完若干手机号码相关字符序列,得到若干手机号码列表。
30、进本文档来自技高网...
【技术保护点】
1.一种自动识别手机号的方法,其特征在于,包括:
2.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述获取若干聊天记录文本并进行加密,包括:
3.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述将加密后的若干聊天记录文本传输至解密端进行解密,包括:
4.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述根据解密后的若干聊天记录文本得到若干手机号码相关字符序列,包括:
5.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述对若干手机号码相关字符序列中非数字的字符进行字符过滤,包括:
6.根据权利要求5所述的一种自动识别手机号的方法,其特征在于,所述获取当前手机号码相关字符序列中的若干连续数字片段,包括:
7.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,利用所述全球标准手机号码正则表达式库对若干手机号码列表进行匹配,包括:
8.根据权利要求7所述的一种自动识别手机号的方法,其特征在于,所述利用决策树分类模型和所述全球标准手机号码正则表达
9.一种自动识别手机号的系统,其特征在于,包括:
...【技术特征摘要】
1.一种自动识别手机号的方法,其特征在于,包括:
2.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述获取若干聊天记录文本并进行加密,包括:
3.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述将加密后的若干聊天记录文本传输至解密端进行解密,包括:
4.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述根据解密后的若干聊天记录文本得到若干手机号码相关字符序列,包括:
5.根据权利要求1所述的一种自动识别手机号的方法,其特征在于,所述对若干手机号码相关字符...
【专利技术属性】
技术研发人员:刘传勇,桂勇,王友振,
申请(专利权)人:八度云计算安徽有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。