System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种人工智能机器人语言深度理解方法技术_技高网

一种人工智能机器人语言深度理解方法技术

技术编号:44595149 阅读:0 留言:0更新日期:2025-03-14 12:52
本发明专利技术涉及人工智能自然语言处理技术的技术领域,公开了一种人工智能机器人语言深度理解方法,包括以下步骤:步骤一、采集处理用户信息:处理得到业务语言文本信息和闲聊语言文本信息;步骤二、文本信息格式转换:采用数据格式转换模块将业务语言文本信息和闲聊语言文本信息进行数据格式转换;步骤三、特征模型构建及训练:在基础模型内通过提取业务语言文本信息和闲聊语言文本信息中特征提取构建特征模型,采用随机森林算法训练特征模型,使得特征模型能够区分业务语言和闲聊语言,并识别用户咨询的具体业务领域。

【技术实现步骤摘要】

本专利技术涉及人工智能自然语言处理技术的,具体涉及一种人工智能机器人语言深度理解方法


技术介绍

1、现在企业办公过程中沟通对话的交互方式,大多为键盘/鼠标界面的交互传统方式,不能以对话机器人的形式,来优化企业办公过程中沟通对话的交互方式,无法将以往企业通过键盘/鼠标界面的交互方式改进成为自然语言的交互方式,从而帮助不了企业快速构建专属对话机器人,无法使各行各业企业可以通过自然语言交互方式,实现问答、任务、表格、文档、阅读理解、知识图谱类型的信息管理人机交互能力,从而大大增加了企业对内员工及对外客服重复解答问题咨询的工作量,降低企业办公过程中沟通的整体效率。

2、为了解决以上技术问题,现目前在企业环境中引入了聊天机器人,这些机器人不仅需要处理来自不同部门的查询。

3、此外,当涉及到快速识别用户咨询的具体业务领域时,现目前的聊天机器人只能基于用户的提问,匹配用户意图后,返回答案给用户,而返回答案是否是用户所需要的信息,就需要用户再次提问,因此,现有技术通常无法满足高效率和高准确度的双重需求。


技术实现思路

1、本专利技术意在提供一种人工智能机器人语言深度理解方法,旨在提升聊天机器人在区分用户输入为业务语言或闲聊以及识别用户咨询的具体业务领域的准确度。

2、为达到上述目的,本专利技术采用如下技术方案:一种人工智能机器人语言深度理解方法,包括以下步骤:

3、步骤一、采集处理用户信息:采用意图与实体理解引擎对用户输入信息进行采集识别,并处理得到业务语言文本信息和闲聊语言文本信息;

4、步骤二、文本信息格式转换:采用数据格式转换模块将业务语言文本信息和闲聊语言文本信息进行数据格式转换,并与人工智能机器人学习格式相匹配;

5、步骤三、特征模型构建及训练:结合自然语言处理模块、机器学习模块和深度学习模块,构建基本模型,在基础模型内通过提取业务语言文本信息和闲聊语言文本信息中特征提取构建特征模型,采用随机森林算法训练特征模型,使得特征模型能够区分业务语言和闲聊语言,并识别用户咨询的具体业务领域。

6、进一步,在步骤一中,所述意图与实体理解引擎包括以下步骤:采用意图匹配进行用户意图识别,识别得到对应的文本信息,通过文档预处理模块对文本信息进行中文分词,建立文本分类框架。

7、进一步,在步骤一中,所述用户输入信息之前,对企业内部不同部门进行收集语料构建语料库,并通过文档预处理模块对语料库进行中文分词和预处理,形成业务分词语料库和闲聊分词语料库。

8、本专利技术中在步骤三中,特征提取之前,中文分词之后,通过词向量处理模块对中文分级生成词向量,而词向量是特征模型训练的关键环节,确保了文本特征能够被有效提取。

9、进一步,在步骤三中,通过机器学习模块来训练和优化特征模型,机器学习模块将业务语言文本信息和闲聊语言文本信息中语言文本的数据集提取得到各个特征,依据重要性对各个特征进行排序,每次用序列后向选择法从排序后的各个特征中去除一部分特征,得到各轮筛选后的新的特征集,在所述新的特征集上训练随机森林并计算对应的准确率;根据各轮筛选造成的相对筛选前的误差增量来判断是否要继续筛选,一旦它超过指定阈值就退出迭代,并将上一轮筛选所得的特征集作为结果,反复操作,最终将测试准确率最高的特征集作为特征选择的输出结果。

10、进一步,在机器学习模块在每次用序列后向选择法从排序后的各个特征中去除一部分特征,得到各轮筛选后的新的特征集,运用简单交叉验证进行筛选。

11、相比现有技术,本专利技术还具有以下技术效果:

12、本专利技术通过对不同业务领域语料的训练,模型能够准确识别用户咨询的具体业务领域,将训练好的模型和规则引擎集成到聊天机器人中,使其能够在实时对话中准确识别用户的查询意图和相关领域。

本文档来自技高网...

【技术保护点】

1.一种人工智能机器人语言深度理解方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在步骤一中,所述意图与实体理解引擎包括以下步骤:采用意图匹配进行用户意图识别,识别得到对应的文本信息,通过文档预处理模块对文本信息进行中文分词,建立文本分类框架;对文本分类框架内文本信息进行文字抽取,获得文本信息中的实体信息,构建业务语言文本信息和闲聊语言文本信息。

3.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在步骤一中,所述用户输入信息之前,对企业内部不同部门进行收集语料构建语料库,并通过文档预处理模块对语料库进行中文分词和预处理,形成业务分词语料库和闲聊分词语料库。

4.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在步骤三中,通过机器学习模块来训练和优化特征模型,机器学习模块将业务语言文本信息和闲聊语言文本信息中语言文本的数据集提取得到各个特征,依据重要性对各个特征进行排序,每次用序列后向选择法从排序后的各个特征中去除一部分特征,得到各轮筛选后的新的特征集,在所述新的特征集上训练随机森林并计算对应的准确率;根据各轮筛选造成的相对筛选前的误差增量来判断是否要继续筛选,一旦它超过指定阈值就退出迭代,并将上一轮筛选所得的特征集作为结果,反复操作,最终将测试准确率最高的特征集作为特征选择的输出结果。

5.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在机器学习模块在每次用序列后向选择法从排序后的各个特征中去除一部分特征,得到各轮筛选后的新的特征集,运用简单交叉验证进行筛选。

...

【技术特征摘要】

1.一种人工智能机器人语言深度理解方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在步骤一中,所述意图与实体理解引擎包括以下步骤:采用意图匹配进行用户意图识别,识别得到对应的文本信息,通过文档预处理模块对文本信息进行中文分词,建立文本分类框架;对文本分类框架内文本信息进行文字抽取,获得文本信息中的实体信息,构建业务语言文本信息和闲聊语言文本信息。

3.根据权利要求1所述的一种人工智能机器人语言深度理解方法,其特征在于:在步骤一中,所述用户输入信息之前,对企业内部不同部门进行收集语料构建语料库,并通过文档预处理模块对语料库进行中文分词和预处理,形成业务分词语料库和闲聊分词语料库。

4.根据权利要求1所述的一种人工智能机器人语言...

【专利技术属性】
技术研发人员:王继伟牛康婧周柏志
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1