System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及运维知识问答,具体地,涉及一种基于query增强技术的运维知识库问答系统及方法。
技术介绍
1、在运维工作中,运维人员经常需要从知识库中查询解决方案来处理各种问题。然而,现有的运维知识库在回答用户查询时,往往存在准确率不高的问题,这主要是因为用户输入的查询语句query可能不够准确、全面,或者知识库的查询算法不够智能,无法准确理解用户的需求并返回最相关的答案。
技术实现思路
1、针对现有技术中存在的问题,本专利技术提供了一种基于query增强技术的运维知识库问答系统及方法,提高了运维知识库问答系统输出回答的准确率,从而有效提升运维管理的效率。
2、为实现上述技术目的,本专利技术采用如下技术方案:一种基于query增强技术的运维知识库问答系统,包括:query增强模块、特征提取模块、向量数据库模块、精排模块;
3、所述向量数据库模块用于实时更新存储上传的运维文档片段;
4、所述query增强模块根据向量数据库模块中的运维文档片段对用户输入问题中的关键字进行扩充增强,获得更多与所述用户输入问题相关的运维文档片段;
5、所述特征提取模块用于将所有与所述用户输入问题相关的运维文档片段进行词语切分;
6、所述精排模块用于根据排序算法将切分的词语与存储在向量数据库模块中运维文档片段进行匹配,并将匹配的运维文档片段按照匹配程度的高低顺序进行排序,作为用户输入问题的回答,反馈给用户。
7、进一步地,所述query
8、所述同义词扩展策略用于查找用户输入问题中关键字的同义词并添加到用户输入问题中;
9、所述相关词推荐策略根据用户输入问题中关键词与向量数据库模块中运维文档片段的关联关系,推荐与关键词相关的词汇,添加到用户输入问题中;
10、所述上下文信息融合策略通过考虑用户查询向量数据库模块中运维文档片段的上下文,将相关信息添加到用户输入问题中。
11、进一步地,所述特征提取模块采用n-gram分析方法将所有与所述用户输入问题相关的运维文档片段切分成若干词语组合。
12、进一步地,还包括:数据处理结构化切分模块;所述数据处理结构化切分模块对用户上传的各种运维文档按照标题层级进行分割,并保留标题对应文本的上下文和结构信息,同时,通过运维文档结构化拆解算法保留运维文档整体上下文和文本内部句子与短语之间的关系。
13、进一步地,将经数据处理结构化切分模块切分的运维文档片段通过特征提取模块进行特征提取后,使用embedding模型对切分的运维文档片段进行向量化处理,存储于向量数据库模块中。
14、进一步地,还包括:存量知识库模块和语料拼接模块;
15、所述存量知识库模块对用户输入问题在存量知识库中进行检索,获得与用户输入问题相关的运维文档内容;
16、所述语料拼接模块用于将从存量知识库模块中获得的与用户输入问题相关的运维文档内容与精排模块中用户输入问题的回答进行prompt拼接,更新用户输入问题的回答,反馈给用户。
17、进一步地,所述存量知识库模块对用户输入问题在存量知识库中进行检索,获得与用户输入问题相关的运维文档内容的具体过程为:使用ner模型对用户输入问题进行实体查询,提取所述用户输入问题的关键字,将关键字按照语义类别进行分类,并将关键字转换为结构化数据,调用存量知识库模块的检索接口,从存量知识库中匹配出与用户输入问题相关的运维文档内容。
18、进一步地,所述用户输入问题的请求格式为xml格式或json格式,且支持jsonp跨域访问。
19、进一步地,本专利技术还提供了一种所述的基于query增强技术的运维知识库问答系统的问答方法,具体包括如下步骤:
20、步骤s1、用户上传的运维文档通过数据处理结构化切分模块进行切分,将切分后的运维文档片段通过特征提取模块进行词语切分,并使用embedding模型将切分后的运维文档片段进行向量化处理,存储于向量数据库模块中;
21、步骤s2、query增强模块对用户输入问题进行扩充增强,获得更多与所述用户输入问题相关的运维文档片段;
22、步骤s3、所述特征提取模块用于将所有与所述用户输入问题相关的运维文档片段进行词语切分;
23、步骤s4、精排模块将切分的词语与存储在向量数据库模块中运维文档片段进行匹配,并将匹配的运维文档片段按照匹配程度的高低顺序进行排序,作为用户输入问题的回答,反馈给用户。
24、进一步地,若存在存量知识库模块,使用ner模型对用户输入问题进行实体查询,提取所述用户输入问题的关键字,将关键字按照语义类别进行分类,并将关键字转换为结构化数据,调用存量知识库模块的检索接口,从存量知识库模块中匹配出与用户输入问题相关的运维文档内容,通过语料拼接模块将从存量知识库中获得的与用户输入问题相关的运维文档内容与精排模块输出的用户输入问题的回答进行prompt拼接,更新用户输入问题的回答,反馈给用户。
25、与现有技术相比,本专利技术具有如下有益效果:本专利技术基于query增强技术的运维知识库问答系统及方法通过query增强模块对用户输入问题进行分析和增强处理,自动补充用户输入问题的上下文信息以及用户输入问题中关键字的同义词,从而使得运维知识库问答系统的回答能够更加准确地匹配用户输入的问题,更好地理解用户的真实需求,从而提高问答的准确性;同时,query增强模块还能够通过语义分析和关联规则从向量数据库模块中的运维文档片段中挖掘与用户输入问题中关键字相关的隐藏知识和关联信息,帮助用户发现一些之前可能未被注意到的问题解决方案或经验教训,从而拓宽知识视野,提高运维效率;此外,向量数据库模块用于实时更新存储上传的运维文档片段,从而保证向量数据库模块能够提供最新、最有效的信息,使得query增强模块在进行用户输入问题增强时,能够根据最新的向量数据库模块中的运维文档片段进行扩充增强,保证该运维知识库问答系统具有很强的适应性。
本文档来自技高网...【技术保护点】
1.一种基于Query增强技术的运维知识库问答系统,其特征在于,包括:Query增强模块、特征提取模块、向量数据库模块、精排模块;
2.根据权利要求1所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,所述Query增强模块用于对用户输入的问题进行扩充增强的策略包括:同义词扩展策略、相关词推荐策略、上下文信息融合策略;
3.根据权利要求2所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,所述特征提取模块采用N-gram分析方法将所有与所述用户输入问题相关的运维文档片段切分成若干词语组合。
4.根据权利要求3所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,还包括:数据处理结构化切分模块;所述数据处理结构化切分模块对用户上传的各种运维文档按照标题层级进行分割,并保留标题对应文本的上下文和结构信息,同时,通过运维文档结构化拆解算法保留运维文档整体上下文和文本内部句子与短语之间的关系。
5.根据权利要求4所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,将经数据处理结构化切分模
6.根据权利要求5所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,还包括:存量知识库模块和语料拼接模块;
7.根据权利要求6所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,所述存量知识库模块对用户输入问题在存量知识库中进行检索,获得与用户输入问题相关的运维文档内容的具体过程为:使用NER模型对用户输入问题进行实体查询,提取所述用户输入问题的关键字,将关键字按照语义类别进行分类,并将关键字转换为结构化数据,调用存量知识库模块的检索接口,从存量知识库中匹配出与用户输入问题相关的运维文档内容。
8.根据权利要求1所述的一种基于Query增强技术的运维知识库问答系统,其特征在于,所述用户输入问题的请求格式为xml格式或json格式,且支持jsonp跨域访问。
9.一种权利要求1-8任一项所述的基于Query增强技术的运维知识库问答系统的问答方法,其特征在于,具体包括如下步骤:
10.根据权利要求9所述的基于Query增强技术的运维知识库问答系统的问答方法,其特征在于,若存在存量知识库模块,使用NER模型对用户输入问题进行实体查询,提取所述用户输入问题的关键字,将关键字按照语义类别进行分类,并将关键字转换为结构化数据,调用存量知识库模块的检索接口,从存量知识库模块中匹配出与用户输入问题相关的运维文档内容,通过语料拼接模块将从存量知识库中获得的与用户输入问题相关的运维文档内容与精排模块输出的用户输入问题的回答进行Prompt拼接,更新用户输入问题的回答,反馈给用户。
...【技术特征摘要】
1.一种基于query增强技术的运维知识库问答系统,其特征在于,包括:query增强模块、特征提取模块、向量数据库模块、精排模块;
2.根据权利要求1所述的一种基于query增强技术的运维知识库问答系统,其特征在于,所述query增强模块用于对用户输入的问题进行扩充增强的策略包括:同义词扩展策略、相关词推荐策略、上下文信息融合策略;
3.根据权利要求2所述的一种基于query增强技术的运维知识库问答系统,其特征在于,所述特征提取模块采用n-gram分析方法将所有与所述用户输入问题相关的运维文档片段切分成若干词语组合。
4.根据权利要求3所述的一种基于query增强技术的运维知识库问答系统,其特征在于,还包括:数据处理结构化切分模块;所述数据处理结构化切分模块对用户上传的各种运维文档按照标题层级进行分割,并保留标题对应文本的上下文和结构信息,同时,通过运维文档结构化拆解算法保留运维文档整体上下文和文本内部句子与短语之间的关系。
5.根据权利要求4所述的一种基于query增强技术的运维知识库问答系统,其特征在于,将经数据处理结构化切分模块切分的运维文档片段通过特征提取模块进行特征提取后,使用embedding模型对切分的运维文档片段进行向量化处理,存储于向量数据库模块中。
6.根据权利要求5所述的一种基于query增强技术的运维知识库问答系统,其特征在于,还包括:存量知识库模块...
【专利技术属性】
技术研发人员:顾黄亮,
申请(专利权)人:南银法巴消费金融有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。