System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机数据处理,尤其涉及一种云平台运维的问答的技术。
技术介绍
1、云平台运维是一个技术密集且快速发展的领域。云平台运维人员不仅需要掌握云计算的核心技术,如虚拟化、自动化部署、云服务管理等,同时需要对网络、安全、存储和数据库等多个
有深入的了解,还需要具备处理复杂系统问题和突发事件的能力,以及丰富的实战经验。然而,云平台运维行业也不可避免的面临着专业技术发展迅速和行业内人才流动性大的问题。这导致企业的云平台运维团队经常面临人员变动大、新旧人员交替的情况,企业需要不断投入资源进行人才培养和专业知识技能培训。
2、企业可收录、整理与企业自己的和/或第三方公开的历史云平台运维数据,构建云平台运维数据库,其中,数据可覆盖云平台的各个领域,例如,linux、容器、中间件等,不仅包括日常运维任务的记录,还涉及特定情况下的专业问题及其解决方案。
3、如何利用历史云平台运维数据,提升企业运维人员的专业技能,以及提高企业云平台运维效率,是本申请要解决的技术问题。
技术实现思路
1、本专利技术的目的是提供一种云平台运维的问答方法、装置及设备,用以至少部分解决如何利用历史云平台运维数据,提升企业运维人员的专业技能,以及提高企业云平台运维效率的技术问题。
2、根据本专利技术的一个方面,提供了一种云平台运维的问答方法,其特征在于,所述方法包括:
3、将获取的关于云平台运维的文本提问信息进行向量化处理,得到提问信息向量数据;
4、
5、计算所述若干个向量数据中的每个向量数据与所述提问信息向量数据的相关性得分,并根据相关性得分进行排序,确定相关性得分最高的预设数量个向量数据,以及从预设云平台运维数据文本集中获取所述预设数量个向量数据对应的预设数量个云平台运维文本数据;
6、将所述预设数量个云平台运维文本数据与所述文本提问信息输入微调训练后的大模型,得到与所述文本提问信息对应的答案。
7、可选地,其中,所述云平台运维数据向量集的构建包括:
8、获取若干个历史云平台运维文本数据;
9、对每个历史云平台运维文本数据进行向量化处理,得到每个历史云平台运维文本数据对应的主题向量数据、概要向量数据和正文向量数据;
10、将所有主题向量数据、概要向量数据和正文向量数据组成集合,构建云平台运维数据向量集。
11、可选地,其中,所述对每个历史云平台运维文本数据进行向量化处理,得到每个历史云平台运维文本数据对应的主题向量数据、概要向量数据和正文向量数据,包括:
12、确定每个历史云平台运维文本数据对应的主题文本数据、概要文本数据和正文文本数据;
13、分别对所述主题文本数据、概要文本数据和正文文本数据进行向量化处理,得到每个历史云平台运维文本数据对应的主题向量数据、概要向量数据和正文向量数据。
14、可选地,其中,所述云平台运维数据向量集包括:
15、主题向量数据子集、概要向量数据子集、正文向量数据子集,其中,所述主题向量数据子集包括所有历史云平台运维文本数据对应的主题向量数据,所述概要向量数据子集包括组成所有历史云平台运维文本数据对应的概要向量数据,所述正文向量数据子集包括所有历史云平台运维文本数据对应的正文向量数据;其中,
16、所述确定相似度值满足预设阈值的若干个向量数据,包括:
17、基于预设分级检索策略,依次遍历检索所述主题向量数据子集、概要向量数据子集和正文向量数据子集,确定相似度值满足预设阈值的若干个向量数据。
18、可选地,其中,所述云平台运维数据文本集的构建包括:
19、将所述若干个历史云平台运维文本数据组成集合,构建云平台运维数据文本集。
20、可选地,其中,所述微调训练后的大模型的微调训练包括:
21、确定每个历史云平台运维文本数据对应的第一文本数据和第二文本数据,其中,第一文本数据包括所述历史云平台运维文本数据对应的问题文本、参考文本、随机干扰文本和答案文本,第二文本数据包括所述历史云平台运维文本数据对应的问题文本、随机干扰文本和答案文本;
22、将所有第一文本数据、第二文本数据组成集合,构建大模型微调数据集;
23、基于所述大模型微调数据集,采用llama-factory对大模型进行微调训练,得到微调训练后的大模型。
24、可选地,其中,若关于云平台运维的提问信息是非文本格式,则在进行向量化处理之前,所述方法还包括:
25、将获取的关于云平台运维的非文本格式的提问信息转换成文本提问信息。
26、根据本专利技术的另一个方面,提供了一种云平台运维的问答装置,其中,所述装置包括:
27、第一模块,用于将获取的关于云平台运维的文本提问信息进行向量化处理,得到提问信息向量数据;
28、第二模块,用于计算所述提问信息向量数据与预设云平台运维数据向量集中的每个向量数据的相似度,并根据每个向量数据的相似度值,确定相似度值满足预设阈值的若干个向量数据;
29、第三模块,用于计算所述若干个向量数据中的每个向量数据与所述提问信息向量数据的相关性得分,并根据相关性得分进行排序,确定相关性得分最高的预设数量个向量数据,以及从预设云平台运维数据文本集中获取所述预设数量个向量数据对应的预设数量个云平台运维文本数据;
30、第四模块,用于将所述预设数量个云平台运维文本数据与所述文本提问信息输入微调训练后的大模型,得到与所述文本提问信息对应的答案。
31、与现有技术相比,本专利技术提供了一种云平台运维的问答方法、装置及设备。其方法包括:将获取的关于云平台运维的文本提问信息进行向量化处理,得到提问信息向量数据;计算所述提问信息向量数据与预设云平台运维数据向量集中的每个向量数据的相似度,并根据每个向量数据的相似度值,确定相似度值满足预设阈值的若干个向量数据;计算所述若干个向量数据中的每个向量数据与所述提问信息向量数据的相关性得分,并根据相关性得分进行排序,确定相关性得分最高的预设数量个向量数据,以及从预设云平台运维数据文本集中获取所述预设数量个向量数据对应的预设数量个云平台运维文本数据;将所述预设数量个云平台运维文本数据与所述文本提问信息输入微调训练后的大模型,得到与所述文本提问信息对应的答案。
32、本专利技术可带来的技术效果:
33、提供了一种云平台运维的问答方法、装置及设备,可根据用户提出的云平台运维的问题智能提供准确、专业的答案。
本文档来自技高网...【技术保护点】
1.一种云平台运维的问答方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述云平台运维数据向量集的构建包括:
3.根据权利要求2所述的方法,其特征在于,所述对每个历史云平台运维文本数据进行向量化处理,得到每个历史云平台运维文本数据对应的主题向量数据、概要向量数据和正文向量数据,包括:
4.根据权利要求2所述的方法,其特征在于,所述云平台运维数据向量集包括:
5.根据权利要求2所述的方法,其特征在于,所述云平台运维数据文本集的构建包括:
6.根据权利要求5所述的方法,其特征在于,所述微调训练后的大模型的微调训练包括:
7.根据权利要求1所述的方法,其特征在于,若关于云平台运维的提问信息是非文本格式,则在进行向量化处理之前,所述方法还包括:
8.一种云平台运维的问答装置,其特征在于,所述装置包括:
9.一种计算机可读介质,其特征在于,
10.一种云平台运维的问答设备,其特征在于,所述设备包括:
【技术特征摘要】
1.一种云平台运维的问答方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述云平台运维数据向量集的构建包括:
3.根据权利要求2所述的方法,其特征在于,所述对每个历史云平台运维文本数据进行向量化处理,得到每个历史云平台运维文本数据对应的主题向量数据、概要向量数据和正文向量数据,包括:
4.根据权利要求2所述的方法,其特征在于,所述云平台运维数据向量集包括:
5.根据权利要求2所述的方法,其...
【专利技术属性】
技术研发人员:付娆,张炯,饶司君,葛翔,贾雪丽,殷金亮,
申请(专利权)人:上海星图比特信息技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。