System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种生成网络割接大模型的方法、装置及设备制造方法及图纸_技高网

一种生成网络割接大模型的方法、装置及设备制造方法及图纸

技术编号:44353101 阅读:0 留言:0更新日期:2025-02-25 09:37
本发明专利技术提供了一种生成网络割接大模型的方法、装置及设备,所述方法包括:收集割接语料,并对收集到的语料进行相似性语料去重和语义补全清洗后存储为word或者pdf格式的文档;将存储的文档通过人工标注和智能标注结合的方式进行标注,标注结果为input和output的问答对,以json格式输出标注好的样本;将标注好的样本作为专业领域训练样本,从开源标注样本中抽取数据作为通用样本,将专业领域训练样本和通用样本混合后作为最终的训练样本;使用开源大模型作为预训练模型,使用最终的训练样本通过lora方法进行SFT微调,生成割接大模型,再通过构造割接知识提问库和割接大模型回答评分,对本次生成的割接大模型评价。

【技术实现步骤摘要】

本专利技术的实施例一般涉及网络处理,尤其涉及一种生成网络割接大模型方法、装置及设备。


技术介绍

1、在通信网络运维场景中,网络割接是日常的重点工作,割接涉及多种类型网元操作,需要具备很深的积累。割接流程复杂,当前割接脚本生成主要依靠人工写割接指令,操作人员需要非常精通不同设备厂商和型号的指令,完全依赖专家经验,但是由于厂商和型号众多,业务复杂,导致写割接脚本难度很大。

2、另外,目前已经开放的大模型大多数为通用大模型,对割接业务理解不深入,网络割接指令能力差,导致写出的指令不能真实使用,很难做好割接需求的分解和自动执行。

3、因此,我们需要针对网络割接业务,生成网络割接场景的大模型,提升大模型本身对割接知识的理解,为后续割接机器人自动实现端到端割接流程提供强大的大模型底座。


技术实现思路

1、为解决以上问题,本专利技术通过大模型问答实现割接脚本自动生成,割接需求理解,割接配置指令校验等功能,提供端到端的割接大模型生成方案,可作为割接自动执行流程的底座,减少人员参与;使用语料清洗、信息重整、基于业务理解的人工标注和基于文档理解的智能化标注方案,既兼顾业务实用性又兼顾语料的全面性和标注工作的高效性,为快速生成割接大模型的提供了具体可操作流程。

2、根据本专利技术的实施例,提供了一种生成网络割接大模型的方法、装置及设备

3、在本专利技术的第一方面,提供了一种生成网络割接大模型的方法。该方法包括:

4、s01:收集割接语料,并对收集到的语料进行相似性语料去重和语义补全清洗后存储为word或者pdf格式的文档;

5、s02:将存储的文档通过人工标注和智能标注结合的方式进行标注,标注结果为input和output的问答对,以json格式输出标注好的样本;

6、s03:将标注好的样本作为专业领域训练样本,从开源标注样本中抽取数据作为通用样本,将专业领域训练样本和通用样本混合后作为最终的训练样本;

7、s04:使用开源大模型作为预训练模型,使用最终的训练样本通过lora方法进行sft微调,生成割接大模型,再通过构造割接知识提问库和割接大模型回答评分,对本次生成的割接大模型评价。

8、进一步地,s01中所述的割接语料包括:割接工单、割接方案、割接脚本、设备产品手册、配置规范以及网络规划架构。

9、进一步地,s01中所述的相似性语料去重的具体步骤为:将语料按照段落和字数进行分块,并将分块后的语料存储于词向量库中,将每两个割接语料组成对比语料,使用余弦相似度算法对比语料中词向量块的相似性,若相似性超过80%,则保留大的文件,删除小的文件,依次对比所有割接语料的相似性,对全体语料去重。

10、进一步地,s01中所述的语义补全的具体步骤为:

11、对去重后的语料逐行读取,提取其中的图片信息、表格信息、代码信息、文字信息;

12、使用ocr识别接口提取图片信息中的关键词,并通过大模型语义理解ocr识别内容,将ocr识别内容和文档中图片上下500字作为问答内容,提问大模型,理解ocr内容,重新生成对应内容,补齐可能缺失的图像语义关键信息,将关键信息保存到对应位置;

13、读取表格信息,按照行或者列两种方式读取其中信息,并使用大模型理解重新整理信息,将整理后信息保存到对应位置;

14、读取脚本信息,使用分隔符标识出此处为脚本信息。

15、进一步地,s02中所述的人工标注用于对收集的需求工单、割接方案以及割接脚本数据进行标注,分为割接需求类型标注、割接需求关键信息标注以及割接脚本标注;所述的割接需求类型标注是使用需求工单数据,根据割接需求单内容,标注割接工单所属类型;所述的割接需求关键信息标注是根据割接类型,标注此类型所需要的关键信息;所述的割接脚本标注是使用割接方案、割接脚本数据,根据割接类型和关键信息,标注割接生成脚本,给出对应的割接脚本、回退脚本、此类型割接完成所需要的验证信息。

16、进一步地,s02中所述的用于对收集的介绍类文档,规范文件、运维操作手册进行标注,具体步骤为:将文档按照小章节目录进行拆分,对于语料采集与清洗模块标注出脚本的部分,大模型按照此脚本的主要作用以及脚本中每个命令块的含义解释提问;对于其他文字信息的标注,拆分成名词解释、主要功能概括、流程介绍、异常处理方式,与割接流程中所需要的专业知识匹配。

17、进一步地,s03中所述的从开源标注样本中抽样领域样本的10%~50%条数的数据作为通用样本。

18、进一步地,s04中所述的通过构造割接知识提问库和割接大模型回答评分,对本次生成的割接大模型评价的具体步骤为:从割接脚本生成、割接需求理解、割接问题处理、组网规范、组网结构五个方面各构造n个问题和标准答案,用微调后的网络割接大模型回答5*n个问题,给出具体答案,使用word2vec相似性对比正确答案和标准答案的相似性,将每个问题相似性*5*n后相加的结果作为最后的分数。

19、在本专利技术的第二方面,提供了一种生成网络割接大模型的装置。该装置包括:

20、语料收集模块:用于收集割接语料,并对收集到的语料进行相似性语料去重和语义补全清洗后存储为word或者pdf格式的文档;

21、语料标注模块:用于将存储的文档通过人工标注和智能标注结合的方式进行标注,标注结果为input和output的问答对,以json格式输出标注好的样本;

22、样本形成模块:用于将标注好的样本作为专业领域训练样本,从开源标注样本中抽取数据作为通用样本,将专业领域训练样本和通用样本混合后作为最终的训练样本;

23、模型生成模块:用于使用开源大模型作为预训练模型,使用最终的训练样本通过lora方法进行sft微调,生成割接大模型,再通过构造割接知识提问库和割接大模型回答评分,对本次生成的割接大模型评价。

24、在本专利技术的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如根据本专利技术的第一方面的方法。

25、在本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本专利技术的第一方面的方法。

26、以上提及英文缩写释义:

27、input:输入

28、output:输出

29、json:javascript objectnotation,一种轻量级的数据交换格式

30、lora:learnable re-weighting,一种用于神经网络的可学习重加权模型

31、sft:supervised fine-tun-ing,监督微调

32、ocr:optical character recognition,光学字符识别

33、word2vec:一群用来产生词向量的相关本文档来自技高网...

【技术保护点】

1.一种生成网络割接大模型的方法,其特征在于,该方法包括:

2.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S01中所述的割接语料包括:割接工单、割接方案、割接脚本、设备产品手册、配置规范以及网络规划架构。

3.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S01中所述的相似性语料去重的具体步骤为:将语料按照段落和字数进行分块,并将分块后的语料存储于词向量库中,将每两个割接语料组成对比语料,使用余弦相似度算法对比语料中词向量块的相似性,若相似性超过80%,则保留大的文件,删除小的文件,依次对比所有割接语料的相似性,对全体语料去重。

4.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S01中所述的语义补全的具体步骤为:

5.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S02中所述的人工标注用于对收集的需求工单、割接方案以及割接脚本数据进行标注,分为割接需求类型标注、割接需求关键信息标注以及割接脚本标注;所述的割接需求类型标注是使用需求工单数据,根据割接需求单内容,标注割接工单所属类型;所述的割接需求关键信息标注是根据割接类型,标注此类型所需要的关键信息;所述的割接脚本标注是使用割接方案、割接脚本数据,根据割接类型和关键信息,标注割接生成脚本,给出对应的割接脚本、回退脚本、此类型割接完成所需要的验证信息。

6.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S02中所述的用于对收集的介绍类文档,规范文件、运维操作手册进行标注,具体步骤为:将文档按照小章节目录进行拆分,对于语料采集与清洗模块标注出脚本的部分,大模型按照此脚本的主要作用以及脚本中每个命令块的含义解释提问;对于其他文字信息的标注,拆分成名词解释、主要功能概括、流程介绍、异常处理方式,与割接流程中所需要的专业知识匹配。

7.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S03中所述的从开源标注样本中抽样领域样本的10%~50%条数的数据作为通用样本。

8.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,S04中所述的通过构造割接知识提问库和割接大模型回答评分,对本次生成的割接大模型评价的具体步骤为:从割接脚本生成、割接需求理解、割接问题处理、组网规范、组网结构五个方面各构造N个问题和标准答案,用微调后的网络割接大模型回答5*N个问题,给出具体答案,使用word2vec相似性对比正确答案和标准答案的相似性,将每个问题相似性*5*N后相加的结果作为最后的分数。

9.一种生成网络割接大模型的装置,其特征在于,该装置包括:

10.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~8中任一项所述的方法。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~8中任一项所述的方法。

...

【技术特征摘要】

1.一种生成网络割接大模型的方法,其特征在于,该方法包括:

2.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,s01中所述的割接语料包括:割接工单、割接方案、割接脚本、设备产品手册、配置规范以及网络规划架构。

3.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,s01中所述的相似性语料去重的具体步骤为:将语料按照段落和字数进行分块,并将分块后的语料存储于词向量库中,将每两个割接语料组成对比语料,使用余弦相似度算法对比语料中词向量块的相似性,若相似性超过80%,则保留大的文件,删除小的文件,依次对比所有割接语料的相似性,对全体语料去重。

4.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,s01中所述的语义补全的具体步骤为:

5.根据权利要求1所述的一种生成网络割接大模型的方法,其特征在于,s02中所述的人工标注用于对收集的需求工单、割接方案以及割接脚本数据进行标注,分为割接需求类型标注、割接需求关键信息标注以及割接脚本标注;所述的割接需求类型标注是使用需求工单数据,根据割接需求单内容,标注割接工单所属类型;所述的割接需求关键信息标注是根据割接类型,标注此类型所需要的关键信息;所述的割接脚本标注是使用割接方案、割接脚本数据,根据割接类型和关键信息,标注割接生成脚本,给出对应的割接脚本、回退脚本、此类型割接完成所需要的验证信息。

6.根据权利要求1所述的一种生成网络割接大模型的方法,其特征...

【专利技术属性】
技术研发人员:李敏敏
申请(专利权)人:中盈优创资讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1