System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种少样本关系分类模型的训练方法及相关设备技术_技高网

一种少样本关系分类模型的训练方法及相关设备技术

技术编号:44244458 阅读:2 留言:0更新日期:2025-02-11 13:42
本申请属于人工智能技术领域,涉及一种少样本关系分类模型的训练方法及相关设备,该方法包括:根据清洗业务数据构建业务知识图谱;对业务知识图谱进行数据集划分得到初始训练集、验证集以及测试集;根据初始训练集对原始语言模型进行训练得到预训练语言模型;根据验证集以及测试集构建种子关系r以及种子句子集S<subgt;r</subgt;并输入至句子生成器得到最优候选句子;根据最优候选句子对种子句子集S<subgt;r</subgt;进行扩展得到扩展训练集;并根据扩展训练集对原型网络模型进行模型训练得到目标网络模型。本申请在少样本和零样本情境下有效地进行关系分类,提高了模型的准确性和泛化能力,降低了数据标注成本,适用于电力设计领域的知识图谱构建和信息提取任务。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种少样本关系分类模型的训练方法及相关设备


技术介绍

1、在电力设计领域,构建一个高效、准确的知识图谱是推动行业智能化转型的关键步骤。随着电力系统日益复杂,设计工作中积累了大量包含丰富业务逻辑的文档,如技术规范、标准手册、工程案例等。这些文档承载着电力设计领域的专业知识,但其非结构化的特性使得信息检索和利用效率低下,难以满足现代电力系统对快速决策和精准分析的需求。

2、为了解决这一问题,将非结构化数据转化为结构化知识并构建知识图谱成为研究热点。知识图谱能够以直观的图形形式展示实体之间的关系,不仅便于理解和查询,还能支持高级分析和智能决策。然而,从非结构化文本中自动提取实体和关系,构建高质量的知识图谱并非易事。这不仅要求算法能够理解复杂的电力术语和概念,还必须具备处理多变语境的能力。

3、传统的机器学习方法,如基于规则的方法或深度学习模型,在电力设计领域的知识图谱构建中遇到了挑战。

4、然而,申请人发现,电力设计领域专业性强,知识更新快,导致训练数据稀缺,尤其是在关系分类任务中,往往面临“少样本”问题,即某些关键关系类型的数据量非常有限,这直接影响了模型的泛化能力和预测精度,由此可见,传统的机器学习方法存在泛化能力和预测精度较低的问题。


技术实现思路

1、本申请实施例的目的在于提出一种少样本关系分类模型的训练方法及相关设备,以解决传统的机器学习方法存在泛化能力和预测精度较低的问题。

2、为了解决上述技术问题,本申请实施例提供一种少样本关系分类模型的训练方法,采用了如下所述的技术方案:

3、获取待处理的业务文档;

4、对所述业务文档进行数据清洗操作,得到清洗业务数据;

5、根据所述清洗业务数据构建业务知识图谱;

6、对所述业务知识图谱进行数据集划分,得到初始训练集、验证集以及测试集;

7、调用原始语言模型,并根据所述初始训练集对所述原始语言模型进行语言模型训练操作,得到预训练语言模型;

8、根据所述验证集以及所述测试集构建种子关系r以及种子句子集sr;

9、将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子,其中,所述句子生成器由大语言模型构成;

10、根据所述最优候选句子对所述种子句子集sr进行扩展操作,得到扩展训练集;

11、调用原型网络模型,并根据所述扩展训练集对所述原型网络模型进行网络模型训练操作,得到目标网络模型。

12、进一步的,所述将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤,具体包括下述步骤:

13、将所述种子关系r以及所述种子句子集sr输入至所述句子生成器,得到候选句子集c;

14、根据所述预训练语言模型计算所述种子句子集sr以及所述候选句子集c的相似性评分;

15、根据所述相似性评分对所述候选句子集c进行筛选操作,得到所述最优候选句子。

16、进一步的,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤之后,还包括下述步骤:

17、根据二分类器对所述最优候选句子进行新关系分类操作,得到新关系句子;

18、所述根据所述最优候选句子对所述种子句子集sr进行扩展操作,得到扩展训练集的步骤,具体包括下述步骤:

19、根据所述新关系句子对所述种子句子集sr进行扩展操作,得到所述扩展训练集。

20、进一步的,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器,得到最优候选句子的步骤之后,还包括下述步骤:

21、接收用户终端发送的与所述最优候选句子相对应的反馈信息;

22、根据所述反馈信息对所述句子生成器的策略以及模板进行优化操作。

23、进一步的,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器,得到最优候选句子的步骤之后,还包括下述步骤:

24、根据模型评估算法对所述最优候选句子进行评估操作,得到评估结果,其中,所述评估结果表示为:

25、loss=ρltriple+(1-ρ0le

26、

27、

28、其中,gi表示所述大语言模型生成实例的向量表示,ri表示用来生成新实例的原始实例的向量表示,ai表示锚点样本,pi表示所述大模型生成的正样本,ni表示所述大模型生成的负样本,d表示样本间的距离函数,margin表示距离阈值;

29、若所述评估结果满足预设评估阈值,则确认所述大语言模型可用于生成实例;

30、若所述评估结果不满足所述预设评估阈值,则确认所述大语言模型不可用于生成实例,需要对大语言模型进行参数优化。

31、进一步的,所述调用原型网络模型,并根据所述扩展训练集对所述原型网络模型进行网络模型训练操作,得到目标网络模型的步骤,具体包括下述步骤:

32、根据所述扩展训练集构建所述原型网络模型的输入数据,其中,所述输入数据表示为:

33、

34、其中,表示伪标签,ε表示平滑参数,yi表示原始实体的标签;

35、将所述输入数据输入至所述原型网络模型以训练所述原型网络模型区分关系类型的能力;

36、每当所述大语言模型生成候选句子之后,将所述候选句子构建为所述输入数据并对所述原型网络模型进行模型迭代操作,直至所述大语言模型生成的所有候选句子均完成迭代操作之后,得到所述目标网络模型。

37、为了解决上述技术问题,本申请实施例还提供一种少样本关系分类模型的训练装置,采用了如下所述的技术方案:

38、业务文档获取模块,用于获取待处理的业务文档;

39、数据清洗模块,用于对所述业务文档进行数据清洗操作,得到清洗业务数据;

40、知识图谱构建模块,用于根据所述清洗业务数据构建业务知识图谱;

41、数据集划分模块,用于对所述业务知识图谱进行数据集划分,得到初始训练集、验证集以及测试集;

42、语言模型训练模块,用于调用原始语言模型,并根据所述初始训练集对所述原始语言模型进行语言模型训练操作,得到预训练语言模型;

43、种子构建模块,用于根据所述验证集以及所述测试集构建种子关系r以及种子句子集sr;

44、候选句子生成模块,用于将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子,其中,所述句子生成器由大语言模型构成;

45、扩展模块,用于根据所述最优候选句子对所述种子句子集sr进行扩展操作,得到扩展训练集;

46、网络模型训练模块,用于调用原型网络模型,并根据所述扩展训练集对所述原型网络模型进行网络模型训练操作,得到本文档来自技高网...

【技术保护点】

1.一种少样本关系分类模型的训练方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,所述将所述种子关系r以及所述种子句子集Sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤,具体包括下述步骤:

3.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集Sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤之后,还包括下述步骤:

4.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集Sr输入至句子生成器,得到最优候选句子的步骤之后,还包括下述步骤:

5.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集Sr输入至句子生成器,得到最优候选句子的步骤之后,还包括下述步骤:

6.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,所述调用原型网络模型,并根据所述扩展训练集对所述原型网络模型进行网络模型训练操作,得到目标网络模型的步骤,具体包括下述步骤:

7.一种少样本关系分类模型的训练装置,其特征在于,包括:

8.根据权利要求7所述的少样本关系分类模型的训练装置,其特征在于,所述候选句子生成模块包括:

9.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述的少样本关系分类模型的训练方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至6中任一项所述的少样本关系分类模型的训练方法的步骤。

...

【技术特征摘要】

1.一种少样本关系分类模型的训练方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,所述将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤,具体包括下述步骤:

3.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器进行候选句子生成操作,得到最优候选句子的步骤之后,还包括下述步骤:

4.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器,得到最优候选句子的步骤之后,还包括下述步骤:

5.根据权利要求1所述的少样本关系分类模型的训练方法,其特征在于,在所述将所述种子关系r以及所述种子句子集sr输入至句子生成器,得到最优候选句子...

【专利技术属性】
技术研发人员:冯国平陈志坚杜烨方家良王子彤
申请(专利权)人:中国能源建设集团广东省电力设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1