基于语义理解的加工委托信息提取方法和装置制造方法及图纸

技术编号:31508288 阅读:16 留言:0更新日期:2021-12-22 23:42
本申请涉及一种基于语义理解的加工委托信息提取方法和装置,该方法包括:接收加工委托信息;根据加工类型识别模型识别所述加工委托信息中的加工类型;基于所述加工类型,确定对应的信息抽取问题模板;以及根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。通过本申请提出的基于语义理解的加工委托信息提取方案,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。提升工作效率。提升工作效率。

【技术实现步骤摘要】
基于语义理解的加工委托信息提取方法和装置


[0001]本申请涉及人工智能技术应用领域,尤其涉及一种基于语义理解的加工委托信息提取方法和装置。

技术介绍

[0002]目前,电商平台客户有委托加工需求时,例如钢铁电商平台客户有钢卷剪切委托加工需求时,通常在平台上填写委托单,将成品信息和加工要求以一段话来描述说明,委托单下到加工厂,需要专业人员人工提取加工要素信息,才能进行下一步生产加工流程。
[0003]由于客户输入表述习惯各不相同,采用常规的规则和模板匹配方法经常会因词义表述的变化而失效,无法自适应,难以有效提取所需的加工要素信息,也就无法进一步做后续的自动排刀、自动算价等智能化运营。
[0004]从而,迫切希望实现加工委托信息的自动提取,以满足智能化运营和服务的发展需要。

技术实现思路

[0005]针对现有技术中存在的问题,本申请提供了一种基于语义理解的加工委托信息提取方案,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。
[0006]根据本申请的第一个方面,提供一种基于语义理解的加工委托信息提取方法,其包括:
[0007]接收加工委托信息;
[0008]根据加工类型识别模型识别所述加工委托信息中的加工类型;
[0009]基于所述加工类型,确定对应的信息抽取问题模板;以及
[0010]根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
[0011]根据本申请的第二个方面,提供一种基于语义理解的加工委托信息提取装置,其包括:
[0012]接收单元,用于接收加工委托信息;
[0013]加工类型识别单元,用于根据加工类型识别模型识别所述加工委托信息中的加工类型;
[0014]信息抽取问题模板确定单元,用于基于所述加工类型,确定对应的信息抽取问题模板;以及
[0015]加工要素信息提取单元,用于根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
[0016]根据本专利技术的第三个方面,提供一种电子设备,包括:
[0017]处理器;以及
[0018]存储器,存储有计算机指令,当所述计算机指令被所述处理器执行时,使得所述处理器执行第一方面所述的方法。
[0019]根据本专利技术的第四个方面,提供一种非瞬时性计算机存储介质,存储有计算机程序,当所述计算机程序被多个处理器执行时,使得所述处理器执行第一方面所述的方法。
[0020]根据本申请提成的基于语义理解的加工委托信息提取方案,至少带来如下好处:
[0021](1)采用机器语义理解方法提取加工要素信息,解决了规则和模板匹配方法无法适应不同客户表述方式、提取加工要素信息困难的问题。
[0022](2)规则和模板匹配方法需要人工分析和维护规则、模板,效率低下,泛化能力弱,无法自适应;而本申请采用的方法,能够通过新增样本,重新训练学习,不断提升模型效果。
[0023](3)通过机器识别和理解,并抽取所需的加工要素信息,实现自动化转换为符合加工厂要求的结构化信息,人工只需做审核,从而降低人工转换成本,提升工作效率。
附图说明
[0024]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图,而并不超出本申请要求保护的范围。
[0025]图1是基于语义理解的加工委托信息提取方案的流程示意图。
[0026]图2是基于语义理解的加工委托信息提取方法的流程图。
[0027]图3是基于语义理解的加工委托信息提取装置的示意图。
[0028]图4是本专利技术提供的一种电子设备的结构图。
具体实施方式
[0029]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0030]图1是基于语义理解的加工委托信息提取方案的流程示意图。如图1所示,在加工委托信息提取方案中,首先获取客户的加工委托信息说明,例如,加工委托信息说明为“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”。在获取加工委托信息后,应用加工类型识别模型,识别客户委托的加工类型。在该加工委托信息说明中,被模型识别的加工类型为“纵切”。
[0031]然后,根据识别出的加工类型,确定对应的信息抽取问题模板。针对不同加工类型,事先预置了需要抽取加工要素的问题模板。例如,针对纵切、横切和先纵切后横切的三种加工类型,分别预置了需要抽取加工要素的三种问题模板。由于在该实施例中识别到“纵切”加工类型,则会启用对应纵切类型的抽取加工要素的问题模板,比如纵切需要抽取分条宽度、分条数量,对应问题分别为“分条加工宽度是多少?”、“分条数量是多少?”,其他要素以此类推。
[0032]之后,根据问题模板,应用加工要素信息抽取模型,抽取加工委托信息种的加工要素信息。如果将“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”作为段落文档、“分条加工宽度是多少?”作为问题、答案数量=n(表示多个,不唯一)、答案边界阈值=0.9输入到加工要素信息抽取模型中,加工要素信息抽取模型输出答案为列表[61mm,100mm,47mm]。同理,当问题为“分条数量是多少?”时,加工要素信息抽取模型输出分条数量列表[14,2,2]。
[0033]最后,对模型抽取出的加工要素信息,进行后处理。通过上面的步骤,已经可以抽取加工要素信息。但是,因为抽取出的加工要素信息是一个个分立的,实际使用时需要配对,比如每个分条宽度和分条数量之间的配对,另外还可能存在出现单位不同等问题,所以需要做后处理;后处理的作用就是经过匹配和修正,使得输出符合实际使用要求。从而,针对模型输出得到的分条宽度列表、分条数量列表按顺序匹配原则匹配,并进行正则规则检验修正,得到匹配结果[(61mm,14),(100mm,2),(47mm,2)]。在后处理后,输出最终的结构化加工要素信息。将所有需要提取的加工要素提取并经后处理的结果,整理成结构化数据输出给下游任务。其他要素的提取方法类似,例如宽度公差、长度公差、对角线、单包件重等要素本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语义理解的加工委托信息提取方法,其包括:接收加工委托信息;根据加工类型识别模型识别所述加工委托信息中的加工类型;基于所述加工类型,确定对应的信息抽取问题模板;以及根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。2.如权利要求1所述的方法,还包括:对预加工类型识别模型进行神经网络训练,得到所述加工类型识别模型,以及对预加工要素信息抽取模型进行神经网络训练,得到所述加工要素信息抽取模型。3.如权利要求2所述的方法,其中,所述对预加工类型识别模型进行神经网络训练包括:(a1)将标注好的分类样本集拆分为训练集、验证集和测试集;(b1)将所述训练集中的训练样本输入预加工类型识别模型进行神经网络训练,经所述预加工类型识别模型前向推理计算输出每个训练样本属于各个加工类型的概率分布以及预测类标签,并计算训练集上的损失;(c1)通过所述验证集计算所述预加工类型识别模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工类型识别模型的参数;(d1)经反向传播优化调整所述预加工类型识别模型的网络参数;(e1)重复步骤(b1)、步骤(c1)和步骤(d1),响应于所述当前历史最小损失在连续第一设定次数没有更新或达到设定的训练次数,停止对所述预加工类型识别模型的训练;(f1)通过所述测试集测试所述预加工类型识别模型的加工类型分类准确率;(g1)响应于所述加工类型分类准确率满足第一预设阈值,将所测试后的预加工类型识别模型确定为所述加工类型识别模型。4.如权利要求2所述的方法,其中,所述对预加工要素信息抽取模型进行神经网络训练包括:(a2)将标注好的加工要素信息抽取标注样本集拆分为训练集、验证集和测试集;(b2)通过所述训练集中的训练样本对所述预加工要素信息抽取模型进行神经网络训练,前向计算得到所述训练集的段落文档中每个词被分类为答案开始位置的概率和答案结束位置的概率;(c2)根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本对应的答案,并计算训练集上的损失;(d2)通过所述验证集计算所述预加工要素信息抽取模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工要素信息抽取模型的参数;(e2)经反向传播优化调整所述预加工要素信息抽取模型的网络参数;(f2)重复步骤(b2)、步骤(c2)、步骤(d2)和步骤(e2),响应于所述当前历...

【专利技术属性】
技术研发人员:邹晓峰朱彭生杨镜意丁启州
申请(专利权)人:欧冶云商股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1