场外交易指令文本的解析方法、装置和计算机可读介质制造方法及图纸

技术编号:39296293 阅读:10 留言:0更新日期:2023-11-07 11:04
本申请公开一种场外交易指令文本的解析方法、装置和计算机可读介质,其中方法包括:获取输入的场外交易指令的指令文本;对所述指令文本进行分类;利用与所述指令文本所属目标类别相匹配的目标要素提取规则,对所述指令文本进行要素提取处理;基于所述指令文本包含的各个指令要素,生成所述指令文本对应的预设数据格式的结构化文本。本申请通过对场外交易指令文本的分类与关键要素抽取,实现了自动化、智能化的指令文本解析,降低了人工参与程度,并能够提升对场外交易指令文本的解析准确度和效率,通过将本申请在业务中的运用,可以大大提高业务响应速度和准确性,减少信息遗漏,并达到场外衍生品交易过程中降本增效的目标。达到场外衍生品交易过程中降本增效的目标。达到场外衍生品交易过程中降本增效的目标。

【技术实现步骤摘要】
场外交易指令文本的解析方法、装置和计算机可读介质


[0001]本申请属于信息化应用与自然语言处理
,尤其涉及一种场外交易指令文本的解析方法、装置和计算机可读介质。

技术介绍

[0002]在在证券场外衍生品的日常市场交易中,业务人员与外部客户一般通过即时通讯软件(如:企业微信)进行询价交流。
[0003]客户在不同场景下会根据自身特定需求,在交流群中发送不同类型的指令文本。目前,在常规的业务流程中,处理客户指令的业务人员需要先从聊天信息中筛选出携带指令的相关文本信息,进行信息理解与抽取,然后在网厅等界面提交对应的指令信息,并将响应结果回复在群里供客户查看,整个过程需要高度的人工参与。
[0004]随着业务的发展和客户数量的增加,业务人员需要处理的指令信息越来越多,存在处理不及时、处理遗漏、效率低等问题;此外,不同的客户输入的交易指令文本形式千差万别,没有统一规范,这也为文本指令的准确快速处理带来了难度,影响业务响应速度和准确性。
[0005]已知技术中,对于场外交易指令文本的解析处理过程,还可以通过规范化模板或基于知识库的问答机器人等传统文本分析技术来实现,虽然在一定程度上可以提高指令解析的效率,但是需要人工配合的程度较高,智能化水平仍有待改进。
[0006]其中,规范化模板的方法需要由业务人员为每种指令设置标准的模板,由客户根据模板进行指令内容的填写。申请人发现,基于规范化模板的指令解析方法,需要业务人员维护并更新不同的指令模板,同时需要客户高度的配合。虽然在一定程度上可以提高指令解析的效率(客户输入的指令信息已经遵循模板结构,从而指令解析是一个结构化数据处理过程),但仍然存在以下局限:11)维护成本高:随着业务发展和指令类型的增加,维护和更新模板的工作量会不断增加。此外,修改现有模板可能导致对历史数据的影响,增加了维护难度。
[0007]12)灵活性较低:模板方法对指令表达的多样性适应能力有限,对于不按模板规范输入的指令,解析能力和效果会受到影响。
[0008]13)依赖客户配合:客户需要严格按照模板填写指令,对于不熟悉模板规范的客户来说可能不太友好,易导致误操作和误解。
[0009]14)查询效率低:客户单次只能针对特定的模板提交单个指令,无法针对同类型不同参数的问询指令进行批量提交,降低了沟通效率。
[0010]15)无法应对复杂和多样化的自然语言表达:当指令内容涉及多种业务场景、新词汇或复杂语义时,基于规范化模板的方法难以准确解析。
[0011]基于知识库的问答机器人在指令解析方面,依赖于知识库的完整性和准确性,在启动阶段需要业务人员花费大量的精力构建知识库,在运行阶段需要定期维护和更新,同时对于复杂和多样化的自然语言表达的适应能力存在局限。该方法具体存在以下的不足和
问题:21)维护成本高:随着指令类型和业务规则的增加,知识库的维护工作量会不断增加,而且更新和优化知识库的过程易对系统造成影响。
[0012]22)解析准确度受限:对于一些非结构化、多样化或含有复杂语义的指令文本,基于知识库的问答机器人难以准确解析。
[0013]23)查询效率低:对于多指令查询的支持能力不足,对于客户的单次问询,只能一一处理并返回其中一个指令的回答,无法支持多指令的回复。
[0014]24)对新词汇和新表达的适应能力有限:当指令中出现新词汇或新表达时,知识库需要进行及时更新以保持解析准确性,否则会影响解析效果。
[0015]25)易存在匹配错误:由于知识库内容过多或匹配策略失误,易出现匹配错误,导致解析结果不准确。

技术实现思路

[0016]有鉴于此,本申请提供一种场外交易指令文本的解析方法、装置和计算机可读介质,用于通过对场外交易指令文本的分类与关键要素抽取,实现自动化、智能化的指令文本解析,以解决现有技术存在的至少部分技术问题。
[0017]具体方案如下:一种场外交易指令文本的解析方法,包括:获取输入的场外交易指令的指令文本;所述指令文本中的数据为非结构化数据;对所述指令文本进行分类,得到所述指令文本所属的目标类别;利用与所述目标类别相匹配的目标要素提取规则,对所述指令文本进行要素提取处理,得到所述指令文本包含的各个指令要素;其中,不同的指令类别对应配置有不同的要素提取规则;基于所述指令文本包含的各个指令要素,生成所述指令文本对应的预设数据格式的结构化文本。
[0018]可选的,所述获取输入的场外交易指令的指令文本,包括如下至少一种:基于网页在线输入方式,获取在对应的网页页面输入的场外交易指令的指令文本;基于API数据接入方式,获取从预设通讯应用中导出并导入至预设API接口的场外交易指令的指令文本;基于文档输入方式,获取导入至预设的文档批处理接口的场外交易指令的指令文本。
[0019]可选的,所述对所述指令文本进行分类,得到所述指令文本所属的目标类别,包括:利用预设分类模型根据所述指令文本包含的语义特征,识别所述指令文本所包含指令对应的目标业务类别;识别所述目标业务类别所属的目标简易程度类别;所述目标类别包括所述目标业务类别和所述目标简易程度类别。
[0020]可选的,简易程度类别包括简单指令类别、未带产品类型的复杂指令类别和带产
品类型的复杂指令类别;各个简易程度类别分别包含至少一个业务类别;所述简单指令类别下的业务类别包括出金查询、入金查询、出金、入金、暂停、查询;所述未带产品类型的复杂指令类别下的业务类别包括询券、借券、恢复、下单;所述带产品类型的复杂指令类别下的业务类别包括询价。
[0021]可选的,所述利用与所述目标类别相匹配的目标要素提取规则,对所述指令文本进行要素提取处理,包括:根据所述目标业务类别对应的指令要素模板和数据格式,以及所述目标简易程度类别对应的要素识别方式,对所述指令文本进行要素提取处理;其中,所述目标要素提取规则包括所述目标业务类别对应的指令要素模板和数据格式,以及所述目标简易程度类别对应的要素识别方式;每一种业务类别的指令分别配置有对应的指令要素模板和数据格式。
[0022]可选的,所述基于所述指令文本包含的各个指令要素,生成所述指令文本对应的预设数据格式的结构化文本,包括:基于所述指令文本包含的各个指令要素,生成所述指令文本对应的初始结构化文本;对所述初始结构化文本进行纠错校正和规范化处理,得到所述指令文本对应的预设数据格式的结构化文本。
[0023]可选的,所述方法还包括:通过可视化界面进行指令要素模板和/或数据格式的更新,并根据更新后的指令要素模板和/或数据格式,对历史指令文本进行扫描解析,以更新所述历史指令文本的解析结果。
[0024]可选的,所述方法还包括:若所述预设分类模型对所述指令文本的业务类别识别失败,则使用相似句理解模型对所述指令文本进行分类。
[0025]可选的,所述方法还包括:对所述预设分类模型的类别识别结果进行正误确认及确认出识别错误情况下的指令文本类别纠正处理,在确认结果表征所述预设分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场外交易指令文本的解析方法,其特征在于,包括:获取输入的场外交易指令的指令文本;所述指令文本中的数据为非结构化数据;对所述指令文本进行分类,得到所述指令文本所属的目标类别;利用与所述目标类别相匹配的目标要素提取规则,对所述指令文本进行要素提取处理,得到所述指令文本包含的各个指令要素;其中,不同的指令类别对应配置有不同的要素提取规则;基于所述指令文本包含的各个指令要素,生成所述指令文本对应的预设数据格式的结构化文本。2.根据权利要求1所述的方法,其特征在于,所述获取输入的场外交易指令的指令文本,包括如下至少一种:基于网页在线输入方式,获取在对应的网页页面输入的场外交易指令的指令文本;基于API数据接入方式,获取从预设通讯应用中导出并导入至预设API接口的场外交易指令的指令文本;基于文档输入方式,获取导入至预设的文档批处理接口的场外交易指令的指令文本。3.根据权利要求1所述的方法,其特征在于,所述对所述指令文本进行分类,得到所述指令文本所属的目标类别,包括:利用预设分类模型根据所述指令文本包含的语义特征,识别所述指令文本所包含指令对应的目标业务类别;识别所述目标业务类别所属的目标简易程度类别;所述目标类别包括所述目标业务类别和所述目标简易程度类别。4.根据权利要求3所述的方法,其特征在于,简易程度类别包括简单指令类别、未带产品类型的复杂指令类别和带产品类型的复杂指令类别;各个简易程度类别分别包含至少一个业务类别;所述简单指令类别下的业务类别包括出金查询、入金查询、出金、入金、暂停、查询;所述未带产品类型的复杂指令类别下的业务类别包括询券、借券、恢复、下单;所述带产品类型的复杂指令类别下的业务类别包括询价。5.根据权利要求3所述的方法,其特征在于,所述利用与所述目标类别相匹配的目标要素提取规则,对所述指令文本进行要素提取处理,包括:根据所述目标业务类别对应的指令要素模板和数据格式,以及所述目标简易程度类别对应的要素识别方式,对所述指令文本进行要素提取处理;其中,所述目标要素提取规则包括所述目标业务类别对应的指令要素模板和数据格式,以及所述目标简易程度类别对应的要素识别方式;每一种业务类别的指令分别配置有对应的指令要素模板和数据格式。6.根据权利要求1所述的方法,其特征在于,所述基于所述指令文本包含的各个指令要素,生成所述指令文本...

【专利技术属性】
技术研发人员:徐畅泽方兴周玲军张翼飞李然南旭李旭峰王梓夕柔赵宏烨马世超刘晓影李相彬吴凡
申请(专利权)人:中信证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1