System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 化学信息处理方法、装置、设备和存储介质制造方法及图纸_技高网

化学信息处理方法、装置、设备和存储介质制造方法及图纸

技术编号:43538647 阅读:4 留言:0更新日期:2024-12-03 12:21
本公开实施例涉及一种化学信息处理方法、装置、设备和存储介质。该方法包括:响应于目标交互操作,确定待处理文本,并从待处理文本中确定待处理的第一化学式字符串;确定第一化学式字符串对应的目标化学式名称,作为目标化学文本;目标化学式名称基于第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息而确定;基于目标化学文本和待处理文本中的非化学文本,生成待处理文本对应的自然语言文本,并基于自然语言文本执行目标交互操作对应的文本处理操作。由此,实现了更加快速地将专业的化学相关字符串转换为自然语言文本,降低了对化学信息的理解难度,提升了后续对化学信息进行相关文本处理的效率。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种化学信息处理方法、装置、设备和存储介质


技术介绍

1、现有的文档或网页等中显示的排版的化学信息,往往以专业的化学字符串的形式直接嵌入。但由于化学信息中涉及到化学式、化学方程式、离子等等,其具有较强的专业性。因此,排版显示的化学信息存在不易理解、不易进行相关文本处理(如朗读、搜索、匹配等)的问题。


技术实现思路

1、为了解决上述技术问题,本公开实施例提供了一种化学信息处理方法、装置、设备和存储介质。

2、第一方面,本公开实施例提供了一种化学信息处理方法,该方法包括:

3、响应于目标交互操作,确定待处理文本,并从待处理文本中确定待处理的第一化学式字符串;

4、确定第一化学式字符串对应的目标化学式名称,作为目标化学文本;其中,目标化学式名称基于第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息而确定;解析字符串通过遍历第一化学式字符串对应的语法树而获得;语法树的子节点记录第一化学式字符串中的单位字符串;单位字符串包括化学元素,或者由化学元素、预设脚标标识符和脚标值拼接而成的字符串;

5、基于目标化学文本和待处理文本中的非化学文本,生成待处理文本对应的自然语言文本,并基于自然语言文本执行目标交互操作对应的文本处理操作。

6、第二方面,本公开实施例还提供了一种化学信息处理装置,该装置包括:

7、字符串确定模块,用于响应于目标交互操作,确定待处理文本,并从待处理文本中确定待处理的第一化学式字符串;

8、目标化学文本获取模块,用于确定第一化学式字符串对应的目标化学式名称,作为目标化学文本;其中,目标化学式名称基于第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息而确定;解析字符串通过遍历第一化学式字符串对应的语法树而获得;语法树的子节点记录第一化学式字符串中的单位字符串;单位字符串包括化学元素,或者由化学元素、预设脚标标识符和脚标值拼接而成的字符串;

9、文本处理操作模块,用于基于目标化学文本和待处理文本中的非化学文本,生成待处理文本对应的自然语言文本,并基于自然语言文本执行目标交互操作对应的文本处理操作。

10、第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:

11、处理器;

12、存储器,用于存储可执行指令;

13、其中,处理器用于从存储器中读取可执行指令,并执行可执行指令以实现本公开任意实施例所说明的化学信息处理方法。

14、第四方面,本公开实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开任意实施例所说明的化学信息处理方法。

15、第五方面,本公开实施例还提供了一种计算机程序产品,所述计算机程序产品用于执行本公开任意实施例所说明的化学信息处理方法。

16、本公开实施例的化学信息处理方法、装置、设备和存储介质,能够响应于目标交互操作,确定待处理文本,并从待处理文本中确定待处理的第一化学式字符串;基于第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息,确定第一化学式字符串对应的目标化学式名称,将目标化学式名称作为目标化学文本;其中,解析字符串通过遍历第一化学式字符串对应的语法树而获得;语法树的子节点记录第一化学式字符串中的单位字符串;单位字符串包括化学元素,或者由化学元素、预设脚标标识符和脚标值拼接而成的字符串;基于目标化学文本和待处理文本中的非化学文本,生成待处理文本对应的自然语言文本,并基于自然语言文本执行目标交互操作对应的文本处理操作,实现了更加快速地将目标交互操作对应的待处理文本中专业的化学相关字符串转换为目标化学文本,进而根据目标化学文本生成待处理文本对应的自然语言文本,降低了对化学信息的理解难度,提升了后续执行目标交互操作对应的文本处理操作(如朗读、搜索、匹配、对话等)的效率。

本文档来自技高网...

【技术保护点】

1.一种化学信息处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于目标交互操作,确定待处理文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述响应于目标交互操作,确定待处理文本,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息,确定所述第一化学式字符串对应的目标化学式名称,包括:

5.根据权利要求4所述的方法,其特征在于,所述化学式前缀树通过如下方式预先构建:

6.根据权利要求4所述的方法,其特征在于,所述基于所述解析字符串查询预先构建的化学式前缀树,确定所述第一化学式字符串对应的目标化学式名称,包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述从所述待处理文本中确定待处理的第一化学式字符串,包括:

8.根据权利要求7所述的方法,其特征在于,在所述基于化学信息对应的起止标识符,从所述待处理文本中提取待处理的原始化学字符串之后,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述将所述第一识别结果转换至对应的第一局部文本,包括:

10.根据权利要求7所述的方法,其特征在于,在所述基于化学信息对应的起止标识符,从所述待处理文本中提取待处理的原始化学字符串之后,所述方法还包括:

11.一种化学信息处理装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,当所述计算机程序被处理器执行时,使得处理器实现上述权利要求1-10中任一项所述的化学信息处理方法。

...

【技术特征摘要】

1.一种化学信息处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于目标交互操作,确定待处理文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述响应于目标交互操作,确定待处理文本,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述第一化学式字符串对应的至少一个解析字符串查询预先构建的映射信息,确定所述第一化学式字符串对应的目标化学式名称,包括:

5.根据权利要求4所述的方法,其特征在于,所述化学式前缀树通过如下方式预先构建:

6.根据权利要求4所述的方法,其特征在于,所述基于所述解析字符串查询预先构建的化学式前缀树,确定所述第一化学式字符串对应的目标化学式名称,包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述从所述待处理文...

【专利技术属性】
技术研发人员:崔晓兵龚渝钧
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1