System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 医学机器翻译方法、装置和电子设备制造方法及图纸_技高网

医学机器翻译方法、装置和电子设备制造方法及图纸

技术编号:43779760 阅读:0 留言:0更新日期:2024-12-24 16:16
本发明专利技术属于翻译技术领域。提供了医学机器翻译方法、装置和电子设备。所述方法包括:接收待翻译的医学原文数据,对医学原文数据进行分词处理,并识别其属于目标领域的分词;根据目标领域调取对应的垂直翻译模型,使用垂直模型对对应的分词进行翻译,获得分词译文;将医学原文数据和各分词译文输入通用医学翻译模型,通用医学翻译模型输出医学译文数据;将医学译文数据展示给操作人员。本发明专利技术使用垂直翻译模型对医药领域、医疗器械领域的专业词汇进行准确翻译,同时再使用通用医学翻译模型将原文文本数据转换为流畅、通顺的译文,从而实现了对医学内容的准确翻译,而且可以显著提高通用医学翻译模型的翻译速率。

【技术实现步骤摘要】

本专利技术涉及翻译,具体而言,涉及医学机器翻译方法、装置和电子设备


技术介绍

1、翻译指的是将一种语言翻译成另一种语言的过程。目前市面上已经有多款热门且成熟的翻译软件。但是,医学领域存在较多的专业术语和文档,其与通常接触的领域的差别巨大,现有的通用型翻译软件尚不能做到对医学领域的相关资料的准确翻译,给用户的使用带来诸多不便,而且,如果出现了翻译错误,很有可能会带来严重后果。

2、所以,如何提升对医学领域的资料的准确翻译性,是目前亟需解决的技术问题。


技术实现思路

1、对此,本专利技术提供了一种医学机器翻译方法、装置、电子设备、计算机存储介质及计算机程序产品,以解决上述技术问题。

2、本专利技术提供了一种医学机器翻译方法,所述方法包括如下步骤:接收待翻译的医学原文数据,对所述医学原文数据进行分词处理,并识别其属于目标领域的分词;其中,所述目标领域包括医药领域、医疗器械领域;根据所述目标领域调取对应的垂直翻译模型,使用所述垂直模型对对应的分词进行翻译,获得分词译文;其中,所述垂直翻译模型包括医药领域翻译模型、医疗器械领域翻译模型;将所述医学原文数据和各所述分词译文输入通用医学翻译模型,所述通用医学翻译模型输出医学译文数据;将所述医学译文数据展示给操作人员。

3、在一些实施例中,所述接收待翻译的医学原文数据,包括:接收摄像模组和/或文本输入模组和/或文件输入模组输入的所述医学原文数据。

4、在一些实施例中,所述对所述医学原文数据进行分词处理,并识别其属于目标领域的分词,包括:使用基于双编码器的分词模型对所述医学原文数据进行分词处理,以获得若干分词;其中,所述分词模型包括主编码器和辅助编码器,所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,所述主编码器根据所述粗粒度表示信息确定分词跨度;对各所述分词进行语义分析,并根据语义分析结果与预设的各目标领域的语义含义进行匹配分析,根据匹配分析结果确定其属于的目标领域。

5、在一些实施例中,所述根据匹配分析结果确定其属于的目标领域,包括:根据匹配分析结果确定其属于的目标领域的目标子领域;则所述根据所述目标领域调取对应的垂直翻译模型,包括:根据各所述目标子领域调取对应的垂直翻译模型;以及,所述通用医学翻译模型是基于预训练语言模型构建得到的。

6、在一些实施例中,所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,包括:所述辅助编码器判断输入的所述医学原文数据中是否包含标题内容,若是,则从所述标题内容中提取得出医学专有术语,基于所述医学专有术语预测得出与所述医学原文数据对应的医学词汇单体长度;根据所述医学词汇单体长度确定得出所述粗粒度表示信息。

7、在一些实施例中,所述将所述译文文本数据展示给操作人员,包括:对操作人员的针对该医学原文数据的语言适配能力进行评估,获得语言适配能力等级;若所述语言适配能力等级高于能力等级阈值,则将所述译文文本数据和所述原文文本数据展示页面同时展示给操作人员;若所述语言适配能力等级不高于能力等级阈值,则仅将所述译文文本数据在展示页面展示给操作人员。

8、本专利技术还公开了一种医学机器翻译装置,所述装置包括分词模块、调取模块、翻译模块、输出模块;所述分词模块,用于接收待翻译的医学原文数据,对所述医学原文数据进行分词处理,并识别其属于目标领域的分词;其中,所述目标领域包括医药领域、医疗器械领域;所述调取模块,用于根据所述目标领域调取对应的垂直翻译模型,使用所述垂直模型对对应的分词进行翻译,获得分词译文;其中,所述垂直翻译模型包括医药领域翻译模型、医疗器械领域翻译模型;所述翻译模块,用于将所述医学原文数据和各所述分词译文输入通用医学翻译模型,所述通用医学翻译模型输出医学译文数据;所述输出模块,用于将所述医学译文数据展示给操作人员。

9、本专利技术还提供了一种电子设备,包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现如前任一项所述的方法。

10、本专利技术还提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如前任一所述的方法。

11、本专利技术还提供了一种计算机程序产品,当计算机程序产品被电子设备的处理器运行时,实现如前述实施例所述的方法。

12、本专利技术的有益效果在于:本专利技术将通用医学翻译模型和垂直翻译模型进行了有机结合,使用垂直翻译模型对医药领域、医疗器械领域的专业词汇进行准确翻译,同时再使用通用医学翻译模型将原文文本数据转换为流畅、通顺的译文,从而实现了对医学内容的准确翻译,而且可以显著提高通用医学翻译模型的翻译速率。

本文档来自技高网...

【技术保护点】

1.一种医学机器翻译方法,其特征在于,所述方法包括如下步骤:接收待翻译的医学原文数据,对所述医学原文数据进行分词处理,并识别其属于目标领域的分词;其中,所述目标领域包括医药领域、医疗器械领域;根据所述目标领域调取对应的垂直翻译模型,使用所述垂直模型对对应的分词进行翻译,获得分词译文;其中,所述垂直翻译模型包括医药领域翻译模型、医疗器械领域翻译模型;将所述医学原文数据和各所述分词译文输入通用医学翻译模型,所述通用医学翻译模型输出医学译文数据;将所述医学译文数据展示给操作人员。

2.根据权利要求1所述的一种医学机器翻译方法,其特征在于:接收待翻译的医学原文数据,包括:接收摄像模组和/或文本输入模组和/或文件输入模组输入的所述医学原文数据。

3.根据权利要求2所述的一种医学机器翻译方法,其特征在于:对所述医学原文数据进行分词处理,并识别其属于目标领域的分词,包括:使用基于双编码器的分词模型对所述医学原文数据进行分词处理,以获得若干分词;其中,所述分词模型包括主编码器和辅助编码器,所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,所述主编码器根据所述粗粒度表示信息确定分词跨度;对各所述分词进行语义分析,并根据语义分析结果与预设的各目标领域的语义含义进行匹配分析,根据匹配分析结果确定其属于的目标领域。

4.根据权利要求3所述的一种医学机器翻译方法,其特征在于:根据匹配分析结果确定其属于的目标领域,包括:根据匹配分析结果确定其属于的目标领域的目标子领域;则所述根据所述目标领域调取对应的垂直翻译模型,包括:根据各所述目标子领域调取对应的垂直翻译模型;以及,所述通用医学翻译模型是基于预训练语言模型构建得到的。

5.根据权利要求4所述的一种医学机器翻译方法,其特征在于:所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,包括:所述辅助编码器判断输入的所述医学原文数据中是否包含标题内容,若是,则从所述标题内容中提取得出医学专有术语,基于所述医学专有术语预测得出与所述医学原文数据对应的医学词汇单体长度;根据所述医学词汇单体长度确定得出所述粗粒度表示信息。

6.根据权利要求5所述的一种医学机器翻译方法,其特征在于:所述将所述译文文本数据展示给操作人员,包括:对操作人员的针对该医学原文数据的语言适配能力进行评估,获得语言适配能力等级;若所述语言适配能力等级高于能力等级阈值,则将所述译文文本数据和所述原文文本数据展示页面同时展示给操作人员;若所述语言适配能力等级不高于能力等级阈值,则仅将所述译文文本数据在展示页面展示给操作人员。

7.一种医学机器翻译装置,所述装置包括分词模块、调取模块、翻译模块、输出模块;其特征在于:所述分词模块,用于接收待翻译的医学原文数据,对所述医学原文数据进行分词处理,并识别其属于目标领域的分词;其中,所述目标领域包括医药领域、医疗器械领域;所述调取模块,用于根据所述目标领域调取对应的垂直翻译模型,使用所述垂直模型对对应的分词进行翻译,获得分词译文;其中,所述垂直翻译模型包括医药领域翻译模型、医疗器械领域翻译模型;所述翻译模块,用于将所述医学原文数据和各所述分词译文输入通用医学翻译模型,所述通用医学翻译模型输出医学译文数据;所述输出模块,用于将所述医学译文数据展示给操作人员。

8.一种电子设备,包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序以实现如权利要求1-6任一所述的方法。

9.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行以实现如权利要求1-6任一所述的方法。

10.一种计算机程序产品,包括存储于非暂时性计算机可读介质上的计算机程序,其特征在于:当计算机程序产品被电子设备的处理器运行时,实现如权利要求1-6任一所述的方法。

...

【技术特征摘要】

1.一种医学机器翻译方法,其特征在于,所述方法包括如下步骤:接收待翻译的医学原文数据,对所述医学原文数据进行分词处理,并识别其属于目标领域的分词;其中,所述目标领域包括医药领域、医疗器械领域;根据所述目标领域调取对应的垂直翻译模型,使用所述垂直模型对对应的分词进行翻译,获得分词译文;其中,所述垂直翻译模型包括医药领域翻译模型、医疗器械领域翻译模型;将所述医学原文数据和各所述分词译文输入通用医学翻译模型,所述通用医学翻译模型输出医学译文数据;将所述医学译文数据展示给操作人员。

2.根据权利要求1所述的一种医学机器翻译方法,其特征在于:接收待翻译的医学原文数据,包括:接收摄像模组和/或文本输入模组和/或文件输入模组输入的所述医学原文数据。

3.根据权利要求2所述的一种医学机器翻译方法,其特征在于:对所述医学原文数据进行分词处理,并识别其属于目标领域的分词,包括:使用基于双编码器的分词模型对所述医学原文数据进行分词处理,以获得若干分词;其中,所述分词模型包括主编码器和辅助编码器,所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,所述主编码器根据所述粗粒度表示信息确定分词跨度;对各所述分词进行语义分析,并根据语义分析结果与预设的各目标领域的语义含义进行匹配分析,根据匹配分析结果确定其属于的目标领域。

4.根据权利要求3所述的一种医学机器翻译方法,其特征在于:根据匹配分析结果确定其属于的目标领域,包括:根据匹配分析结果确定其属于的目标领域的目标子领域;则所述根据所述目标领域调取对应的垂直翻译模型,包括:根据各所述目标子领域调取对应的垂直翻译模型;以及,所述通用医学翻译模型是基于预训练语言模型构建得到的。

5.根据权利要求4所述的一种医学机器翻译方法,其特征在于:所述辅助编码器用于为所述主编码器提供关于医学专有术语的粗粒度表示信息,包括:所述辅助编码器判断输入的所述医学原文数据中是否包含标题内容,若...

【专利技术属性】
技术研发人员:宋蒙蒙杨瑞锋林景行傅智勇孙立建
申请(专利权)人:杭州泰雅语言科技有限责任公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1