甲骨易北京语言科技股份有限公司专利技术

甲骨易北京语言科技股份有限公司共有22项专利

  • 本发明属于智能翻译领域,尤其是基于大模型的翻译审校方法,针对现有的,其包括以下步骤以及所属组件:步骤一:读取输入,步骤二:翻译评价,步骤三:翻译修复和整体润色,步骤四:人工检验(可选),组件:大语言模型M;编码器语言模型E;对比高亮器;...
  • 本发明属于人工智能领域,尤其是基于多大模型与AI训练师协同的微调及推荐系统,其包括以下流程:流程一:数据收集,在这个阶段,主要任务是从多个在线闭源大模型中获取输出结果;流程二:初步评估,这是一个人工阶段,AI训练师需要对各个模型的输出进...
  • 本发明具体涉及一种基于大语言模型的多层级译文术语干预方法,该多层级译文术语干预方法包括步骤:用户选择术语库并确定原文列表,调用大语言模型能力,整合术语得到整合后的术语列表,对整合后的术语列表进行多层级术语干预,得到新译文,多层级术语干预...
  • 本发明具体涉及一种基于大语言模型的AI翻译模型选择方法,该基于大语言模型的AI翻译模型选择方法,包括步骤:准备大语言模型;对用户上传的待翻译文档进行解析和文本抽取,得到解析文档;抽取所述解析文档中能代表整体语义特征且长度符合要求的文本作...
  • 本发明具体涉及一种大语言模型生成能力自动化评测系统和方法,该大语言模型生成能力自动化评测系统包括Gmetric计算模块,Gmetric计算模块由Bleu计算模块、Rouge计算模块、Chrf计算模块和Semantic Similarit...
  • 本申请属于文本自动翻译技术领域,公开了基于大语言模型的个性化翻译引擎
  • 本发明公开一种基于词对齐的机器翻译质量检测方法,包括:确定对齐函数与评估函数;利用对齐函数得到各领域的领域平均对齐分数;获取翻译原文与机器译文,基于各领域的双语概率词表,利用对齐函数求解出当前翻译原文与机器译文在各领域内对齐概率;基于各...
  • 本发明公开一种机器翻译痕迹检测方法,包括:获取双语语料数组中各个句对的目标语言文本相对于正向译文数组的相似度,所述目标语言文本相对于往返译文数组的相似度,以及所述往返译文数组与所述正向译文数组的相似度;将获取的三个相似度数值求取平均值作...
  • 本发明具体涉及一种融合规则和序列标注的中文端数字检查方法,该中文端数字检查方法包括:规则方法检测数字,编写规则,以及其对应的错误类别,对待检测文本进行检测,维护结果,遍历文本,对每个句子遍历尝试查找数字串并进行分类,同时判别数字串是否存...
  • 本发明具体涉及一种结合规则和语义的语料对齐方法,该语料对齐方法包括:根据待对齐内容进行分类,分为表格和特征短句、其他常规段落,分别用不同的策略进行自动对齐;抽取表格/特征短句,使用规则对齐策略进行对齐,并判定对齐异常句段;抽取段落文本、...
  • 本发明具体涉及一种基于句法分析和语义计算的中英文术语提取方法,该中英文术语提取方法包括步骤:将长文本拆分为多批固定长度的文本;移除标点、html链接、乱码,将英文小写化,去除停用词;根据术语白名单抽取出术语候选词,直接添加到术语暂存区;...
  • 本发明具体涉及一种翻译项目分发和领取系统,该系统包括任务创建子系统、文档拆分、任务分发和任务领取;项目经理可以对所有的文件按句对进行拆分,将这些任务选择对应的分配模式进行分发;选择接单模式后,可以下发给所有成员,内部人员进行消息通知,外...
  • 本发明具体涉及一种平行语料句子级对齐系统和方法,该系统包括预训练多语种语言表示模型、相似度搜索算法和语种识别工具;该方法包括读取源语言句子和目标语言句段;利用预训练多语种语言表示模型将源语言句段和目标语言句段表示为数学向量;执行批量向量...
  • 本发明具体涉及一种机器翻译模型众包增量学习方法,该方法包括:提供一个有多个机器翻译模型组成的翻译模型阵列,每个翻译模型的介绍和详情;模型所有者可选是否开放众包训练,如开放众包训练,参与者上传参与共同训练的数据后,系统自动对数据进行预处理...
  • 本发明具体涉及一种在线会议同传直播方法和系统,该在线会议同传直播方法,包括步骤:会议启动准备,会议组织者确定会议时间和会议参与者,发言人的语种;启动会议后会议生成信息流通道,所述信息流通道包括会议参与者的公开通道、公开通道的直播通道、各...
  • 本发明具体涉及一种个性化机器翻译训练方法和系统,该个性化机器翻译训练方法,包括步骤:译者上传历史语料;自动对上传后的语料进行预处理;对预处理后的语料进行人工审核;对审核通过后的语料进行模型增量训练;对增量训练后的模型,抽取部分测试集进行...
  • 本发明具体涉及一种全自动语料对齐系统和方法,该全自动语料对齐系统包括预训练英文语言表示模型用于将英文段落或句子文本转化为数学向量,机器翻译模型用于将其他语种文本自动翻译为英文文本,相似度搜索算法模型用于执行批量向量搜索,字符级模糊匹配算...
  • 本发明涉及一种同传联络方法和联络器,该同传联络方法包括步骤:加入会议;修改接力翻译的队列顺序;设置接力同传的循环时间;接力同传的循环时间即将到达时,提前通过振动和声光发起通知到下一位讲话者;讲话者收到通知后,需要执行确认,如果确认接力,...
  • 本发明具体涉及一种计算机辅助翻译系统及方法,该系统包括拆分模块、标注模块、搜索模块和统计模块;其中,拆分模块用于对原文和译文进行拆解;标注模块用于对拆解后的文件进行标注;搜索模块用于对要翻译的句子和数据库中的句子进行对比匹配,对比时根据...
  • 本发明具体涉及一种多人协同影视字幕制作、翻译和压制系统及方法,该系统包括信息获取模块、预处理模块、翻译模块、匹配模块、翻译审校模块、特效模块和压制模块;任务获取模块用于上传视频文件建立视频字幕制作项目,明确任务;预处理模块包括制作字幕模...