传神联合北京信息技术有限公司专利技术

传神联合北京信息技术有限公司共有42项专利

  • 本发明提供一种数据库数据同步方法、电子设备、存储介质和程序产品,其中方法包括:确定目标数据库中需要同步的待同步数据;将所述待同步数据发送至目标消息队列中;在监听到所述目标消息队列中存在所述待同步数据后,将所述待同步数据从所述目标消息队列...
  • 本发明提供一种文本分类方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,所述方法包括:将携带有文本标签的文本数据集划分为训练集、验证集和测试集,所述训练集携带的文本标签中包括错误标签;利用所述训练集迭代训练文本分类模型,并基于所...
  • 本发明提供一种字幕编辑方法、装置、电子设备及存储介质,包括:接收用户对目标视频对应的字幕编辑界面的第一输入,字幕编辑界面包括至少一条字幕片段,至少一条字幕片段是基于目标视频的音频信息确定的,第一输入用于根据预设拆分位置拆分至少一条字幕片...
  • 文档中高亮文字保护的方法及装置
    本发明公开了文档中高亮文字保护的方法及装置,属于文档编辑技术领域。该方法包括:当接收到高亮保护指令时,获取待保护文档中每段高亮文字,并保存每段高亮文字与每个保护标记编号之间的对应关系,以及生成与每个所述保护标记编号对应的高亮保护书签,并...
  • 泰语词语识别的方法及装置
    本发明公开了泰语词语识别的方法及装置,属于信息检索技术领域。该方法包括:根据设定步长,对待识别泰语文档进行过滤分割处理,获得包括至少一个切片泰文字符串的切片集合;根据每个切片泰文字符串的信息熵处理参数值,对所述切片集合进行刷选,形成词汇...
  • 泰语术语提取的方法及装置
    本发明公开了泰语术语提取的方法及装置,属于信息检索技术领域。该方法包括:从待处理泰语文档中提取与设定泰语词典中词语匹配的第一泰语词语进行存储,并将提取所述第一泰语词语后的所述待处理泰语文档确定为待识别泰语文档;对所述待识别泰语文档进行信...
  • 原译文定位的方法及装置
    本发明公开了原译文定位的方法及装置,属于翻译技术领域。该方法包括:提取当前待对齐原译文件中第一文件的第一非译元素,以及第二文件的第二非译元素,其中,所述非译元素是在原文文件和译文文件中表达方式一致的文本元素,所述第一文件为原文文件,所述...
  • 原译文匹配的方法及装置
    本发明公开了原译文匹配的方法及装置终端,属于翻译技术领域。该方法包括:将待匹配文件两两配对,获得成对待匹配文件的第一列表;从所述第一列表中,提取每对待匹配文件的非译元素,并根据每个非译元素,确定每对待匹配文件的匹配率,其中,所述非译元素...
  • 本发明公开了一种基于定位信息的翻译方法,通过在行动端侦测定位信息并传送至翻译服务端,以便翻译服务端根据定位信息自地图服务端下载相应的地图信息,以及根据地图信息中的场景名称查询场景例句和场景图像,并且将场景例句和场景图像及下载的地图信息传...
  • 本发明公开了一种基于定位信息的翻译系统,通过在行动端侦测定位信息并传送至翻译服务端,以便翻译服务端根据定位信息自地图服务端下载相应的地图信息,以及根据地图信息中的场景名称查询场景例句和场景图像,并且将场景例句和场景图像及下载的地图信息传...
  • 目标用户对象的确定方法
    一种目标用户对象的确定方法,包括接收待匹配的数据对象;提取所述待匹配的数据对象的文本属性参数;将所述文本属性参数在预置的数据库中进行匹配,所述预置的数据库中包括多个用户对象及每个用户对象相关联的文本属性参数系数;确定所述数据库中与所述待...
  • 本发明公开了一种文档稿件中语句标注的方法,包括:确定源文档及与所述源文档具有映射关系的译稿,扫描出所述源文档中出现的所有语句;根据分析到的每个语句中的词汇参数和语句参数计算出每个语句的属性参数;将所述属性参数值大于预定阈值的语句在所述源...
  • 本发明公开了一种待译文档的预处理方法,包括:统计所述待译文档包括的行业类别属性的数量和所述待译文档的实义词密度;分别判断所述待译文档包括的行业类别属性的数量相对于行业类别属性设定阈值的大小、所述待译文档的实义词密度相对于实义词密度设定阈...
  • 本发明公开了一种自动翻译系统,包括规范文档辅助写作系统和规范文档自动翻译系统,所述规范文档辅助写作系统包括规范词汇库、规范语法规则库和辅助写作模块;所述规范文档自动翻译系统包括自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库。本...
  • 本发明公开了一种语料差异对比方法,包括:编制差异识别规则,所述差异识别规则用于标识出语料原文与待翻译原文的差异;获取历史语料,根据所述差异识别规则对所述历史语料中的原文与待翻译内容进行差异分析;根据所述差异识别规则标识出语料原文与待翻译...
  • 本发明公开了一种规范文档辅助写作系统,规范词汇库用于保存定义的词本身属性;规范语法规则库用于保存定义的适应不同语境的语法规则;辅助写作模块用于接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息...
  • 本发明公开了一种标签保护方法,包括:编制识别规则,所述识别规则用于识别网页内容中包含有标签的一段文本内容;读取文本,根据所述识别规则识别输入文本中的标签;获取所述输入文本中所有标签在文本框内的起始索引和长度,所述起始索引和长度记录有保护...
  • 本发明公开了一种机器翻译检查方法,包括:机器翻译检查,选择需要检查的语料,定义原文的翻译方向;将原文保存到文本文件中,通过机器翻译模块进行翻译,所述机器翻译模块用于根据翻译方向翻译指定文本内容;检查译文和翻译结果,根据句子中词的相似度阀...
  • 本发明提供一种多语文档分离的方法和系统,其主要原理是:对文档字符进行扫描;根据字符属性信息为当前扫描字符确定语种标识;将当前扫描字符的语种标识与需分离语种标识进行比较,并当二者相同时,记录当前扫描字符为句首字符;将扫描到的下一个字符与句...
  • 本发明公开了一种原译文多页面审校方法,包括:定义需要审校的网页原文统一资源定位器列表和译文统一资源定位器列表,所述原文url列表和所述译文url列表一一对应;加载并显示原文和至少一个译文网页的文字内容,在页面加载完成后,给当前页面添加J...