北京澜舟科技有限公司专利技术

北京澜舟科技有限公司共有47项专利

  • 本发明涉及自然语言处理技术领域,特别涉及一种中文拼写纠错模型的训练方法以及存储介质,本发明提供的中文拼写纠错模型的训练方法,通过获取的拼音语料对原始词表进行扩充,获得拼音组合词表;获取初始大语言模型,并基于拼音组合词表进行初始预训练;构...
  • 本发明涉及人工智能技术领域,特别涉及一种大模型蒸馏方法、装置和存储介质。本发明提供的大模型蒸馏方法构建教师模型和初始学生模型;获取初始指令进行指令复杂化操作得到复杂化指令;将复杂化指令输入教师模型生成答案,基于复杂化指令和答案构建指令‑...
  • 本发明涉及大语言模型幻觉检测领域,特别涉及一种基于大语言模型的幻觉检测方法、系统以及存储介质。本发明通过获取大语言模型、待检测内容以及与所述待检测内容相关的相关文档集;构建与待检测内容中的数字和实体单位对应的多道填空题和多道判断题组成的...
  • 本发明涉及计算机技术领域,特别涉及一种文章大纲生成方法、装置和存储介质。本发明提供的文章大纲生成方法通过获取文章拆分为段落并基于LLM生成包括多个标题的通用大纲,针对段落基于语义相似度从通用大纲中选出初选标题,基于LLM按照语义概括关系...
  • 本发明涉及自然语言处理技术领域,特别涉及一种解答模型的训练方法。本发明提供的一种解答模型的训练方法构建金融知识图谱和金融题目数据集,获取金融题目训练样本,利用金融题目训练样本检索金融知识图谱得到关联信息;利用金融题目训练样本检索金融题目...
  • 本发明涉及
  • 本发明涉及自然语言处理技术领域,特别涉及一种检索增强语言模型的联合训练方法及存储介质,方法包括:构建查询文本并输入至检索模型中检索获得检索文档;将检索文档与查询文本拼接后输入语言模型,生成背景知识;对获得的背景知识进行评分,根据分数,将...
  • 本发明涉及机器翻译技术领域,特别涉及一种机器翻译模型的训练方法及计算机可读存储介质。本发明提供的机器翻译模型的训练方法获取翻译源句和对应的预设目标句;将翻译源句和预设目标句引入预设指令模板形成带指令翻译句对,将多个带指令翻译句对拼接形成...
  • 本发明涉及计算机技术领域,特别涉及一种全自动生成视频会议纪要的方法以及存储介质,本发明提供的全自动生成视频会议纪要的方法,包括以下步骤:对获取的视频会议文本进行主题分割,获得多个段落;提取每个段落的要点,将多个要点根据视频会议文本中的语...
  • 本发明涉及自然语言处理技术领域,特别涉及一种基于强化学习策略的翻译模型构建方法和存储介质,该基于强化学习策略的翻译模型构建方法包括以下步骤:获取翻译样本,翻译样本包括正样本和负样本,并基于正样本和负样本构建排序样本数据;基于排序样本数据...
  • 本发明涉及人工智能技术领域,特别涉及一种基于排序的摘要生成训练方法、系统和存储介质,该基于排序的摘要生成训练方法包括以下步骤:获取训练样本,训练样本包括正样本和负样本,基于正样本和负样本组合构建训练数据;获取打分模型,将训练数据输入打分...
  • 本发明涉及文本生成技术领域,特别涉及一种写作辅助模型构建方法、写作辅助方法及存储介质,一种写作辅助模型构建方法,提供第一模型和第二模型,所述第一模型包括一个解码器与一个编码器,且在该解码器中加入一个学习可控写作能力的Cross
  • 本发明涉及风险预警领域,特别涉及一种证券市场波动预警方法、系统以及存储介质。本发明提供的证券市场波动预警方法,通过负面新闻文本数据对BERT模型进行微调训练;基于上市公司的产业链关系图构建动态图神经网络;获取产业链关系图上多家上市公司分...
  • 本发明涉及自然语言处理技术领域,特别涉及一种基于实体词关系的检索模型训练方法、系统及检索方法,其中,基于实体词关系的检索模型训练方法包括以下步骤:首先从现有资料库中收集实体相关信息,构建实体数据;接着获取初始训练数据,将实体数据转换为模...
  • 本发明涉及机器翻译技术领域,特别涉及一种篇章级机器翻译模型构建方法、系统及存储介质,本发明提供的篇章级机器翻译模型构建方法,包括通过人称代词补全模型对获取的源端文档中的人称代词进行补全;通过训练后的指代消解模型对补全后的人称代词进行指代...
  • 本发明信息检索技术领域,特别涉及一种信息查询方法、系统及存储介质,本发明提供的信息查询方法,包括以下步骤:根据获取的搜索词确定对应的多个第一目标文档;提取每个第一目标文档中与搜索词相关的多个要点及对应的多个段落;进行要点整合,获得多个第...
  • 本发明涉及自然语言处理技术领域,特别涉及多知识图谱问答模型训练方法、系统及存储介质,包括以下步骤:将具有广义链接关系的原始三元组实例化为多个查询图,将查询图基于预设规则改写,得到问题、对应的候选答案及所属话题;基于广义链接构建跨图谱和负...
  • 本发明涉及计算机信息处理技术领域,特别涉及一种金融事件链分析方法和计算机可读存储介质,该金融事件链分析方法先获取源文本,基于源文本获取共指消解结果以得到事件成分;接着获取金融实体列表和扩充版中文停用词库,基于金融实体列表和扩充版中文停用...
  • 本发明涉及自然语言处理技术领域,特别涉及一种预训练语料清洗方法、系统及存储介质,包括以下步骤:获取预设语料库,预设语料库中包括多条语料,基于预设方法对多条语料进行切分,得到多条切分后的语料,将多条切分后的语料进行清洗,得到多条清洗后的切...
  • 本发明涉及文本情感分析技术领域,特别涉及一种指定目标实体的情感分析方法、系统及存储介质。方法包括获取文章和目标实体,对文章进行分句,并将句子分为两类:包含目标实体、不包含目标实体;对不包含目标实体的句子进行句子级情感分析,得到每个句子的...