上海流利说信息技术有限公司专利技术

上海流利说信息技术有限公司共有62项专利

  • 文本难度分级及训练方法、装置、电子设备、存储介质,其中,文本难度分级训练方法包括:获取已标注的第一目标文本集,其包含各文本对应的难度真实值的标签数据;对第一目标文本集中的各文本进行预处理,得到第一训练文本集中各文本对应的特征集;根据第一...
  • 一种题目推荐方法及装置、设备和存储介质,方法包括:提供预测模型,用于根据用户的能力值和题目的题目参数预测用户的答对概率;进行多次循环迭代的自适应能力评估处理,直至用户的能力值达到收敛要求,获得用户的实际能力值,自适应能力评估处理包括:定...
  • 一种声学模型构建方法及系统、语音识别方法、设备和存储介质,构建方法包括:获取无标签训练数据和带标签训练数据;构建声学模型,声学模型用于获得音素对应的条件概率;声学模型包括音频表征模型,音频表征模型用于基于输入的语音获得表征矢量;利用训练...
  • 一种语音合成方法及装置、设备以及存储介质,所述语音合成方法包括:提供训练语料,所述训练语料包括说话人信息、语种信息以及文本信息;对所述说话人信息进行特征提取处理,获得说话人特征;对所述语种信息进行语种编码处理,获得语种编码结果;基于对所...
  • 对话管理方法、对话管理系统及设备、存储介质,其中,所述对话管理方法包括:对用户当前输入内容进行语义分析,得到对应的当前用户语义信息;根据当前用户语义信息,从存储的用户的状态信息中获取用户的当前对话状态信息;以及通过查询,从存储的对话资源...
  • 一种训练样本增强方法及装置、设备和存储介质,训练样本增强方法包括:获取训练集,包括多个训练样本,训练样本为第一语言的原始语料;对原始语料进行同义扩充处理,获得与原始语料相对应的新增训练样本,新增训练样本为第一语言的同义语料;将新增训练样...
  • 一种题目推荐方法及装置、设备和存储介质,方法包括:获取当前用户的答题日志、以及根据答题日志所获得的当前用户的掌握度;根据当前用户的掌握度从题库中筛选出候选题目,题库中的每个题目具有近侧发展区间,候选题目为与掌握度相匹配的近侧发展区间所对...
  • 一种文本难度分级评估方法及装置、设备和存储介质,方法包括:获取待分级文本;对待分级文本进行预处理,获取特征集,包括多种与文本粒度相关的特征,特征集中的特征类型至少包括字和词;获取各特征对应的难度评估值,包括字难度值和词难度值;获取待分级...
  • 本说明书实施例提供数据处理方法、数据处理设备及计算机存储介质,其中,所述数据处理方法包括:获取原始文本、所述原始文本相应的翻译评测标签序列和所述原始文本相应的目标文本;基于所述原始文本,获取与所述目标文本的语言种类相同的参考翻译集合,所...
  • 本说明书实施例提供了文本评分方法、文本评分模型、文本评分设备及存储介质,其中,所述文本评分方法包括:将输入文本按照预设的划分粒度进行划分,得到多个文本片段;基于各所述文本片段,进行数据编码,得到相应的片段编码数据;基于所述输入文本,进行...
  • 本说明书实施例提供了文本评分方法、文本评分模型、文本评分设备及存储介质,其中,文本评分方法包括:将输入文本按照预设的划分粒度进行划分,得到多个文本片段;分别对各所述文本片段进行数据编码,得到相应的片段编码数据;基于多个所述片段编码数据,...
  • 一种语音识别处理方法及系统、设备以及存储介质,所述语音识别处理方法包括:获取语音数据;对所述语音数据进行解码处理,获得当前词对应的中间识别结果;从获得所述中间识别结果时起停顿时长为第一预设时长时,判断需要产生第一语音端点;从获得所述中间...
  • 本说明书实施例提供了文本处理方法、文本处理设备及计算机可读存储介质,其中,文本处理方法包括:对输入的初始文本进行检查,确定错误文字以及所述错误文字的上下文段落;基于所述错误文字及所述错误文字的上下文段落,确定融合特征数据;基于所述错误文...
  • 一种翻译评测训练数据的生成方法及装置、设备和存储介质,方法包括:获取待翻译的样本原始语句;获取样本原始语句相对应的样本翻译语句;获取样本原始语句相对应的参考翻译集合,包括多个参考翻译语句;选取与样本翻译语句相似度最高的参考翻译语句作为样...
  • 本说明书实施例提供模型评估方法、模型评估系统、数据处理设备及存储介质,其中,所述模型评估方法包括:获取评估样本集,其中,所述评估样本集包括:多个评估文本和相应的多个参考分数;基于当前的文本评分模型,对各所述评估文本进行分数预测,得到相应...
  • 一种口语评测方法及装置、设备以及存储介质,口语评测方法包括:获取待评测的语音数据及参考文本;基于参考文本构建第一解码网络;基于声学模型和第一解码网络,对语音数据进行第一解码处理,获得参考文本中的各个参考音素对应的时间边界信息;基于时间边...
  • 语料生成方法、装置、电子设备及存储介质,其中,所述语料生成方法包括:获取目标语言类型的第一语料;将所述第一语料输入已训练好的翻译模型阵列进行翻译,得到多个翻译结果;其中,所述翻译模型阵列包括将所述第一语料翻译为其他语言类型语料的翻译模型...
  • 语句推断方法及训练方法、装置、电子设备及存储介质,其中,语句推断的训练方法,包括:将第一训练语料集和第二训练语料集输入第一神经网络模型,对其进行训练,得到第一语句推断初始模型;将第二训练语料集输入至第二神经网络模型,对其进行训练,得到第...
  • 文本断句方法及训练方法、装置、电子设备、存储介质,所述文本断句的训练方法包括:分别获取包含断句信息的第一训练语料和未包含断句信息的第二训练语料;对所述第二训练语料添加断句信息,得到第三训练语料;分别对所述第一训练语料和所述第三训练语料添...
  • 语法纠错方法及训练方法、装置、电子设备、存储介质,其中,训练方法包括:分别获取包含标注信息的第一训练语料集和第二单语语料集,其中,标注信息用于表征所述第一训练语料集中各训练语料的语法错误对,语法错误对包括错误形式的源片段和与错误形式的源...