基于行业语言模型生成自然语言推荐制造技术

技术编号：26428888 阅读：20 留言：0更新日期：2020-11-20 14:27

本发明专利技术提供了用于基于行业语言模型生成自然语言推荐的系统、方法和计算机可读介质。从第一计算设备接收包括多个自然语言输入单元的输入数据并将其传输到第二计算设备。第二计算设备可使用被训练为生成对应于能源勘探词汇的输出的预测模型来确定包括多个自然语言输出的输出。第二计算设备可向第一计算设备提供该输出以用于显示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于行业语言模型生成自然语言推荐相关申请的交叉引用本申请根据35U.S.C.§119要求于2018年1月26日提交的名称为“GeneratingNaturalLanguageRecommendationsBasedonanIndustrialLanguageModel”的美国临时申请No.62/622,693的优先权，该临时申请据此全文以引用方式明确地并入本文。
技术介绍
自然语言包括人类用来交流关于话题、对象、任务或环境的字母、字词、句子、短语或它们的组合。领域专用的自然语言包括人类用于在特定领域或行业(诸如油气领域或能源勘探行业)的情境中描述主题、对象、任务或环境的自然语言字母、字词、句子、短语或它们的组合的子集。向领域专用的应用程序提供输入的用户可能对提供输入时可使用的领域专用的自然语言具有有限的知识。因此，应用程序可能提供相对于用户正尝试执行的特定输入或任务在情境上不相关的输出，但其可与所接收的输入弱相关。此类限制可能降低与应用程序交互的用户的知识传输、任务完成和通信质量。机器学习是人工智能的应用，其通过使用从数据迭代地学习模式而没有数据模式的明确指示的算法来自动化分析模型的开发。机器学习通常用于模式识别、计算机视觉、语言处理和光学字符识别，并且使得能够构建能够从数据准确地学习以预测模型输出的算法，从而作出数据驱动的预测或决策。机器学习可用于开发能够生成与特定行业或领域相关联的领域专用的自然语言的行业语言模型。
技术实现思路
在一个方面，提供了用于基于行业语言模型生成自然语言推荐的方法。...

【技术保护点】
1.一种方法，所述方法包括：/n接收提供给包括数据处理器的第一计算设备的输入，所述输入包括多个自然语言输入单元；/n将所述输入传输到包括数据处理器的第二计算设备，所述传输由所述第一计算设备通过网络执行；/n由所述第二计算设备确定输出，所述输出是使用所传输的输入和被训练为接收自然语言输入单元的预测模型来确定的，并且所述预测模型响应于所述接收而生成对应于能源勘探词汇的输出，所述输出包括被预测为对应于所述输入并且被包括在所述能源勘探词汇中的多个自然语言输出单元；以及/n由所述第二计算设备将所述输出传输到所述第一计算设备，所述传输使得所述第一计算设备提供所述输出以用于显示。/n

【技术特征摘要】
【国外来华专利技术】20180126 US 62/622,6931.一种方法，所述方法包括：
接收提供给包括数据处理器的第一计算设备的输入，所述输入包括多个自然语言输入单元；
将所述输入传输到包括数据处理器的第二计算设备，所述传输由所述第一计算设备通过网络执行；
由所述第二计算设备确定输出，所述输出是使用所传输的输入和被训练为接收自然语言输入单元的预测模型来确定的，并且所述预测模型响应于所述接收而生成对应于能源勘探词汇的输出，所述输出包括被预测为对应于所述输入并且被包括在所述能源勘探词汇中的多个自然语言输出单元；以及
由所述第二计算设备将所述输出传输到所述第一计算设备，所述传输使得所述第一计算设备提供所述输出以用于显示。

2.根据权利要求1所述的方法，还包括第二预测模型，所述第二预测模型被训练为基于第二输入确定第二输出，所述第二输出包括不同的多个自然语言输出单元。

3.根据权利要求1所述的方法，其中所述多个自然语言输入单元包括字词、字词的一部分、字符、字符序列、数字或数字序列。

4.根据权利要求1所述的方法，其中所述预测模型已被训练为基于在机器学习过程的训练阶段中接收自然语言输入单元作为到字词嵌入模型的训练输入数据来确定对应于所述能源勘探词汇的所述输入中的字词的分布，所述预测模型在所述机器学习过程的所述训练阶段中被训练。

5.根据权利要求1所述的方法，其中所述预测模型已被训练为基于在机器学习过程的训练阶段中接收自然语言输入单元作为到文本分类模型的训练输入数据来将所述输入分类到与所述能源勘探词汇相关联的一个或多个类别中，所述预测模型在所述机器学习过程的所述训练阶段中被训练。

6.根据权利要求1所述的方法，其中所述预测模型已被训练为接收所述输入，并且基于在机器学习过程的训练阶段中接收自然语言输入单元作为到文本生成模型的训练输入数据来自动生成作为包括所述能源勘探词汇中所包括的所述多个自然语言输出单元的短语和句子的输出，所述预测模型在所述机器学习过程的所述训练阶段中被训练。

7.根据权利要求6所述的方法，其中所述预测模型已被训练为在机器学习过程的训练阶段中使用一个或多个文本排序算法基于用户偏好对所述自动生成的输出进行排序，所述预测模型在所述机器学习过程的所述训练阶段中被训练。

8.根据权利要求1所述的方法，其中所述第一计算设备包括基于领域的自动建议和拼写校正界面，所述基于领域的自动建议和拼写校正界面被配置为接收所述输入并提供所述输出以用于显示，所述输出基于字词嵌入模型和语言模型来确定。

9.根据权利要求1所述的方法，其中所述第一计算设备包括情境感知推荐代理，所述情境感知推荐代理被配置为接收所述输入并提供所述输出以用于显示，所述输出基于一个或多个文本排序算法来确定。

10.根据权利要求1所述的方法，其中所述第一计算设备包括领域专用的语义搜索界面，所述领域专用的语义搜索界面被配置为接收所述输入并提供所述输出以用于显示，所述输出基于字词嵌入模型和语言模型来确定。

11.根据权利要求1所述的方法，其中所述第一计算设备包括基于内容的文本生成界面，所述基于内容的文本生成界面被配置为接收所述输入并提供所述输出以用于显示，所述输出基于文本生成模型来确定。

12.根据权利要求1所述的方法，其中所述输出包括一个或多个输出单元，所述一个或多个输出单元需要另外的输入以使得执行被配置在所述第一计算设备和/或所述第二计算设备上的能够执行的内容。

13.一种系统，所述系统包括：
第一计算设备，所述第一计算设备包括数据处理器并且被配置为接收和传输输入；和
第二计算设备，所述第二计算设备经由网络耦接到所述第一计算设备，所述第二计算设备包括处理器以及存储计算机可读指令和多个预测模型的存储器，所述处理器被配置为执行所述计算机可读指令，所述计算机可读指令在被执行时使得所述处理器执行操作，所述操作包括：
接收从所述第一计算设备传输的所述输入，所述输入包括多个自然...

【专利技术属性】
技术研发人员：朱璇，阿伦·卡尔提·苏布拉曼尼亚，赵海明，郑杰旭，
申请(专利权)人：威盖特技术美国有限合伙人公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人